產經情報

字級設定：
大
中
小
收藏
.
.

抽象語言具象化　AI可望投入創作應用

日期：2022-08-10

在20世紀AI研究未能達成的目標，分析人類語言中抽象與曖昧部份的涵義，於2010年代中期因大數據與AI學習的應用，獲得突破，這不僅創造聊天機器人(AI Chatbot)市場，2021年起，若干企業據此提出更複雜的應用，繪圖與製作動畫。

繪畫用AI相當早，至少2016年日本便有自動上色AI，讓通常以黑白為主的日本漫畫，自動變成歐美市場主流的彩色漫畫，但因為日本黑白漫畫以網點或套書線條代替色彩的表現，已有內部定義，並非曖昧或漠然的上色，也不是無中生有的作畫，並不是抽象語言的具象化。

真正要說抽象語言具象化，主要範例是美國IT大廠Google在2022年5月展示的對話AI、BERT衍生應用之一，使用者用英語對麥克風說：以油畫風格畫出頭戴牛仔帽、身穿紅襯衫、在庭院中彈吉他的大貓熊，AI就會畫出如同指定的圖片。

同樣可以分析抽象語言，然後具象化的另一種AI，則是源自微軟(Microsoft)日本分公司的新創，Rinna，該公司的AI則是以日語輸入，比方說把日本京都移到北極，就能畫出日本水墨畫風格的浴雪京都圖；更抽象一點，畫出VR世界，也能出現日本科幻漫畫風格的奇特世界圖樣。

作為對話機器人的Rinna，過去不僅擔任櫃台小姐，以及在即時通訊軟體上與人聊天，還學會說話不著邊際的占卜，甚至也研究過成為創作歌手，現在追加畫圖能力，可能很快就會獲得商業藝術創造能力。

這種聊天機器人繪畫應用，或可說始於美國研發新創Open AI的GPT-3，該廠在2021年5月推出GPT-3修改應用，能依對話指示自動修改照片，比方給1張猴子照片，要求戴上可笑的帽子，AI就會自動從網路上找帽子圖片加入；半導體大廠NVIDIA也推出類似應用，可以把隨手畫的草圖轉化成高解析度照片。

最新的進展，中國大陸清華大學在2022年6月公開的研究成果，中文說出要獅子飲水的動畫，就會自動畫出32張圖片、轉化成4秒的動畫，從繪圖進一步發展成影片製作。