產經情報

抽象語言具象化 AI可望投入創作應用

日期:2022-08-10

在20世紀AI研究未能達成的目標,分析人類語言中抽象與曖昧部份的涵義,於2010年代中期因大數據與AI學習的應用,獲得突破,這不僅創造聊天機器人(AI Chatbot)市場,2021年起,若干企業據此提出更複雜的應用,繪圖與製作動畫。

繪畫用AI相當早,至少2016年日本便有自動上色AI,讓通常以黑白為主的日本漫畫,自動變成歐美市場主流的彩色漫畫,但因為日本黑白漫畫以網點或套書線條代替色彩的表現,已有內部定義,並非曖昧或漠然的上色,也不是無中生有的作畫,並不是抽象語言的具象化。

真正要說抽象語言具象化,主要範例是美國IT大廠Google在2022年5月展示的對話AI、BERT衍生應用之一,使用者用英語對麥克風說:以油畫風格畫出頭戴牛仔帽、身穿紅襯衫、在庭院中彈吉他的大貓熊,AI就會畫出如同指定的圖片。

同樣可以分析抽象語言,然後具象化的另一種AI,則是源自微軟(Microsoft)日本分公司的新創,Rinna,該公司的AI則是以日語輸入,比方說把日本京都移到北極,就能畫出日本水墨畫風格的浴雪京都圖;更抽象一點,畫出VR世界,也能出現日本科幻漫畫風格的奇特世界圖樣。

作為對話機器人的Rinna,過去不僅擔任櫃台小姐,以及在即時通訊軟體上與人聊天,還學會說話不著邊際的占卜,甚至也研究過成為創作歌手,現在追加畫圖能力,可能很快就會獲得商業藝術創造能力。

這種聊天機器人繪畫應用,或可說始於美國研發新創Open AI的GPT-3,該廠在2021年5月推出GPT-3修改應用,能依對話指示自動修改照片,比方給1張猴子照片,要求戴上可笑的帽子,AI就會自動從網路上找帽子圖片加入;半導體大廠NVIDIA也推出類似應用,可以把隨手畫的草圖轉化成高解析度照片。

最新的進展,中國大陸清華大學在2022年6月公開的研究成果,中文說出要獅子飲水的動畫,就會自動畫出32張圖片、轉化成4秒的動畫,從繪圖進一步發展成影片製作。