草根影響力新視野(琪拉編譯)

藝術家即便沒有親眼見過,他們也可以畫出一個想像中擬人化,穿著芭蕾舞裙的白蘿蔔,牽著一隻狗走路。這種抽象想像的技能,對人類很容易,對電腦卻不容易。不過,新的人工智慧技術,已經證明電腦有能力自己辦到這件事,畫出精確而且可愛的白蘿蔔牽小狗散步。

專職於AI研究的非營利組織OpenAI這禮拜公布,他們的DALL-E電腦,只要經由指令,就可以創作出傑出,甚至有點超現實的藝術創作。像是[有著酪梨外觀的椅子],或是[在陽光下坐著休息的一隻水豚]。而DALL-E這個名字,就是結合超現實主義畫家達利與卡通WALL-E的合稱。

過去AI已經有聽從指令畫畫的能力,畫得效果並不好。但是DALL-E創作出的作品卻精確、複雜、清楚。這告訴我們,人工智慧已經有能力聽從更複雜的指令,甚至將來可以幫助人類修圖或是創造更多未來人類日常生活需要的設計,像是家具或是車子。

DALLE-E的原型是GPT-3,過去GPT-3被訓練從數億份的文件中被訓練,有能力自己創作文章、新詩,或是新聞稿。而DALL-E則被訓練可以從無數的畫作與相關的文字中自己做比較,創造出人類腦中真正思考出的畫面。而OpenAI也研發了另一個人工智慧CLIP,來決定哪個作品是最好的。

JMOY1656

研發DALL-E的首席工程師也自己很驚訝,發現DALL-E有能力把兩個毫無相關的概念結合起來,把他們巧妙的融合在一起,創作出有功能的產品。像是酪梨形狀的椅子,甚至自己擬人化,把一株陽光下曬太陽的蔬菜加了人類的鬍子。

經由指令改變,DALL-E可以更改創作的原型,像是把酪梨形狀的椅子變成[魔術方塊形狀的時鐘],或是設計出各式各樣不同類型、不同年代的作品,像是一個八十年代風格的時鐘、一個人腦的立體切面圖,或是一個洋紅色洋芋形狀的刺青。

不過,現在DALL-E仍有其限制,顯然它們還無法接受太複雜,一個圖樣中有太多東西的指令,對於他不熟悉的物品,他也沒法畫得很精確,甚至有點奇怪。也有可能因為DALL-E是經由網路上的資訊所訓練,所以網路上資訊越少的東西,他也樂不熟悉。像是要它畫一隻[穿著睡衣的蝦子]、[放風箏],結果就沒那麼理想。

資料來源:https://edition.cnn.com