草根影響力新視野 法蘭瓷編譯 

ChatGPT到底有多厲害? 蒙大拿大學一項最新研究顯示,ChatGPT可以與全世界最具創造力頂端1%的人類思想家相媲美。

研究團隊針對 ChatGPT 引擎進行了陶倫斯創造性思維測驗  (TTCT,一種常用的創造力測驗方式),並記錄了ChatGPT的 8 個回覆。研究人員還收集了 24 名蒙大拿大學學生的回覆,並將ChatGPT及24名學生的分數與全美 2,700 名參加 TTCT 的學生進行比較。所有答案均由學術測試服務機構評分,評分人員並不知道其中含有ChatGPT的答案。

比較結果發現,A.I.的反應與參加測試的最有創造力人類的反應一樣有高度創意,事實上,ChatGPT 的表現甚至優於全美大多數的學生。研究作者、蒙大拿大學商學院Erik Guzik 助理臨床教授表示,這些發現令人感到驚訝,他說:「我認為創造力就是以不同的方式做事,而我喜歡創業的定義之一是,成為一名企業家就是要以不同的方式思考。因此,A.I.可以幫助我們將創造性思維的世界應用到商業和創新過程中。」

聊 業務 技術 插圖 電腦 概念 數字 通訊 網站 機器人 因特網 捲筒紙 標誌 現代 公司 支持 新 在線 高科技 服務 設備 情報 顧客 屏幕 虛擬 發言 發育 信息 談話 對話 符號 人造的 軟件 方便 智能 助理 信息 幫助 聊天的 開
圖片取自:(示意圖123rf)

陶倫斯創造性思維測驗的評估包含兩種:文字以及圖形,兩種都可衡量發散性思維或產生創意的思維過程。在文字評估之中,向受測者提供圖片和/或文字提示,並要求受測者以書面形式做出回應。例如,他們可能會看到一個事件的圖片並被要求假設結果,或者他們可能會看到一個產品並詢問改進這個產品的方法。他們的答案用於評估三個心理特徵:

  1. 流暢度:相關想法的數量
  2. 原創性:想法的不尋常性
  3. 靈活性:各種不同類型的想法

圖形評估則是要求受測者畫出答案,例如,可能被要求完成一張圖片。除了圖片的流暢性和原創性之外,圖形測試的評估還包括:

  1. 精制度:添加超出最低要求的想法
  2. 反對過早結束:能夠容忍模糊性進而做出創造性的回應
  3. 標題的抽象性:具有創意地為圖形命名的能力

研究發現,ChatGPT 的回答在流暢性和原創性方面都處於最高百分位,但在靈活性方面的反應分數則是稍後跌至 97%。研究人員對於ChatGPT的回應感到新穎且驚訝,並認為ChatGPT將成為創新的先驅。

Reference

ChatGPT can match the top 1% of creative human thinkers, says new study