聊天機器人總是「不懂裝懂」？因為它有幻覺、它不是故意的

當你在使用 ChatGPT 或是其他由生成式 AI 所驅動的聊天機器人時，可以感覺到好像真的在和他「聊天」。對答流利、文法正確、甚至還帶有一點節奏感，他們是怎麼辦到的？

他們只是個機器人，並不像人類有自己的思想和情感，所以這些看似流利的對話，其實都是被「訓練」出來的。

OpenAI 的 ChatGPT 等其他聊天機器人都是建立在大型語言模型上，透過大量閱讀網路上的公開資訊，或是經過許可的第三方資訊來源獲得的文本數據集進行訓練；再根據文本上下文常出現的單字，去推測接下來最有可能出現的單字，以及之後接續出現的單字，一步一步的拼湊出答案。

舉例來說，在訓練模型的初期，工程師會先讓模型自行完成句子：他沒有向左轉，而是轉向 __——這個時候模型可能會利用隨機但不準確的答案回應訊息；但經過閱讀更多的資訊進行訓練之後，它可以更理解這句話的意思，並且推測出「右邊」或是「後面」這種答案，所以完整的句子就會是：他沒有向左轉，而是轉向右邊。

除了系統自行訓練之外，聊天機器人也可以進一步接受人類的訓練，以防止錯誤的訊息出現。例如你可以跟聊天機器人說：這是錯誤訊息。這樣系統就可以自行修正錯誤答案，防止再度出現。除了用戶可以給予反饋之外，官方也會有工程師進行提示的修正，這就是提示工程師的工作範圍。

基於這樣的運作原理，聊天機器人似乎無論如何都會生出一個答案。所以當系統遇到不知道答案的問題時，它不會說不知道，反而還會給出一些似是而非的答案。這些答案只是系統的猜測，但它也不會跟你說它是用猜的，而是用肯定的語氣呈現，這種狀況稱之為「幻覺（Hallucination）」。

OpenAI 當然也知道這種狀況，並針對幻覺進行研究。在 2023 年 5 月 31 日的一篇研究文章中指出，他們可能找到了一種方法，可以更符合邏輯，避免幻覺的狀況發生。

OpenAI 利用「監督過程」的方法訓練了一個能夠解決複雜數學問題的模型，而不是之前使用的「監督結果」——「監督過程」是指針對每個單獨的推論步驟提供反饋，一步一步引導模型解出正確的答案；而原本的模型只有針對結果進行反饋，機器人比較容易出現「裝懂」的狀況。

但 OpenAI 也提到，目前只在數學問題中測試這個模型，還不清楚在其他的領域表現如何。如果監督過程可以被廣泛應用，將可以有效提升系統的效率和準確性。

Most Popular Tags