對於大多數商家來說,發放問卷並蒐集使用者對產品的意見,算是最直接取得消費者回饋的方式。然而,要是連這件看似只有真人才有辦法承擔的任務,居然能夠被 AI 完美還原呢?
根據日前發表的一篇全新論文,科學家提出一種突破性方法,能夠讓大型語言模型(LLM)極其精準地模擬人類消費行為,這項發展不僅可能重塑價值數十億美元的市場研究產業,更有望創造出大量的「虛擬消費者」,替企業和商家提供有效的產品回饋資料。
根據論文說法,這些由 AI 模型所創造出來的虛擬消費者,不僅能夠提供真實的產品評分,還能解釋評分背後的原因,其規模與速度更是當前所有市場調查方案所無法比擬。
透過語意對比,判斷顧客評價
多年來,企業一直想用 AI 技術協助進行市場研究,卻始終卡在一項根本性問題,那就是當要求 LLM 對產品直接給出 1 到 5 分的數字評價時,其結果往往不夠真實且分佈不均。
為了解決上述瓶頸,由研究員 Benjamin F. Maier 所領導的國際團隊,提出了一種名為「語意相似度評分」(Semantic Similarity Rating, SSR)的巧妙方法。
根據論文內容,全新的 SSR 方法並不要求 AI 模型直接給出數字,而是先引導模型針對產品,提出一段詳盡的文字意見;接著,系統會將這段文字轉換為數值向量(嵌入,embedding),並計算其與一系列「預先定義的參考陳述」之間的相似度。
舉例來說,當讀取到「我絕對會買,這就是我要的產品!」這類文字回覆時,系統會將其進行語意分析,並認定該評論較「1 分」的參考陳述,更接近「5 分」,藉此提高整體評分的可信度。
雖然只是簡單的語意比對方法,但創造出來的成果卻相當驚人。根據研究團隊採用一家大型個人護理企業的真實數據,包含 57 項產品調查及 9,300 筆真人回覆進行測試、對比的結果,全新 SSR 方法達到了人工重測可信度的 90%。
不僅如此,由 AI 所產生的評價分佈,在統計方面幾乎跟真人無法區分。對此研究團隊指出,SSR 不僅保留了傳統調查的指標與可詮釋性,更讓大規模的消費者研究模擬成為可能。
AI 市場調查技術的「轉守為攻」
綜觀來看,SSR 方法的誕生時機,可謂來得正是時候,因為傳統線上問卷的真實性,正日漸受到 AI 制式化評論的威脅。
根據史丹佛商學研究所 2024 年的分析指出,越來越多人類受訪者使用聊天機器人來生成採訪回覆,然而,這些由 AI 產生的答案,卻被發現過於正面與冗長,且缺乏真人回饋中常見的「尖酸刻薄」,甚至失去足夠真實性,進而引發「資料同質化」的嚴重問題,掩蓋掉產品本身應該要被暴露出來的缺點。
Benjamin F. Maier 等人的研究提供了一條截然不同的改進路線,那就是與其費力清除被 AI 評論所污染的數據,不如從頭開始,在一個受控的環境中,直接生成高擬真度的合成數據,然後提供給商家進行參考。
業界分析師評論,SSR 方法或可以被視為市場調查業者,從「防守」轉為「進攻」的策略轉變;史丹佛的論文反映出不受控的 AI 如何污染人類資料集,而新論文則展示了受控 AI 如何創造出有序且實用的自有數據。
不只事後分析,更要預先洞察
研究團隊在論文中指出,SSR 方法的有效性,關鍵在於文字嵌入本身的品質,藉此抓出不同評論之間差異,判斷消費者購買意願高低的細微差別。因此,未來企業若想廣泛採用 SSR,首先得讓底層 AI 模型生成看似合理的文本,接著再以穩定且有意義的方式,將文本對應到評價分數。
此外,SSR 方法的通用性,亦遠超過往的同類型技術,畢竟過去的研究大多集中在使用文字嵌入技術,例如透過 BERT 等 AI 模型,分析真人評論可能為商品給出的評價分數。
至於 SSR 方法卻是從「分析現有數據」,邁向「生成全新的預測性洞察」,讓企業在產品上市之前,就能先讓「虛擬消費者」體驗產品,取得近似真人的評價,藉此讓商家於市場上掌握先機。
節省費用、時間,AI 顛覆傳統市調
對於企業而言,SSR 方法的發展潛力極其深遠。首先,企業將有能力快速建立目標客群的「數位分身」,在數小時內測試產品概念、廣告文案或包裝設計,從而大幅加速創新週期。
其次,由 AI 所產生的大量「虛擬消費者」,在受訪時還能提供商品評分背後的理由,給出實質性的回饋,為商品的後續開發與改進,帶來可規模化且易於解讀的數據寶庫。
除了速度和規模,SSR 方法所帶來的經濟效益也相當可觀。傳統上,一次全國性產品的上市前問卷調查,可能會耗費企業數萬美元成本,以及至少數週時間。
然而,基於 SSR 方法的 AI 模擬,僅需一小部分的時間和成本,就能提供有效的市場洞察,企業甚至可以根據結果,立即實施各種反覆測試,這種優勢對於產品生命周期較短,市場競爭激烈的消費品產業而言,可能會成為致勝關鍵。
當「虛擬化市場訪談」投入商業應用
當然,全新的 SSR 方法依舊有其限制,由於經過驗證的領域不夠多,因此其在複雜的 B2B 採購、奢侈品,或者擁有特定文化背景的產品上,SSR 究竟表現如何仍然是個未知數。
另一方面,雖然研究團隊所發表的論文,證明 SSR 方法能夠重現群體行為,但它並無法預測個人選擇,所以對於個人化行銷等應用來說顯然不夠實用。
儘管 SSR 方法的技術限制十分明確,但這項研究仍是市場調查領域中,最為重要的分水嶺;畢竟,它提供了至今最為有力的證據,證明「虛擬化的市場訪談」已經準備好投入商業應用。
即便傳統真人市調的時代,還不會因為 AI 與 SSR 技術的出現而終結,只是相關企業確實應該思考,自己能否比競爭對手更快掌握這項技術,在新時代下取得領先的競爭優勢。
本圖/文由「Techorange科技報橘」授權刊登,非經同意不得任意轉載。
原文出處:【加速決策】市場還沒問,AI 已給答案:AI 市調出與真人回饋 90% 一致的市場反應