【最大的敵人是自己】誰能令AI崩潰？人工智能生成的內容可以！

用魔法打敗魔法。

當前位置：首頁 » A-Journal » 消息與故事 » 【最大的敵人是自己】誰能令AI崩潰？人工智能生成的內容可以！

自從生成式人工智能 (AI) 大行其道，社會各界開始憂慮大型語言模型 (LLMs) 會否比全世界最聰明的人更聰明，最終為人類帶來無窮無盡的災難，以致AI成為人類最後一個發明。這種想法並非杞人憂天。與傳統AI不同，生成式AI學習了人類語言、編程語言、藝術、化學、生物學等多種複雜的主題，可以像不同領域的精英般重複使用訓練資料創造新的內容和想法，以更短的時間、更高的質量完成任務，勝過大部分的普通人。很多人自然會擔心，就算AI最終不會運用其強大的能力直接消滅人類，也足以在職場上替代大量勞工，打碎了千萬家庭的飯碗。

然而，真實的情形卻有點出乎人們意料之外——AI的能力不一定會持續增強，大型語言模型絕對有機會愈訓練愈傻瓜，而且這種可能性正與日俱增。或者在AI能夠全面替代甚至消滅人類之前，它便需要面臨著日益嚴重的生存威脅。說來諷刺，這個足以把AI置於死地的「敵人」不是發展資金瓶頸，不是能源供應短缺，更不是來自外星文明的替代品，而是AI自己！

五位來自劍橋大學、牛津大學、倫敦帝國學院和多倫多大學的五位學者發表了一篇論文，探討大型語言模型在訓練過程中可能出現的「模型崩潰」現象。眾所周知，訓練一個大型語言模型需要從外部採集海量數據。隨著近年生成式AI的飛速發展發展，整個世界都充斥著大型語言模型的生成內容(AIGC)；又因為發展和訓練大型語言模型的成本十分高昂，很多科技公司都會用上一些基於大量文本語料庫訓練出來的預訓練模型。他們在研究中發現，如果人們用前代AI生成的內容去訓練後代AI，大型語言模型的輸出質量將隨著世代的增加而急遽下降，過不了多久生成內容的困惑度大增，差得令人摸不著頭腦，惡化速度之快可謂完全超出了論文作者的估計。

研究團隊藉著詢問關於中世紀建築的相關資訊，測試了Meta的OPT-125m模型，展示出大型語言模型在「模型崩潰」影響下的文本輸出。他們在輸入的文本提到了一些建築的歷史背景，而後續各個世代的大型語言模型都是由上一次生成的資料來訓練。第0代 (Gen 0) 的輸出基本上沒有大問題，提到了一些復興式建築的例子，如倫敦的聖約翰大教堂；第1代 (Gen 1) 的輸出亦尚可接受，依然提到了一些著名建築，如羅馬的聖彼得大教堂，惟與輸入的內容關聯性變低了一些；到了第5代 (Gen 5)，輸出開始提到一些與建築無關的主題，如翻譯的語言數量；最終在九次迭代 (Gen 9) 之後胡說八道，輸出幾乎完全偏離了原始主題，扯上黑尾兔等動物。

這種大型語言模型「一蟹不如一蟹」並最終「崩潰」的現象乃一種「近親繁殖」導致的退化過程。五位學者指出，大型語言模型並不完美，可能會產生偏差，污染下一代模型的訓練數據集。正所謂「垃圾進，垃圾出」(Garbage in, garbage out)，當被污染的數據被用作訓練之後，後代模型便會引入前代模型的錯誤，逐漸忘記真實的數據分佈，更容易錯誤地理解現實。模型會開始無法捕捉「不常見但重要的事件」，繼而集中在某些特定的值或模式上進行輸出，導致整體分布的變異性減少，無法再生成多樣化的內容，而是傾向於生成相似或重複的短語。如此循環下去，大型語言模型自然一代更比一代差。

人們當然可以通過微調大型語言模型作補救，但卻很可能會產生嚴重的副作用，隨時得不償失。譬如說，研究團隊明確鼓勵模型生成非重複序列時，模型會為滿足要求而傾向減少續寫的內容，以避免生成的內容出現重複的短語，結果令後代模型的性能變得更差。尤其是在針對大型語言模型而展開的實驗中，強制實施這個指令會導致生成內容的困惑度比原始數據翻倍。這證明了「模型崩潰」的主因在於訓練數據的質量，而非重複的短語，大型語言模型的微調既不治標不治本，難以減少「模型崩潰」的負面影響，即使經過微調的模型也同樣脆弱。

於是，有些人便將希望寄託於提升訓練數據質量，大方向是把AI的生成內容從訓練的數據中剔除。這種思路與論文的發現基本一致。實驗顯示，倘若模型可以在原始數據集上訓練十個世代，並且在每次新的訓練中隨機抽取10%的原始數據點作為樣本，將有助於人們微調模型，降低「模型崩潰」對模型性能的影響。近年不時有學者和業內人士提議為AI生成的內容貼上標記，便是出於這種動機。很可惜，要做到一點絕非易事，因為此舉需要科技公司之間的協調，至少在短期內並在商業上不具有可行性。

這意味著AI不能獨立持續發展，相當依賴於人類的創意，至少截至目前依然是如此。人類生產的原創內容才是真正有價值的東西，乃孕育大型語言模型生成能力的土壤。一旦不能從人類獲取足夠的原創內容，大型語言模型便會失去生成能力。只要大家的創造機器沒有生锈，必然比AI更具優勢，處於主宰的地位。如果大家在短期內在社會上真的碰到一股要消滅自己的力量，應該並非源自AI，而是其他「吃人」的人。

註：相關研究刊載於《自然》(Nature)。

立即分享：

請在此處留言取消回覆