【AI研究】生成式人工智能ChatGPT阻礙學生學習？

AI究竟會讓人變得聰明還是愚蠢呢？

當前位置：首頁 » A-Journal » 消息與故事 » 【AI研究】生成式人工智能ChatGPT阻礙學生學習？

在2025年伊始、即將迎乙巳蛇年到臨的時候，一股強大的力量在「神秘的東方大國」爆發。中國人工智慧新創公司「深度求索」（DeepSeek）的生成式人工智能模型DeepSeek-R1在中國橫空出世，該模型打破了物理算力至上的人工智能擴展邏輯，其性能表現亦更上一層樓，優於現時的國際人工智能行業領頭羊，結果在世界引起了技術、市場和政治的共振，並再一次觸發人們激辯人工智能會否超越並取代人類。不少參與討論的人認為，人工智能不會取代人類，但懂得使用人工智能的人會取代那些不用人工智能的人。這種說法似乎假定生成式人工智能工具類似電腦遊戲《三國志》中的一件道具神器，任何人配置了它都會如虎添翼，智力值立加100，彷彿愚昧昏庸的劉襌都可以變成聰明絕頂的諸葛亮一樣。

但事實又是否如此呢？事情似乎沒有那麼簡單。眾所周知，人類的能力需要透過學習積累和提升。科學研究表明，當人工智能工具的設計本身不利於學習，便有可能無法幫助人類掌握概念和方法，並帶來意想不到的反效果——頻繁使用人工智能的「玩家」率先遭到淘汰。

六位來自美國和匈牙利的學者在近月發表了一篇論文，利用OpenAI的ChatGPT-4探討生成式人工智能技術在高中數學課堂如何影響學習成果。毫無疑問，生成式人工智能技術勢必令人類的工作模式出現翻天覆地的變化，並已經顯著提高了人類的生產力。但究竟這種技術如何在教育環境和工作過程中影響人們學習獲取新技能，學界至今仍然莫衷一是。眾所周知，人類資本發展對維持長遠生產力至關重要。當科技令一項任務全面自動化，便意味著人類失去了從實踐中累積經驗的機會，人們可能會因為技能減少而錯漏百出，又或在關鍵時刻無法獨力應付技術故障等突發情況，抵銷了當初效率提升的好處。六位學者希望通過是次研究，檢視ChatGPT-4會否抑制人們學習。

研究採用了隨機控制試驗 (RCT) 來評估人工智能輔導工具對學生學習的影響。研究團隊於2023-2024年秋季學期在土耳其一所大型高中進行實驗，涵蓋了9、10和11年級共50班的學生，涉及1,000人左右。實驗分為三個階段：第一，老師回顧一個已教授的主題，並在白板上講解一條或多條例題；第二，學生解答一系列由教師設計的練習題目，以熟習課堂中學得的概念；第三，學生參與一個閉卷和沒有電腦輔助的考試，試卷問題在概念上與練習題非常相似。所有學生在第一階段和第三階段所接受的安排都是一樣的，唯一的分別出現在第二階段的學習方法。學生會被隨機分配到三個組別：GPT Base組、GPT Tutor組和控制組，其中控制組的學生按照常規方式進行學習，只用課本和筆記解決練習問題；GPT Base組則在一個擁有簡單聊天界面輸入練習問題，要求ChatGPT-4作為輔導者來幫助他們解答；至於GPT Tutor組使用的人工智能輔導工具也是基於ChatGPT-4開發出來的，但不會直接給出答案，只會引導學生思考。

分析指出，使用人工智能輔導工具的學生在輔助練習問題中的表現會顯著提高。相對於控制組而言，GPT Base組的表現平均提升48%，而GPT Tutor組的表現改善程度則更為驚人，竟然高達127%！這些數字反映生成式人工智能輔導工具的確可以在短期內顯著改善學生的學習表現。然而，故事沒有至此結束，研究團隊發現人工智能輔導工具的長期效果並不理想。一旦學生參加閉卷和關機進行的考試，失去對生成式人工智能輔導工具的訪問權限，GPT Base組和GPT Tutor組的表現隨即大打節扣。結果顯示，與控制組相比，曾經使用GPT Tutor的學生在考試表現上再沒有顯著的優勢，而曾使用GPT Base的學生甚至會比從未使用過人工智能輔導工具的學生表現得更差，分數的下降幅度為17%。這個現象表明生成式人工智能技術可以對學生的長期學習造成負面影響，在教育環境中使用起來並非毫無風險。

六位學者認為，GPT Base組學生之所以在考試中成績最為低沉，主要是因為人工智能輔導工具增加了學生的依賴性。研究團隊從人工智能輔導工具中索取對話抽絲剝繭，發現使用GPT Base的學生較少與人工智能輔導工具互動，不僅發送的信息量較少，對話亦流於表面，反映他們只求直接獲得答案，基本上把人工智能輔導工具當成「拐杖」。GPT Tutor禁絕了學生直接索取答案的途徑，便沒有出現GPT Base的負面效應，惟在輔助學習方面的作用也不算明顥。有趣的是，學生的自我感知與實際學習成果不甚匹配。儘管GPT Base組的學生在考試中表現不佳，但他們並未意識到自己的學習效果下降。GPT Tutor組的學生不遑多讓，雖然他們在考試中的表現不特別耀目，但他們居然認為自己的學習效果顯著提高。學生對自己學習成果的評估過分樂觀，可能是因為學生誤以為自己從人工智能輔導工具提供的信息便等於真正掌握關鍵概念和技能，而學生在練習階段嚐到的成功滋味令他們進一步「自我膨脹」。

那麼，人們應該禁止學生使用ChatGPT等生成式人工智能工具嗎？正所謂「日光之下並無新事」，技術在幫助人類完成任務的同時窒礙人們學習技能，其實並非沒有先例，谷哥搜尋器的故事或者可以解答部分的疑慮。當谷哥搜尋器出現之後，很多人都依賴它快速獲取資訊，當中不少對資訊不求甚解，卻因為得到谷哥搜尋器的幫助而誤以為自己變成「懂王」。不過，很少人會因為谷哥搜尋器帶來的不利影響，而要求全世界回到過去，像古人般在浩瀚的書海中尋找知識和資訊。

也許ChatGPT與以往的各種技術略有不同，它擁有更高的智能和更廣泛的能力，但相關道理依然大致能應用在人工智能領域。GPT Tutor的經驗至少表明：只要人工智能輔導工具設計得宜，與依賴性相關的負面效應還是有望消除。我們實在沒有必要把人工智能輔導工具當成洪水猛獸，反而應該不斷改善它的功能，讓它承擔起促進學生自主學習的角色，從而提高學生解決問題的能力。

註：相關研究刊載於《禾頓商學院研究論文》(The Wharton School Research Paper)。

Discover more from 神策研究院

Subscribe to get the latest posts sent to your email.

立即分享：

Discover more from 神策研究院

請在此處留言取消回覆