原標(biāo)題:猜猜誰是AI辯手
大屏幕上,長相、穿戴一模一樣的兩位辯手,對涉及情感、倫理、心理學(xué)、哲學(xué)的辯題“如果能一鍵消除所有痛苦回憶,要不要按”展開激烈辯論。其中,一方辯手是真人陳銘——武漢大學(xué)教師,另一方“辯手”則是AI陳銘——上海稀宇科技(MiniMax)提供的大模型。
在7月26日舉辦的“2025中國·AI盛典”辯論賽賽后投票中,42%的觀眾把大模型認(rèn)作人類,這表示該款大模型已通過了人機(jī)辯論的圖靈測試。
圖靈測試是衡量機(jī)器是否具備人類智能水平的經(jīng)典標(biāo)準(zhǔn),由被譽(yù)為“人工智能之父”的圖靈在1950年提出:如果一臺機(jī)器在自然語言對話中能“騙過”超過30%的人類參與者,那就可以被視作具有智能。
該大模型圖靈測試的成功,不僅標(biāo)志著我國在AI自然語言理解和邏輯思維方面取得重大進(jìn)展,也展現(xiàn)出上海作為全球AI高地的創(chuàng)新實(shí)力??萍既請笥浾吡私獾?,這位“辯手”的文本大模型學(xué)習(xí)了萬億條人類數(shù)據(jù),而其語音大模型僅需6秒聲音片段即能模擬真實(shí)人聲。辯論影像則由節(jié)目組運(yùn)用AI技術(shù)統(tǒng)一處理,100位觀眾僅憑辯論內(nèi)容、語言風(fēng)格和思維邏輯判斷誰是人類。
在辯論中,AI陳銘的表現(xiàn)亮點(diǎn)眾多。例如在論點(diǎn)構(gòu)建中,針對“人工智能是否應(yīng)擁有法律人格”等辯題,其能快速檢索法律條文、倫理案例,構(gòu)建多層次論證框架;在臨場應(yīng)變時,面對人類辯手的即興詰問,其可在半秒內(nèi)生成反駁話術(shù),比如在“技術(shù)失業(yè)”議題中能結(jié)合制造業(yè)自動化數(shù)據(jù)提出“崗位結(jié)構(gòu)轉(zhuǎn)型”新視角;在情感渲染方面,其通過語音合成技術(shù)模擬語氣變化,在“教育公平”辯論中以富有感染力的敘述引發(fā)觀眾共鳴。
賽后,曾多次獲得國際辯論賽冠軍的陳銘在社交媒體上稱:“對于推理能力的成熟程度,辯論幾乎是最佳試金石。以我這次的親身體驗來看,經(jīng)過針對性訓(xùn)練的推理大模型,辯論能力恐已超過90%的人類辯手。觀點(diǎn)、邏輯、金句,再加上極富感染力的輸出,AI流暢無比,信手拈來,在語言技術(shù)上人類幾乎已經(jīng)沒有什么自留地了?!蓖瑫r,他也認(rèn)為AI尚未完美,“最后的榮耀,還是那些在‘大’問題的深度思考。對于根本性哲學(xué)思考的觀點(diǎn)突圍,AI仍力有不逮。”
上海交通大學(xué)人工智能學(xué)院院長李頡認(rèn)為,該模型在辯論場景的突破為AI在政務(wù)咨詢、金融談判等強(qiáng)交互領(lǐng)域的應(yīng)用提供了新范式。目前,MiniMax已與復(fù)旦大學(xué)合作,將相關(guān)技術(shù)應(yīng)用于科技倫理審查智能體系統(tǒng)“一鑒”,實(shí)現(xiàn)倫理風(fēng)險自動標(biāo)注與合規(guī)性分析。
這場圖靈測試的意義,早已超越了簡單的“辨別人機(jī)”。中國工程院院士、之江實(shí)驗室主任王堅告訴記者:“當(dāng)年的圖靈測試為人工智能定了一個極具挑戰(zhàn)的目標(biāo)。今天我們看到,通過圖靈測試只是人工智能下一個新的開始?!?/p>