原標題:下一步“阿爾法狗”何去何從
谷歌旗下的“阿爾法狗”(AlphaGo)最終以4∶1戰(zhàn)勝韓國圍棋九段棋手李世石。繼跳棋、象棋之后,人工智能在挑戰(zhàn)人類的清單上,再添濃墨重彩一筆。下一步“阿爾法狗”又何去何從呢?
對抗其他游戲
“阿爾法狗”的通用方法中有幾個元素是專門為圍棋這項游戲而設(shè)計的,這一方法或許可以用來解決與模式識別、制定計劃和做出決策有關(guān)的問題,但仍有其局限性。加拿大蒙特利爾大學(xué)計算機科學(xué)家尤舒亞·本希奧解釋說:“它的確令人印象深刻,但仍然面臨諸多挑戰(zhàn)。”
盡管去年10月份,“阿爾法狗”擊敗了歐洲圍棋冠軍樊麾,但李世石此前預(yù)測,他將以絕對優(yōu)勢贏得這次比賽,不過,現(xiàn)實給了他沉重的一擊,他也為自己的失敗深感震驚。
主要研究人工智能發(fā)展趨勢的美國亞利桑那州州立大學(xué)社會科學(xué)家邁爾斯·布倫代奇認為,“阿爾法狗”的進步很大程度上要歸功于一個事實:下棋次數(shù)越多,它表現(xiàn)得越好。實際上研究人員在“阿爾法狗”算法中搭建了兩套模仿人類思維方式的深度神經(jīng)網(wǎng)絡(luò)。DeepMind團隊先讓“阿爾法狗”對人類比賽出現(xiàn)的3000萬種圍棋方位進行研究,然后通過自己不斷地下棋來提高技能,這一技術(shù)被稱為“增強學(xué)習(xí)”。接著,“深度思維”將“阿爾法狗”識別成功圍棋布局的能力同“預(yù)測搜索”技術(shù)結(jié)合在一起,利用“預(yù)測搜索”技術(shù),“阿爾法狗”會評估進行某些移動可能會產(chǎn)生的后果,并在此基礎(chǔ)上,決定下一步如何走。
DeepMind已經(jīng)攻下了大部分棋盤類游戲的“城池”,但機器仍然無法在多人參與的撲克牌游戲中打敗人類。目前,該團隊已經(jīng)表達了對抗具有科幻性質(zhì)的戰(zhàn)略性游戲《星際爭霸》的興趣。
超越游戲看醫(yī)療
加拿大麥吉爾大學(xué)的計算機科學(xué)家喬爾·皮諾認為,“阿爾法狗”算法取得的成功讓人們不禁思考,人工智能何時可以獲得多樣化的通用智能。
DeepMind公司也計劃超越游戲。今年2月份,該公司創(chuàng)立了“DeepMind健康”公司并同英國國民健康服務(wù)公司展開合作,使其算法最終能被用于臨床數(shù)據(jù),從而可以改進診斷或治療計劃。據(jù)悉,他們已開發(fā)出一款名為Streams的軟件,讓臨床醫(yī)生能夠更快地觀察到醫(yī)療結(jié)果。
但美國非盈利機構(gòu)艾倫人工智能研究所的首席執(zhí)行官奧倫·埃齊奧尼表示,這樣的應(yīng)用面臨的挑戰(zhàn)與游戲不同?!霸谟螒蝾I(lǐng)域,你能收集大量數(shù)據(jù),而且程序會通過玩很多游戲持續(xù)不斷地提供反饋,但在混亂的現(xiàn)實領(lǐng)域,數(shù)據(jù),尤其是與罕見病有關(guān)的數(shù)據(jù)非常少;即便是常見病的數(shù)據(jù)也不那么多,因此,很難直截了當?shù)亟o某個決定貼上‘好’還是‘壞’的標簽?!?/p>
紐約大學(xué)神經(jīng)科學(xué)家蓋瑞·馬庫斯則說:“‘DeepMind’的方法并非唯一推動人工智能向前發(fā)展的方法。他創(chuàng)辦了一家名為‘幾何智能’的初創(chuàng)公司,主要研究用少量例子進行推斷的學(xué)習(xí)技術(shù),這一方法受到兒童學(xué)習(xí)過程的啟發(fā)?!北M管“阿爾法狗”問世時間不長,但其可能已經(jīng)進行了數(shù)千萬次游戲,遠超李世石,但后者仍然勝了一局。馬庫斯說:“這表明,人能夠使用更少量的數(shù)據(jù)獲得一個模式,這一點令人影響深刻,或許人類的學(xué)習(xí)速度比機器更快。”(記者 劉霞 綜合外電)