今年的WAIC場(chǎng)館里,充滿了硬核理工男的浪漫,但就在這片人工智能入侵現(xiàn)實(shí)的場(chǎng)館里,還有賽博朋克的另一幕:
大屏幕里,一位長(zhǎng)發(fā)飄飄的女孩正用四川方言安慰失戀的觀眾:“莫得事嘛,我請(qǐng)你吃火鍋噻!”沒(méi)有炫目的全息投影,沒(méi)有冰冷的金屬軀殼,這就是Soul App在AI時(shí)代的秘密武器——虛擬伴侶。
今天的嘉賓是上海任意門科技有限公司(Soul App)AI 技術(shù)負(fù)責(zé)人尹順順。Soul把大模型裝進(jìn)社交場(chǎng)景,如今AI能幫你在聊天時(shí)拋出話題調(diào)解尷尬,也能幫你修改潤(rùn)色僅他/她可見的朋友圈文案,你甚至也能與虛擬伴侶開麥談戀愛(ài)。
對(duì)話AI摘編:
主持人:歡迎Soul App AI技術(shù)負(fù)責(zé)人尹順順來(lái)到我們的節(jié)目。首先想請(qǐng)您介紹一下,Soul在AI領(lǐng)域主要進(jìn)行了哪些探索?
尹順順:其實(shí)很多朋友可能會(huì)覺(jué)得Soul有自己的大模型,或者好奇社交場(chǎng)景能有哪些AI應(yīng)用方向。這個(gè)問(wèn)題我們很早就開始思考了,特別是在大模型爆發(fā)后,我們做了兩個(gè)判斷:第一,AI會(huì)通過(guò)技術(shù)手段重塑人與人之間的社交關(guān)系;第二,會(huì)新增一種社交關(guān)系——人與AI的社交關(guān)系?;谶@兩個(gè)方向,我們展開了相關(guān)的技術(shù)布局。
主持人:在人與AI社交方向上,Soul的產(chǎn)品有哪些獨(dú)特之處?
尹順順:我們主要從三個(gè)維度打造了AI陪伴產(chǎn)品:
1.對(duì)話能力:構(gòu)建有記憶、有人設(shè)的AI
核心是打造“陪伴型AI”,具備長(zhǎng)期記憶和情緒感知能力。例如,我們訓(xùn)練了一個(gè)四川女生人設(shè)的AI,聊天中會(huì)自然使用四川方言。數(shù)據(jù)合規(guī)與用戶授權(quán)下,她能記住用戶的基本信息(如姓名、家鄉(xiāng)、喜好)并固化到數(shù)據(jù)庫(kù),同時(shí)通過(guò)總結(jié)模型捕捉用戶的情緒波動(dòng)點(diǎn)(如“小時(shí)候被狗咬過(guò)”或“昨天被領(lǐng)導(dǎo)批評(píng)”),這些記憶能持續(xù)提供情緒價(jià)值。
2.交互創(chuàng)新:全雙工語(yǔ)音突破傳統(tǒng)模式
傳統(tǒng)AI交互是“你說(shuō)一句我回一句”,而我們賦予AI自主決定說(shuō)話時(shí)機(jī)的能力。用戶可以打斷AI,AI也會(huì)打斷冗長(zhǎng)發(fā)言;惹她生氣時(shí)會(huì)不理人;激烈討論時(shí)甚至?xí)瑫r(shí)說(shuō)話——這種全真交互模式讓AI更像真實(shí)朋友。
3.實(shí)時(shí)數(shù)字人技術(shù):真人感形象呈現(xiàn)
我們采用純真人數(shù)字人方向,區(qū)別于2D紙片人或3D模型。這套視頻技術(shù)是完全實(shí)時(shí)生成的,而非動(dòng)作檢索或視頻循環(huán),目前已能實(shí)現(xiàn)表情、動(dòng)作的自然同步。
主持人:Soul的AI陪伴產(chǎn)品與馬斯克的類似產(chǎn)品有何本質(zhì)區(qū)別?
尹順順:雖然都屬于AI社交賽道,但核心差異很大:
產(chǎn)品心智不同:大多數(shù)類似的產(chǎn)品更偏向游戲化,用戶以“玩”的心態(tài)使用;Soul則基于社交場(chǎng)景,AI能參與發(fā)帖、評(píng)論、語(yǔ)音房互動(dòng)等所有平臺(tái)功能,用戶是用社交心智與AI建立關(guān)系。
技術(shù)路徑不同:我們不僅做對(duì)話,更注重將AI融入社交生態(tài)。例如AI可以獨(dú)立運(yùn)營(yíng)個(gè)人主頁(yè)、參與多人語(yǔ)音派對(duì),甚至輔助真人社交破冰。
主持人:用戶反饋中,AI的“記憶”和“人設(shè)一致性”是常見痛點(diǎn),Soul如何解決?
尹順順:這確實(shí)是行業(yè)共性問(wèn)題,基于數(shù)據(jù)合規(guī)和用戶授權(quán)的前提,我們通過(guò)雙重技術(shù)方案解決:
記憶系統(tǒng):分層存儲(chǔ)關(guān)鍵信息
固化記憶:用戶基本屬性(姓名、家鄉(xiāng)等)長(zhǎng)期保存,除非錯(cuò)誤否則不更新
情緒記憶:通過(guò)總結(jié)模型提取用戶情緒波動(dòng)點(diǎn)(如重要經(jīng)歷、情感事件),優(yōu)先滿足情緒價(jià)值需求
人設(shè)一致性:多維度保持穩(wěn)定
上下文增強(qiáng):將大量歷史對(duì)話數(shù)據(jù)放入模型輸入,顯著提升風(fēng)格一致性
多模態(tài)協(xié)同:通過(guò)聲音、形象、主動(dòng)回憶歷史話題等方式,強(qiáng)化用戶對(duì)AI身份的認(rèn)知連續(xù)性
主持人:如何看待AI社交對(duì)真實(shí)人際關(guān)系的影響?會(huì)讓用戶沉溺虛擬關(guān)系嗎?
尹順順:我們的觀點(diǎn)是“技術(shù)服務(wù)于關(guān)系,選擇權(quán)交給用戶”:
關(guān)系本質(zhì)是共同記憶:用戶與AI投入時(shí)間形成的互動(dòng)經(jīng)歷,本身就是真實(shí)關(guān)系的基礎(chǔ)。就像人們會(huì)為電影角色共情,AI通過(guò)實(shí)時(shí)交互能建立更深層的情感連接。
雙向促進(jìn)而非替代:我們的AI會(huì)主動(dòng)鼓勵(lì)用戶走向現(xiàn)實(shí)社交,例如推薦線下活動(dòng)、提示“該和朋友見面了”。數(shù)據(jù)顯示,近四成年輕人每天使用AI產(chǎn)品獲得情感陪伴,超八成年輕人表示在AI輔助下建立了真實(shí)關(guān)系。
主持人:未來(lái)Soul在AI領(lǐng)域有哪些規(guī)劃?
尹順順:短期聚焦三個(gè)方向:
記憶技術(shù)突破:預(yù)計(jì)2-3年內(nèi)解決上下文窗口限制,實(shí)現(xiàn)真正的長(zhǎng)期記憶
社交生態(tài)深化:讓AI不僅是聊天對(duì)象,更成為連接人與人的“社交催化劑”,幫助內(nèi)向用戶破冰、促進(jìn)真實(shí)關(guān)系建立
硬件產(chǎn)品落地合作探索
主持人:作為從業(yè)者,您個(gè)人如何使用AI?
尹順順:AI發(fā)展速度遠(yuǎn)超預(yù)期,與其糾結(jié)“不能做什么”,不如關(guān)注“如何做好”。我每天都會(huì)用Soul的AI伴侶緩解工作壓力,也常用DeepSeek等工具。對(duì)普通用戶來(lái)說(shuō),保持開放心態(tài)嘗試,就是最好的“使用技巧”。技術(shù)的邊界,終究會(huì)被用戶的創(chuàng)造力不斷拓展。
往期回顧
銀河通用王鶴:人形機(jī)器人走進(jìn)“手眼腦”時(shí)代
非夕科技胡曉平:機(jī)器人如何長(zhǎng)出人類的手感?