在AI大模型全面發展的當下,多模態模型是當前訓練和開發的重要方向,在社交行業實踐中顯現出極強的可交互性,能夠提升應用的可用性,帶來更豐富的社交體驗。新型社交平臺Soul App創始人張璐團隊正積極迭代升級多模態能力,致力打造社交“多邊形戰士”。
Soul的“AI+社交”布局正朝著多模態方向不斷升級,而促進虛擬人在文字、語音、圖片等方面模態的相互結合是Soul的主攻方向。在Soul 創始人張璐看來,產品有一個文字對話的基礎得分,做得很好就可以得到六七十分。如果基礎得分不好,即使聲音做得再好,圖片理解方面再出色也不行。確定拿到基礎得分後,接下來就是不斷迭代,做好多模態爭取更好的表現。為此,夯實文字對話基礎是Soul虛擬人升級的第一步。
Soul的各類AI功能升級離不開自研大模型SoulX的助力。SoulX具備了prompt驅動、條件可控生成、上下文理解、多模態理解等能力。這一多模態能力不僅提升了虛擬人在帖子、圖片、音頻等多種形式創作上的能力,也還讓Soul的一眾社交場景產生了更多高質量的內容。
與此同時,在夯實文字對話能力後,Soul也在持續優化語音系統。語音模態是Soul比較看重的一大功能。Soul創始人張璐表示:“語音是一個相對重要的點,可能會占30分。語音其實有很多人在做的,有非常多的解決方案,我們會聚焦在AI語音賦能‘溫度’和‘陪伴感’方向,因為社交互動本質上是情感的流動”。這個多邊形戰士不僅需要具備多模態的能力,還需要情感化,而不只是提升效率的工具。虛擬人需要找到用戶的情緒價值點,同時具備個性化,展現出不同的性格特征;有時候應該順應用戶,有時候應該拒絕用戶。
目前,Soul表現較好的虛擬人有AI苟蛋。AI苟蛋是一個多模態的機器人,有非常明顯的擬人傾向。比如,用戶分享一個照片,它能夠根據對照片上的內容和時間理解,判斷發生什麼事情,然後進行主動地關懷和互動。還能基於和用戶的曆史聊天內容,沉澱回憶、構建個人專屬記憶的虛擬夥伴。從Soul公開的數據看,AI苟蛋的對話輪數比較高,用戶平均每天會給苟蛋發送超過70條消息,互動平均時長超過30分鐘。這其實已經意味著,很多用戶把苟蛋當做了可以持續互動聊天的夥伴。
從大模型的發展趨勢看,多模態是發展的必經之路,AIGC大模型從單模態向多模態發展已成為行業共識。Soul創始人張璐團隊不斷更新多模態社交應用、促進社交體驗好上加好,體現了Soul 追求卓越、臻於至善的發展態度,也體現了Soul對用戶體驗提升與對社交行業發展的創新能力。