在移動互聯網時代,以App Store為代表的移動應用商店成為了流量入口,人們通過操縱App和信息進行移動交互。
而隨著技術的進步和移動社交媒體的快速發展,AI+時代,AI+行業應用成為了流量入口,語音交互便成了極具競爭力的交互方式。
為共同促進AI語音交互的數字化智能化發展,9月19日上午,百度AI技術生態部高級平臺運營顧問張揚攜百度AI核心技術團隊近10位技術專家赴大壩科技總部,與大壩科技核心技術團隊就“AI語音交互發展前景、現實難點和未來”、“AI語音領域發展成果”等話題,展開了深入的技術探究與分享。
【會議現場】
好的語音交互如何衡量?
語音交互是最自然的人機交互方式,它極大地降低了人們與機器交互時的學習成本,將人機交互綜合效率帶上新的臺階。
那么,好的語音交互在于提高人的使用表現,可以從速度、準確性、注意力三個維度衡量。而讓用戶使用速度越快、識別越準確,并且占用最少注意力的,自然稱得上是好的交互。
為針對市場痛點制定有效的AI+語音應用解決方案,交流會上,百度AI核心技術團隊與我們(大壩科技)就“語音交互發展的現實難點”問題,進行了簡單梳理。
“相比即時的圖像和文字反饋,傳統語音交互是一種不太合格的輸出方式,它過于緩慢、效率低下”,百度AI技術生態部高級平臺運營顧問張揚表示,“聽覺是線性的,我們只能聽完一句話再聽下一句,而不能像視覺一樣瞬間完成圖片理解,也不能如文本般選擇性閱覽,當前的電話語音服務系統就存在這種浪費時間的方式。”
【大壩科技CEO張溫瑞 左三】
對此,大壩科技CEO張溫瑞也表示,持續聽語音會消耗大量注意力和記憶資源,就傳統的電話語音服務系統來說,如果客服念完卻沒有聽到想要的內容,重聽按0相當耗時。另一方面,我們大部分的信息來自于視覺,但即便是當前的AI智能語音系統,也很難輸出準確率95%的視覺信息。
語音交互市場情況如何?
目前,在語音交互的相關領域已經出現了大批玩家和用戶,但由于語音語義的復雜性,經常出現答非所問的情況,使用戶形成語音交互可有可無的印象,導致用戶習慣難以養成。
沒有人愿意對著冷冰冰的機器說話,然后得到毫無感情甚至是錯誤的回答。
所以,語音交互要達到高效、智能、好用,勢必要借助AI+通信與大數據的創新融合能力,讓語音交互應用從等待態轉換為就緒態,能即時響應用戶的各項語音指令。
AI語音應用不是某種獨立產品
“AI語音應用不應該是某種獨立產品,應該是所有企業或者個人通信信息化都需要調用到的一種能力。”CEO張溫瑞表示,“市場最終需要的還是行業應用軟件和系統,那么AI也終會回歸成為一種服務于通信行業的基礎能力。”
換言之,語音交互的發展是離不開AI+通信與大數據的創新融合能力。
【會議現場】
會議歷時兩個多小時,在場技術專家均從不同維度和視角,分析了當前和未來語音交互應用的場景及客戶群。最終,會議以百度AI與杭州大壩科技有限公司達成在AI智能語音領域的持續深度合作共識而結束。
最后,大壩科技希望通過悟空話務機器人的語音交互能力和團隊自身的研發優勢,與百度AI攜手打造數字化智能化語音交互新生態,為廣大客戶提供一站式智能化貼身服務,更為AI+生態的創新發展獻力!