據(jù)外媒(venturebeat)報(bào)道,人工神經(jīng)網(wǎng)絡(luò)研究迎來(lái)新進(jìn)展,微軟聲稱其所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在人聲語(yǔ)音識(shí)別上已經(jīng)媲美人類。
在周一發(fā)布的公告中,微軟表示其用NIST2000自動(dòng)化系統(tǒng)來(lái)同專業(yè)筆記員進(jìn)行能力對(duì)比,首次實(shí)現(xiàn)了機(jī)器出錯(cuò)率小于人類的突破。
優(yōu)化的語(yǔ)音識(shí)別技術(shù)在未來(lái)被期待夠給微軟一系列產(chǎn)品注入新的活力。“無(wú)論是個(gè)人用戶方面還是商業(yè)產(chǎn)品,語(yǔ)音識(shí)別的應(yīng)用前景都很可觀。籍此,Xbox可以實(shí)現(xiàn)快速的語(yǔ)音輸入,語(yǔ)音助手小娜也可以實(shí)現(xiàn)更流暢的對(duì)答。”在近日發(fā)布的一份更新博客中,微軟如此說(shuō)道。
微軟CEO薩提亞·納德拉(Satya-Nadella)對(duì)語(yǔ)音識(shí)別不吝贊美之情,稱語(yǔ)音識(shí)別的突破意義不亞于當(dāng)初圖形界面(GUI)被引入電腦。并預(yù)言語(yǔ)音識(shí)別技術(shù)將在未來(lái)幾年迅速普及。
語(yǔ)音識(shí)別在近年來(lái)連續(xù)迎來(lái)突破。今年早些時(shí)候,中國(guó)互聯(lián)網(wǎng)巨頭百度和華盛頓大學(xué)以及斯坦福大學(xué)共同開(kāi)展對(duì)不同輸入方式的對(duì)比研究。結(jié)果表明百度的深度語(yǔ)音識(shí)別技術(shù)DeepSpeech2能夠?qū)崿F(xiàn)三倍于人類鍵盤手打的輸入速度。另外美國(guó)國(guó)防部下屬的DARPA自1970年代開(kāi)始就致力于語(yǔ)音識(shí)別技術(shù)的研究,并貢獻(xiàn)良多。DARPA所開(kāi)展的語(yǔ)音理解研究(SUR)在開(kāi)發(fā)語(yǔ)音識(shí)別技術(shù)的過(guò)程中起了關(guān)鍵作用,影響至今。