“搜狗的使命是讓人人都能夠有一個(gè)助理,甚至成為你的分身。”
“速記員的取代比播音員更容易些,因?yàn)檫€沒(méi)有機(jī)器技術(shù)能取代人的創(chuàng)造力。”
“以前搜狗做輸入法和搜索,錄音筆的發(fā)布則代表搜狗在智能硬件領(lǐng)域也扎根進(jìn)去。”
“搜狗明年會(huì)有重大爆發(fā),原有的工具將升級(jí)為有溫度的服務(wù)。”
近日,在2019搜狐科技AI峰會(huì)上,搜狗AI主持人“雅妮”再度引發(fā)熱議,機(jī)器人主持人并不罕見(jiàn),但像雅妮逼近真人的形象,讓機(jī)器與人的邊界更加模糊。峰會(huì)當(dāng)日,搜狗CEO王小川發(fā)表演講,他提到了語(yǔ)言AI的重大意義,并展示了搜狗最新發(fā)布的錄音筆。
“搜狗目前的使命是讓人人都能夠有一個(gè)助理,甚至成為你的分身。”原來(lái),搜狗早已離開(kāi)了搜索引擎和輸入法的舒適圈,在人工智能領(lǐng)域用語(yǔ)音AI開(kāi)辟疆域。
搜狗為何會(huì)有這樣的轉(zhuǎn)變,未來(lái)又將走向何方?搜狐科技對(duì)王小川進(jìn)行了專訪。
搜狗AI主持人“雅妮”背后的故事
在語(yǔ)音AI方面,搜狗目前有兩大產(chǎn)品,一是AI主持人,二是錄音筆。有意思的是,這兩個(gè)產(chǎn)品一個(gè)是語(yǔ)音的收集,一個(gè)是語(yǔ)音的輸出,他們的誕生都來(lái)源于搜狗的語(yǔ)音識(shí)別項(xiàng)目。
為何搜狗AI機(jī)器人不走大眾化的“賣(mài)萌機(jī)器人形象”,而是選擇無(wú)限地向真人靠近?這背后有著什么樣的故事呢?
“原來(lái)搜狗在做語(yǔ)音識(shí)別項(xiàng)目的時(shí)候發(fā)現(xiàn),為什么不是從語(yǔ)音里面提取信息,而是從嘴形、表情里面獲取講的內(nèi)容。所以我們當(dāng)時(shí)立項(xiàng)更多從自然交互里面用視覺(jué)的方式去嘗試?yán)斫馊说谋磉_(dá),這個(gè)項(xiàng)目做得蠻成功的。”
王小川對(duì)搜狐科技表示,AI主持人的誕生離不開(kāi)前期的技術(shù)積累,通過(guò)前期的技術(shù)積累,倒過(guò)來(lái)思考,如何讓帶有視覺(jué)效果的機(jī)器人去表達(dá),用最自然的方式讓人去接受。
“當(dāng)時(shí)我們的技術(shù)能夠?qū)崿F(xiàn)在90%的垂直場(chǎng)景中,不用聽(tīng)聲音只看嘴形就知道講話內(nèi)容,在一些通用場(chǎng)景10個(gè)字也能對(duì)6個(gè)字。這樣的技術(shù)積累后,倒過(guò)來(lái),我們開(kāi)始在自然交互里面,從機(jī)器聽(tīng)人,變成讓機(jī)器表達(dá),用最自然的方式讓人去接受,從現(xiàn)在的AI主持人成果來(lái)看,我們達(dá)到了立項(xiàng)目標(biāo)。”
AI主持人的第一個(gè)應(yīng)用場(chǎng)景是新華社,王小川提起,目前在新華社已有大約3000條播報(bào)從人轉(zhuǎn)向機(jī)器,AI主播解放了新華社主播:“新華社主播以前每周一三五下午需要去錄視頻,現(xiàn)在已經(jīng)被徹底解放了,成為一個(gè)采訪記者,可以去做更高級(jí)的訪問(wèn)活動(dòng)。”
那么,AI主播有沒(méi)有可能取代人類主播?錄音筆有沒(méi)有可能取代速記員呢?王小川覺(jué)得,速記員的取代比播音更容易。
“速記員的取代比播音更容易一些,因?yàn)殇浺舨⒉徽{(diào)動(dòng)人性部分,它沒(méi)有表演成分,只需要忠實(shí)地記錄,這是機(jī)器可以做到的。如果是主播或者網(wǎng)紅,會(huì)有更多的表演成分,需要人的創(chuàng)造力,現(xiàn)在還沒(méi)有這樣的機(jī)器技術(shù)。”
搜狗要從工具升級(jí)為服務(wù)
2019已接近尾聲,被問(wèn)及今年以來(lái)對(duì)搜狗印象最深的時(shí)刻,王小川提到了錄音筆的發(fā)布:“今年搜狗做得更多是技術(shù)的積累,現(xiàn)在已經(jīng)快到爆發(fā)的點(diǎn)了,以前搜狗做輸入法和搜索,今年錄音筆的發(fā)布代表搜狗在智能硬件領(lǐng)域也扎根進(jìn)去。有了這樣的成績(jī),我更看重明年的重大爆發(fā)。”
從2017年上市之后,外界一直在猜測(cè),搜狗對(duì)人工智能領(lǐng)域,特別是語(yǔ)言處理的關(guān)注,是不是代表它將會(huì)朝著人工智能企業(yè)進(jìn)行轉(zhuǎn)型,而今年搜狗錄音筆C1的發(fā)布,似乎印證了外界的猜測(cè)。但王小川否認(rèn)了這一說(shuō)法。在王小川看來(lái),搜狗并非要進(jìn)行轉(zhuǎn)型,而是要升級(jí)。
“不叫轉(zhuǎn)型,而叫升級(jí),就是原有的工具,比如打字的工具會(huì)變成輔助的寫(xiě)作助理,從冷冰冰的工具,變成一個(gè)有溫度的,會(huì)替你思考的服務(wù)。”
除了智能硬件領(lǐng)域可能帶來(lái)的新驚喜,在搜狗最強(qiáng)勢(shì)的搜索領(lǐng)域,明年也將引入更多的AI技術(shù),王小川表示:“搜狗明年會(huì)有個(gè)發(fā)布,AI融入后將使搜索引擎準(zhǔn)確度得到很大提升,不僅如此,像beta的算法或者其他的深度學(xué)習(xí),包括對(duì)于用戶問(wèn)題的理解,對(duì)知識(shí)的抽取等都會(huì)提高,搜狗將會(huì)打造新的人機(jī)交互方式。”
三年前,王小川因在質(zhì)疑聲中預(yù)言AlphGo(圍棋機(jī)器人)能夠打敗所有人類棋手而成為AI圈紅人,現(xiàn)在,他正嘗試用智能錄音筆取代傳統(tǒng)的速記方式,那么,在他眼中,三年后的人工智能會(huì)有什么新的突破?
王小川覺(jué)得,讓技術(shù)與人類感知相結(jié)合,才能實(shí)現(xiàn)應(yīng)用的大爆發(fā):“三年后,我們?cè)趫D像和語(yǔ)音上獲取上已取得足夠多的成績(jī),要開(kāi)始思考在垂直場(chǎng)景當(dāng)中,如何讓深度學(xué)習(xí)圖像語(yǔ)音技術(shù),和人在垂直場(chǎng)景中的認(rèn)知,包括法律、醫(yī)療等的知識(shí),得到更好的結(jié)合,這樣行業(yè)應(yīng)用才能有大的爆發(fā)。”
二維碼