探索“智能語音”未來的香港“王博士”

新華社廣州4月27日電(記者陳寂)當(dāng)香港科技大學(xué)博士王昕決定離校赴深圳創(chuàng)業(yè)之時(shí),她已投身語音識(shí)別研究10年之久。那是在4年前,30歲出頭的王昕曾權(quán)衡再三。

 

身處香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系,浸淫國際前沿的科研環(huán)境與開闊的學(xué)術(shù)視野中,王昕本可選擇留校,享受優(yōu)渥待遇,但做事喜歡做到極致的她卻覺得,自己研究的東西沒能很好地實(shí)現(xiàn)產(chǎn)業(yè)化運(yùn)用。

 

“語音識(shí)別技術(shù)落地變成消費(fèi)類產(chǎn)品的前提是要和產(chǎn)商結(jié)合,而深圳這點(diǎn)很厲害,技術(shù)從實(shí)驗(yàn)室到產(chǎn)品的過程很快。”她說。

 

于是,王昕做了一個(gè)自稱“很欠揍”的選擇,在2012年與幾個(gè)創(chuàng)業(yè)伙伴北上深圳,在深港產(chǎn)學(xué)研基地成立了“深圳語音搜索及應(yīng)用工程實(shí)驗(yàn)室”,希望憑借車載語音識(shí)別產(chǎn)品邁進(jìn)內(nèi)地車聯(lián)網(wǎng)市場。

 

“我感覺,開車時(shí)的語音識(shí)別不是錦上添花的應(yīng)用,它必將成為一種必需品。”王昕說。深港產(chǎn)學(xué)研基地給了王昕一個(gè)免費(fèi)的理想創(chuàng)業(yè)場地,在這個(gè)由深圳市政府、香港科技大學(xué)和北京大學(xué)共同創(chuàng)建的基地里,很多人都叫她“王博士”。

 

因?yàn)檫@一研發(fā)方向契合深圳市的產(chǎn)業(yè)發(fā)展方向,“王博士”的實(shí)驗(yàn)室還獲得政府?dāng)?shù)百萬元人民幣的資助。

 

“機(jī)遇大,但挑戰(zhàn)也是分分鐘的事情。”王昕創(chuàng)業(yè)之初,零經(jīng)驗(yàn)運(yùn)作一個(gè)企業(yè),招兵買馬,做計(jì)劃書,與政府、市場打交道……面臨許多未知,吃過許多閉門羹。數(shù)年間,創(chuàng)業(yè)團(tuán)隊(duì)陸續(xù)有人離開,“不像在港科大,帶團(tuán)隊(duì)都有學(xué)校支撐?,F(xiàn)在每一年都要想著怎么找錢,養(yǎng)活這么多人。”

 

在各種新型智能化設(shè)備日益廣泛地走進(jìn)人們的工作和生活的今天,作為人機(jī)交互最自然的方式,語音識(shí)別成為了當(dāng)今最便捷的人機(jī)交互使用方式。

 

“以前很多人不習(xí)慣對(duì)機(jī)器說話,而微信語音和siri服務(wù)改變了這點(diǎn),現(xiàn)在手機(jī)上所有的語音功能,車上都能用了,并已發(fā)展到了隨心所欲的程度。”王昕解釋說,車載語音識(shí)別最大的挑戰(zhàn)在于控制噪音環(huán)境下的識(shí)別率,而這正是她公司的技術(shù)優(yōu)勢所在。

 

現(xiàn)在,王昕的企業(yè)已擁有逾100名員工,年盈利數(shù)百萬元人民幣,產(chǎn)品覆蓋車載語音識(shí)別、政府部門人工客服等多個(gè)領(lǐng)域。與此同時(shí),王昕的企業(yè)還借助大數(shù)據(jù)服務(wù),搭建面向證券領(lǐng)域的高端商情服務(wù)系統(tǒng),覆蓋近900家擬上市企業(yè),實(shí)現(xiàn)對(duì)擬上市企業(yè)從初審到上市這一敏感時(shí)期全天24小時(shí)、多種信息來源的輿情監(jiān)控。

 

“當(dāng)一個(gè)社會(huì)熱點(diǎn)事件發(fā)生之后,互聯(lián)網(wǎng)相關(guān)的新聞會(huì)涌出很多,人看到的只是一個(gè)一個(gè)片段,但機(jī)器會(huì)搜索和呈現(xiàn)完整的一個(gè)時(shí)間軸和發(fā)散途徑。”王昕以天津港爆炸事故為例解釋說,機(jī)器會(huì)在事故發(fā)生后立即挖掘數(shù)據(jù)庫,會(huì)發(fā)現(xiàn)停放有汽車的企業(yè)是哪些、背后涉及哪些保險(xiǎn)公司、居民樓又是哪些房地產(chǎn)商的……機(jī)器會(huì)分析連接起所有的線索,形成完整的知識(shí)圖譜。

 

“人下一秒會(huì)說什么,人工智能是通過對(duì)之前說的很多話的大數(shù)據(jù)積累來預(yù)測的。股票也是一樣,人工智能也可以根據(jù)大數(shù)據(jù)來預(yù)測。”王昕說,她的實(shí)驗(yàn)室將會(huì)把大數(shù)據(jù)的挖掘與證券行業(yè)和金融行業(yè)做結(jié)合。

 

國家“十三五”規(guī)劃里提到“人工智能”,也讓王昕對(duì)未來充滿期望。“我們的發(fā)展還是和國家大局契合的。”她告訴記者,語音識(shí)別不僅要能“聽清說了什么”,還得“理解說了什么”,這方面提出的挑戰(zhàn),今后將從后臺(tái)數(shù)據(jù)上發(fā)力應(yīng)對(duì)。

 

在她看來,有了“深度學(xué)習(xí)”能力的人工智能,將來在語音識(shí)別上不僅能回答“今天天氣多少度”,還要能回答“今天天冷么”這樣的問題。