院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

新智元報道

編輯:好睏 David

【新智元導讀】

一轉就是十七年,這臺「創新發動機」,從來沒停過!

安徽合肥的大蜀山腳下,一群研發人員正在緊張有序的工作著。

在各個辦公區的中間,張貼著年輕同學們的技術海報、各個方向的研究路徑。

還有一塊寫滿了各種公式的白板,上面「用正確的方法,做有用的研究」這幾個字面積不大卻引人注目。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

在18歲成人禮前夕,新智元對中國科學技術大學博士,科大訊飛研究院執行院長劉聰進行了一次專訪。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

劉聰博士是語音及語言資訊處理國家工程研究中心副主任,科技創新2030「新一代人工智慧」重大專案負責人,CCF CTO Club創始成員。

他領導了科大訊飛公司人工智慧技術的前瞻佈局、技術創新和產業落地等工作,建立超1500人的AI科研團隊,帶領團隊取得多項關鍵技術突破,多次獲得CHiME、OpenASR、IWSLT、Commonsense QA等國際人工智慧技術權威評測冠軍。

此外,劉聰博士還主持了多項國家和省部級重大科研專案,榮獲北京市和安徽省科技進步一等獎、MIT TR35 China「先鋒者」、CCF傑出工程師等榮譽。

從863計劃到AI國家隊

時間回到上世紀90年代末,在國家863計劃的支援下,神舟飛船、蛟龍號潛水器、天河一號及天河二號超級計算機等科研成果如雨後春筍一般。

1998年,還在讀博的劉慶峰率領著中科大的團隊成功在語音合成評測中奪冠,並被專家組一致認定為初步達到實用化水平。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

要知道,當時最先進的語音技術完全被Nuance等國際巨頭壟斷,而專家的認可就像甘露一般,給團隊帶來了極大的信心。

於是,一股「中文語音技術要由中國人做到全世界最好」的家國情懷和豪情壯志油然而生。

再加上「用黑科技產品改變世界」的理工男式理想和浪漫,劉慶峰和其他5名中科大在校學生在經過一年的準備之後,與12名聯合創始人在1999年成立了科大訊飛。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

為了進一步鞏固訊飛刻骨子裡的「核心技術創新」基因,2005訊飛研究院成立。

剛剛成立的研究院,成員還不到10個(包含現在大家都很熟悉的吳曉如、胡鬱、胡國平、魏思等),首任院長是王仁華老師。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

不久後,意氣風發的胡鬱正式接棒研究院院長,帶領研究院系統性梳理了未來的規劃和發展路徑,並提出了至今仍在研究院口口相傳的院訓——「用正確的方法,做有用的研究」。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

萬萬沒想到的是,僅僅成立不到一年的團隊就一舉拿下了2006年Blizzard Challenge語音合成國際評測的第一名。

而由魏思主導的語音評測技術及系統,也首次通過了國家語委的認證。

2008年,科大訊飛作為國內首家由在校大學生創業的公司成功上市。

同年,科大訊飛首次讓語音合成得到的效果超過了普通人說話的水平。

2010年10月28日,劉聰等人潛心研究了三年的「訊飛語音雲平臺」在科大訊飛首場大型釋出會上正式亮相,而這也意味著世界上第一個中文語音輸入法誕生了。

此時還沒人想到,語音輸入有朝一日會成為所有輸入法的標配。

時隔不到2年,科大訊飛在2012年初發布了基於深度神經網路的中文語音識別系統,成為業界首家將深度學習中文語音識別系統正式大規模上線應用的公司。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

2016年,以AlphaGo為代表的現象級AI系統出現,「演算法算力大資料」、「從感知智慧到認知智慧」、「AI應用要找到場景、才能實現價值落地」等也成為了產業界的熱門詞彙。

接下來的事情大家應該都很熟悉了:深度學習技術在多個人工智慧的技術領域快速發展和延伸,層出不窮的模型結構和相關演算法被提出。

這些AI技術的快速進步、結合大量資料和算力的升級迭代,也將不少原本停留在演示階段的AI能力在實際場景中的效果快速提升並實用化。

2017年,科大訊飛智醫助理機器人首次透過國家執業醫師資格考試,綜合筆試測試超過96。3%的人類考生。

2018年,機器翻譯中英語音翻譯首次達到CATTI全國翻譯專業資格(水平)考試二級合格標準。

2019年,機器閱讀理解SQuAD2。0機器閱讀理解權威測評全球首次超過人類平均水平。

2020年,科大訊飛因材施教奪得NeurIPS教育挑戰賽多項任務冠軍。

2021年,釋出了業界首個AI虛擬人互動平臺。並獲得吳文俊人工智慧科技進步獎一等獎。

憑藉著在深度學習、AI等技術領域的先發優勢,訊飛的語音識別技術一直走在世界的前列。

這17年,研究院是怎麼走的?

說到AI Lab,每個研究院結合所在公司的戰略都會有自己的定位和特色,例如有的注重學術論文、有的注重前瞻孵化、有的注重業務支撐。

訊飛來則是將所有AI研發的力量都是集中在研究院,而不是讓每個業務線「養」一個自己AI團隊。

尤其是過去這十幾年,人工智慧技術領域和產業領域的變化和節奏都非常快。

10年前,可能提出一套新的模型,比如從DNN到RNN的升級,就能鶴立雞群了,但是現在技術同質化的現象其實越來越明顯。

就拿科大訊飛研究院來說吧,在早期的深度學習時代,做系統的節奏一般是今年上線一個大版本,前瞻預研一個大版本、然後明年再實現對應的工程化上線。

而現在就必須用「研究工程一體化」的方式做研發,一年需要快速迭代上線N個版本,只有這樣才能在某些領域持續保持領先。

說到這裡,其實還有一件趣事。就是當劉聰還在學生階段寫論文時,感覺自己一年想出幾個演算法、實現併疊加在一起獲得10%的相對提升已經很不錯了。

結果入職之後一聽,胡國平院長的要求是每年30%的相對提升,當時直接就「裂開」了。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

言歸正傳,其實看到過那麼多產學研分離的例子,就會知道,要做到這一點並不容易。

訊飛研究院也是經歷了一系列的「摸爬滾打」,才在技術創新、產業落地、產學研合作等方面積累了相當的經驗,並總結出了「國內唯一」的模式。

劉聰認為可以歸為兩個底層的邏輯:源於行業、拓於演算法。

首先,研究方向的拓展是行業發展的必然趨勢。

從行業落地的經驗來看,一般先是用某個單點技術切入行業,帶來價值後行業會需要更全面、更深入業務主流程的方案,從而反推對技術更多的需求。

例如,訊飛剛開始在教育方向只是做針對口語的語音評測技術,但是後來和主管部門及客戶深入溝通後發現,如果能實現對全部學科的紙質試卷和作業進行自動掃描、評閱、批改、個性化推薦等能力,就能帶來更大的價值。

那麼,這裡就又涉及到圖文識別、智慧批改等計算機視覺和自然語言理解領域的技術。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

其次,因為有了深度學習框架,各個技術方向之間的差異其實變小了,因此在一些基礎演算法上進步(例如端到端框架、半監督訓練等)就可以有效遷移至其他的技術方向。

同樣的,某個方向通用技術的進步(例如16年提出的DFCNN語音識別框架)可以結合一些面向定製化需求的工具和資料,形成對多個不同行業場景的支援。

對此,劉聰曾在2020年的1024大會上提出,訊飛AI科技樹的特點就是以基礎演算法為主幹,以技術體系為生長方向,以場景理解為發展動力。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

而在這樣的策略引導下,訊飛在業務上形成了「平臺+賽道」的組合模式。基於業務發展和研究方向佈局,又構建了「研究+工程+平臺+資源」的研發體系。

以終為始,科大訊飛研究院從2005年成立至今,一直秉承著最初「用正確的方法,做有用的研究」的院訓;持續追求用代差級的技術優勢,解決行業中的剛需問題,實現正向迴圈迭代。

2021年,訊飛研究院被DeepTech評選為「中國2021年人工智慧創新研究院」之一,其中的上榜理由正是 「以系統性創新,解決社會剛需」。

不一樣的團隊

作為國內AI領軍企業的核心技術研發機構,人才的重要性對於訊飛研究院而言自然是重中之重。

人才(尤其是高階人才)從哪裡來?對於人工智慧行業而言,離不開企業、學校和研究機構。

也就是現在常說的「產學研」了。

這其實應該算是科大訊飛的天然優勢之一。

可以說,中國科學技術大學無論是作為學術資源庫,還是高階人才基地,都為科大訊飛的發展壯大提供了最適宜的土壤。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

而中科大的背後是整個中國科學研究的最高機構——中國科學院。用劉聰的話講,科大訊飛在產學研合作上做得一直不錯。

從最初和中科大、中國科學院語言研究所等優勢機構的合作,到後續隨著技術方向拓展,又與清華大學、哈爾濱工業大學、中科院其他研究機構和專家進行了合作,成果顯著。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

此外,這種聯合培養的形式,也讓很多學生在讀研究生期間就能提前進入公司,瞭解前沿產業的需求。

在進一步的研究中,還會有不少學生會選擇留下來繼續鑽研技術的落地。

實際上,科大訊飛的早期員工,有不少就是直接從高校走出來的。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

過去如此,現在仍是如此。

現任科大訊飛AI研究院的副院長劉權,就是中科大博士出身,今年年僅31歲。

他另一個職務是認知智慧國家重點實驗室人機互動研究室主任。目前正帶領著一個近70人的年輕團隊,不斷重新整理人們對人工智慧的想象。

劉權的研究領域是NLP,也是科大訊飛賴以起家的王牌,從語音識別、語音合成,再到智慧轉寫、智慧認知,這些業務模組都離不開NLP領域的突破。

但在十年前, NLP在國際上還處於起步階段。劉權在讀博期間劍走偏鋒,堅持選擇NLP作為研究領域。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

「起初就是單純熱愛,一種初生牛犢不怕虎的心氣勁兒」。讀博的經歷為他日後從事認知智慧核心技術研究打下了堅實的基礎,也讓他明白,科技創新沒有捷徑。

2016年,他研發的AI系統在國際常識推理評測大賽中獲得第一名。

2017年,26歲的劉權博士畢業正式加入科大訊飛,成為國家首個認知智慧國家重點實驗室的核心成員,主攻方向正是NLP。

2019年下半年,科大訊飛成立「技術攻堅團隊」,劉權和團隊承擔起認知智慧領域攻關的重任,他的團隊平均年齡只有26歲。

在經歷了數不清的不眠之夜,克服了無數困難後,這個年輕的團隊在意圖理解、命名實體識別等關鍵技術上取得了突破,最終設計出一套完整有效的多語種語音互動技術方案。

從2020年至2021年,劉權帶領團隊一舉獲得自然語言處理領域5個國際權威評測冠軍。

2022年4月,團隊提出的融合多源知識的深度學習常識推理方法在國際權威機器常識推理評測中,以76%準確率的絕對優勢取得第一,重新整理了機器常識推理水平世界紀錄。

路漫漫,同求索。以時不我待的幹勁去幹「頂天立地」的事,正是年輕人該有的姿態。

除了對學術界、研究機構「求賢若渴」之外,訊飛自身的高階人才培養體系的建設和完善,同樣是這家AI領軍企業能夠堅挺20餘年的關鍵所在。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

在這一點上,訊飛研究院確實有自己的獨到之處。

首先是「搭班子」共創。在上述一些框架或思路制定的過程中,一般不會由某一個人自上向下的宣貫,而更喜歡用「共創」的方式,先對戰略和週期目標充分理解形成大的導向,再充分討論形成碰撞,最終由權威決策。

第二,多樣化發展。既然是企業,個人英雄主義的角色當然是少不了的,比如研究院的首席科學家魏思同學,為了更好地發揮他的作用,會盡量降低他的「常規性損耗」,讓他的個人英雄主義可以成為捅破天的那根針。

院長專訪|訊飛劉聰:AI Lab界的“常青樹”是怎樣煉成的?

第三,讓年輕人放手去幹。研究院建立了特殊的機制,給予年輕人中的佼佼者更多出彩的機會和精心設計的成長路徑。例如對於一些優秀的博士,只要敢於挑戰,完全可以帶領小團隊直接負責專案。

孕育於知名高校的科大訊飛,當然也不會放過每年的校園招聘。

實際上,劉聰本人過去有好幾年就直接負責訊飛研究院的校園招聘,每年至少都會跟上百個同學直接交流。

對於AI企業,對校園招聘的幾點共同的要求大家都不陌生了。比如學好數學、熱愛計算機、專業學科功底紮實、外加一些錦上添花的論文、專案經驗等等。

另外,劉聰表示,訊飛研究院的校園招聘,會關注一些除了學科背景之外的特質。

比如有追求、有好奇心,溫暖從容,積極協作。

如果你是一個有趣的人,就更好了。不怕你愛玩,要的就是用玩遊戲的心態搞研究,什麼段子手、社交牛逼症患者,那更是來多少都不嫌多。

怎麼樣,要不要來訊飛研究院試試?

PS。 訊飛研究院藉著迎接18週年之際,開設了自己的公眾號。據說,還會有更多的故事分享出來哦~