燃燒最亮的火把——科大訊飛逐夢AI-新華網
新華網 > 安徽 > 正文
2024 05/11 11:19:28
來源:新華網

燃燒最亮的火把——科大訊飛逐夢AI

字體:

  新華網合肥5月11日電(記者張紫赟、汪海月)在位於安徽合肥的科大訊飛股份有限公司A1樓,墻壁上刻着一排字“燃燒最亮的火把,要麼率先燎原,要麼率先熄滅”。

  這句頗具英雄主義的口號,由創始團隊在1999年公司成立之初提出,一路“見證”這家由大學生創業的高科技企業,在全球AI(人工智能)技術創新和市場競爭中拼殺突圍。

  25年來,訊飛堅持源頭創新,從中文合成到語音識別、語義理解,從中文、英文到60余種多語種,從智能語音再到認知智能,逐漸走出一條自主研發之路,摘得多項AI技術全球冠軍,2次獲得國家科學技術進步獎,引領國內行業發展。

  “死磕”技術

  初夏,訊飛研究院內,一排排研究人員正坐在電腦前,抓緊訓練星火認知大模型的最新版本。

  能聽會説、能思考會理解……大模型帶來的“智慧涌現”,在20世紀90年代,是中國學者與企業家們難以想象的。

  彼時,中文語音技術基本掌握在國外手中。在位於合肥的中國科學技術大學六係(現電子工程與信息科學系),一群學生受到導師王仁華的感染與鼓勵,懷揣着“中文語音技術應該掌握在中國人手裏,中文語音産業應該由中國人做到最好”的夢想,如星火匯聚,抱團辦起了公司。

  創業領頭人是在校博士生劉慶峰,此前,他研發的語音合成系統讓我國語音合成評測第一次達到3分(滿分5分)。這群意氣風發的青年學子,“死磕”技術,先是邁過語音合成的技術高峰,又瞄準語音識別的新目標。

  2007年,作為當時全球最大中文語音識別公司的中國代理商,訊飛放棄這份佔比公司營收15%的業務,提出終止代理,開始全力自主研發,通過探索深度神經網絡技術,結合數據的漣漪效應,將中文語音識別率從66%一路提升至98%以上。

  再回首,訊飛已在國際AI比賽中樹立多個里程碑:2008年語音合成技術首次超過普通人説話水平;2019年,機器的閱讀理解能力首次超過人類平均水平;2022年常識推理單模型首次超過人類平均水平……此間,訊飛入選首批四個國家新一代人工智能開放創新&&,與中國科學技術大學共建語音及語言信息處理國家工程研究中心和認知智能全國重點實驗室。

  不確定性,是技術研發的魅力,更是挑戰。

  科大訊飛董事長劉慶峰説,訊飛年均研發投入佔營業收入比約20%,研發經費實施“721機制”,即70%投入主營業務、20%投入未來3至5年的業務,10%用於“看更遠的未來”。

  當2022年底,業內驚訝於ChatGPT呈現的智慧涌現及所使用的Transformer深度學習框架時,訊飛得益於技術“在研一代、儲備一代”,此前對相關技術已有布局,迅速跨部門集結百人團隊,全力攻克大模型研發。

  “當時由於國外出口管制,公司業務發展正高度承壓。但面向研發,仍是要資源給資源。”科大訊飛研究院院長劉聰説,自2023年5月6日星火認知大模型首次發布以來,已完成4次重點版本升級迭代,其邏輯推理、數學能力、語言理解等指標領先行業。 在《麻省理工科技評論》2023年8月17日發布的中國大模型評測報告中,星火認知大模型V2.0在6個大類(共8個大類)中排名第一。  

  彎曲的直線

  對於技術成果産業化,最難的是跨越從技術牛到産品牛的鴻溝。尤其當一些科技超前於社會需求,需要堅持到某個時候,才能真正發揮重要作用,形成市場規模效益。

  二十年前,訊飛探索語音評測技術産業化時,便由於超前於社會需求,頻繁被潑冷水。直到遇見普通話測試革新技術的機會,訊飛實現計算機對單音節、多音節、朗讀等測試項的自動輔助評分,由此推動“國家普通話水平測試管理系統”上線。

  雖然這次研發投入超出了項目資金所得,但訊飛卻由此切入智慧教育領域,並開始扭虧為盈。二十年後,訊飛智慧教育産品或服務已經深入教學考評管等教育全場景,覆蓋全國32個省級行政單位及海外市場。  

  在四川省綿陽市第二中學金家林校區,初一數學教師楊昊燃正在辦公室通過智慧教育&&查看學生的測評情況,系統為每位學生知識點掌握情況都生成了畫像。他會把共性問題作為下堂課講授重點,同時借助系統為學生們推送個性化學習資源。“智慧教育所帶來的精準化,讓因材施教變得不再困難。”楊昊燃説。

  “從語音評測技術的研發、應用場景的探索,到普通話測試的應用,再到更廣泛的教育場景,最終曲線變成了直線。”劉慶峰形容訊飛的發展為彎曲的直線,雖然過程曲折,失敗更是常有的事,但堅持下去就能修成正果。

  訊飛的智慧城市業務也是這樣一條彎曲的直線,早年做電子政務,逐漸賦能交通、便民服務等各類城市生活。

  在安徽銅陵,以前治理違規戶外廣告、渣土車傾倒等難題,主要是靠一線執法人員巡查發現,如今依託“城市超腦”接入的全市1.8萬餘路可開放的視頻圖像,採用AI圖像分析,可自動感知發現違規行為,並將線索推送給相關部門。據銅陵市數據資源管理局相關負責人介紹,自2020年依託訊飛AI技術建設“城市超腦”以來,政務服務、城市應急、環境保護等領域城市治理效能明顯提升。

  智醫助理,靠海量的“知識與案例”,可以輔助村(社區)診所醫務人員提升診斷效率;汽車智能系統,讓車輛更加精準高效完成駕駛人員的指令;工業互聯網,靠大數據匯集與智能分析,賦能中小企業數字化轉型升級……訊飛AI技術已被廣泛應用於醫療、交通、工業等領域。

  攜手共赴山海

  從一粒種子到一棵大樹,訊飛的發展離不開時代的大潮。

  1985年,王仁華教授創立中科大語音實驗室(當時名為語言通信實驗室),研發條件只有60平米的房間,以及存儲器、二極管等拼裝的單板電腦,靠決心和遠見種下了夢想的種子。伴隨我國科技發展及技術成果轉化加速,訊飛在國家系列攻關項目的支撐下、在國內外研究機構的競爭與合作中成長。

  截至2024年3月,訊飛已與30多家高校院所、科研單位形成長期技術合作。“科研工作走上與實踐相結合、為實踐服務的道路,及時得到實踐的檢驗,得到不斷改進的機會。”語言學家吳宗濟曾如此表述。他所在的中國社科院語言所與訊飛成立聯合實驗室,通過語音學和工程技術的結合有效提升語音合成水平。

  從一個企業到一個集群,訊飛正在帶動上下游産業鏈更大的發展。

  2013年,工業和信息化部與安徽省在合肥高新區設立中國聲谷,希望發揮依託訊飛作為行業龍頭企業的帶動作用,這也是我國首個人工智能領域國家級産業基地。“目前聲谷已形成從基礎研究、技術研發、&&支撐到産業發展與應用的語音及人工智能産業鏈,入駐企業超2000家,年産值2000億元。”合肥市經濟和信息化局副局長王偉説。

  從一個&&到一個生態,全國範圍內越來越多創新創業者圍繞科大訊飛開放&&形成産業生態,賦能千行百業。

  在位於北京中關村的神州數碼大廈,智象未來的工作人員正在使用基於多模態大模型的工具生成視頻。據公司首席運營官王科介紹,作為一家初創公司,智象未來通過調用科大訊飛開放&&上的人工智能技術,為公司研發奠定了技術基礎。

  據了解,科大訊飛自2010年起發布開放&&,為開發者們提供語音合成與識別、語義理解、人臉識別、移動應用分析等服務,同時基於開發者們的業務成長再進行投資扶持。

  當2012年劉慶峰在發布會上説“未來每部手機、每台家電、每個玩具都能聽會説”時,台下許多人抱着懷疑態度。那時訊飛開放&&上的開發者數量增長也尚未起勢,直到2016年迎來爆發,當年新增開發者與應用數均超過過去五年之和,隨後呈現指數級上升,人工智能時代正式拉開大幕。

  截至今年3月31日,該&&已開放660項人工智能産品及能力,聚集超過638萬個開發者團隊、約229.8萬個應用,包括高德地圖、喜馬拉雅等用戶。“你或許不知道訊飛,但你一定用過訊飛技術。”有訊飛員工自豪地説。

【糾錯】 【責任編輯:吳萬蓉】