7月28日,科大訊飛高級別高水平多語言基座大模型國際學術研討會(以下簡稱“研討會)在上海舉辦。研討會匯聚了來自亞洲、歐洲近20個國家和地區約30位人工智能領域的産學研各界代表,10位行業資深AI專家進行了主題演講。

圍繞“共建智能語言新生態,賦能全球數字文明”主題,各國專家共商推進多語言AI技術普惠發展新路徑,探索構建更加公平包容的全球AI治理體系,以技術創新助力“全球南方”國家跨越數字鴻溝,充分展現産學研協同創新的國際合作格局。
科大訊飛研究院院長劉聰在主題演講中提出:“我們希望構建全方位的多語言大模型和它的應用,給世界提供第二種選擇。”

劉聰介紹,最新升級的星火大模型X1可以支持130多個語種,在阿語、德語、法語、韓語、日語等重點語種整體效果已處領先水平。通過混合語種路由等技術創新,星火語音大模型支持100個語種語音識別,支持55個語種語音合成,效果業內領先。
劉聰在演講中還系統闡述了訊飛星火多語種多語言大模型的下一步研發計劃。他提出,未來的多語言模型將圍繞三個核心方向展開:一是推進“語音+文本”多模態數據的共建共享,打通不同模態之間的語義壁壘;二是打造具備原生多語種語音能力的大模型底座,增強模型對全球語言生態的原生感知力;三是構建融合跨語言知識遷移能力的多語言通用大模型,實現不同語種間的知識遷移與泛化能力提升,全面支撐全球多語言AI應用發展。

科大訊飛智算業務部副總經理張驍認為,中國智算産業發展迅猛但面臨效率挑戰,行業普遍存在算力迭代過快、實際可用算力不足、存量算力使用效率偏低等痛點。針對這些挑戰,他提出需要在“算力+算法+數據”三要素基礎上,引入“應用+生態”形成五要素集合的解決思路。張驍&&,通過構建人工智能公共服務平台,實現算力高效調度和開發者生態建設,能夠讓算力資源得到有效利用,推動智算産業健康發展。
由於數字化語料稀缺,全球主流大模型對低資源語言的支持嚴重不足,小語種國家面臨AI邊緣化風險。如何彌合這一數字鴻溝,成為此次研討會各國專家共同關注的核心議題。
此次研討會展現了中國多語言AI技術在實際應用中的豐碩成果。隨着訊飛星火X1的全面升級,其多語言能力擴展至130余種,在翻譯、推理、文本生成、數學等核心能力上已能對標國際一流大模型,特別是在幻覺治理方面取得顯著突破,大大提升了大模型在行業應用中的可靠性。
至今,科大訊飛多語種技術已為華為、比亞迪、海爾等中國企業的1.2億台套設備提供語音交互支持,涵蓋23種語言,並在非洲、東南亞等國家實地落地,為“中國智造”走出去提供語言與AI能力保障。在AI技術生態建設方面,科大訊飛已開放813項AI能力接口服務全球53萬開發者,其中272項AI能力專門面向多語種需求。
此次研討會的成功舉辦,充分體現了中國在全球AI治理中的積極作用。劉聰&&,科大訊飛將以“技術賦能+生態共建”雙輪驅動,攜手全球夥伴共建開放平台,共享技術成果和應用場景,用“中國智慧”助力不同文化背景的國家彌合智能鴻溝,共同構建更加包容、更加普惠的全球人工智能生態。(閆宇)

