
圖為“陽光清言”藏語大模型成果發布會現場。記者 歐珠次仁 攝
據研發團隊介紹,模型訓練使用了約288億Token的高質量藏語數據,體量和質量均處於當前國內大模型研究領域藏語語料建設的“第一梯隊”。

圖為中國工程院院士、西藏大學教授尼瑪扎西在介紹“陽光清言”藏語大模型研發成果。記者 歐珠次仁 攝
在豐富的“知識底座”的加持下,“陽光清言”在藏語智能回答、文本生成、機器翻譯等領域有着優異的表現。
研發團隊&&,得益於千億級參數規模與高質量語料,藏語AI不再只是“大模型世界裏的一角”,而是擁有了真正匹配國際主流水平的“超級數字大腦”。

圖為“陽光清言”藏語大模型界面。
值得關注的是,“陽光清言”並非單一垂直應用模型,而是面向多行業、多場景的基座大模型。基於這一底座,可面向西藏重點領域衍生出文旅服務、文化傳承、藏醫藥發展與高原健康等一系列行業大模型,為西藏各類行業提供統一的藏語智能底座。

圖為“陽光清言”藏語大模型文本生成截圖。
“陽光清言”藏語大模型的研發,是補齊藏語在智能化發展中長期存在“數據少、算力弱、人才缺”這一短板的重要一步,使得藏語言有機會在新一輪人工智能競爭中,搶佔藏語智能領域國際技術話語權。
研究團隊已按照國家相關法規推進備案工作,待完成後將正式上線面向社會服務。
【責任編輯:雪珍】


