扎根上海張江,他要做出比肩ChatGPT的國産大語言模型

乍看到一個名喚“曹植”的國産版GPT模型時,大部分人都會有些愣神。但轉念一想,就能體會到個中深意:曹植文思敏捷、七步成詩,成為人工智能版的“曹植”,正是一個大語言模型的迭代目標。
拍板使用這個名字的,是達而觀信息科技(上海)有限公司公司創始人兼董事長陳運文。他學計算機出身,卻是一名非典型“理工男”。熱愛閱讀的他常説,自己的名字就註定了與文字為伍的“宿命”。
2015年,陳運文在張江“天之驕子孵化器”裏敲下了第一行代碼,如今達觀數據已經成長為文本智能處理技術領域的準獨角獸企業。有業內人士甚至認為,達觀數據最新推出的“曹植”系統,在垂直領域甚至不輸ChatGPT。
創業需要堅持長期主義
走進達觀數據的辦公室,映入眼簾的是一堵深灰色的企業文化墻。與其他公司的企業文化展示區不同,墻上是有關中國文字及AI發展的歷史知識,印着“中國字的發展歷史”“語言文字的知識”“現代文字的編碼與處理”等信息。
這處位於張江高科技園區浦東軟體園的辦公區域,是達觀數據的新家。2015年,陳運文帶着30餘人的團隊開始創業時,只租了孵化器裏一間20多平方米的辦公室,唯一的會議室還要和其他初創公司共享。
當時,不是所有人都能理解他的決定。從復旦大學計算機系博士畢業後,陳運文先後在百度、盛大、騰訊擔任研發和管理工作。為什麼要放棄穩定的工作,選擇艱辛的創業之路?他説,産業的廣闊發展空間、團結而有戰鬥力的團隊、火熱的創新創業氛圍都讓他堅定了在上海創業的想法。此外,張江鼓勵創新的配套政策也發揮了極大的支撐作用。“雖然孵化器空間不大,但和其他創業者一起奮鬥的感覺特別棒。”
在陳運文看來,創業的過程就好比“進窄門、走遠路、見微光”。“首先,選擇方向時要有自己的堅持,有些看上去沒那麼眾人皆知的領域,可能反而蘊藏着機會。”在人機大戰佔據人工智能主流發展趨勢時,他把目光投向文本智能處理這道“窄門”,發現了其中巨大的市場潛力。
“其次,創業者一定要堅持一點長期主義。”從人才緊缺、技術難題到業務拓展帶來的挑戰,樁樁件件都是創業路上的絆腳石。面對困難,陳運文沒有輕易放棄或者更換賽道,而是踏實做好技術開發,同時密切關注市場動向,利用人工智能技術,為金融、法律等各類主體提供辦公流程自動化、文檔智能審閱、文字識別、企業級垂直搜索、智能推薦等智能文本機器人産品。這些“機器人白領”可以代替人工從事財務、審核等量大繁瑣的工作,大幅提升了辦公效率,如今已被中國銀行、深交所等數百家單位購買使用,還在上海“一網通辦”平台上工作。
成為人工智能行業一面旗幟
八年創業,果實纍纍,陳運文的壓力卻始終沒有減輕。“壓力主要源於全球科技發展帶來的挑戰。”他感慨,近幾個月來,幾乎每天都有新的技術問世,“我們不但要緊跟這些技術,不能掉隊,還要爭取超越它們”。
“曹植”系統就是一次“超車”嘗試。憑藉多年文本智能技術積累和垂直領域場景業務經驗,達觀數據積極探索大語言模型的實踐,研發出了國産版GPT“曹植”系統,形成垂直、專用、自主可控的國産版ChatGPT模型。
陳運文認為,與ChatGPT這類通用領域生成式大規模語言模型相比,“曹植”系統最大的優勢就在於“垂直”。比如,生成券商報告對目前的ChatGPT來説是困難的,但達觀金融報告AIGC智能寫作能夠立足財經、金融市場研究寫作場景,高效地完成研究類報告撰寫,保證專業報告寫作的高質量和時效性。同時,“曹植”系統還可內置在客戶各類業務系統中提供專用服務,賦能金融、政務、製造等多個垂直領域和通用場景人工智能的落地和發展。目前系統處於內測階段,計劃今年上半年正式發布。
近年來,達觀數據在北京、深圳、成都、蘇州等地成立了子公司,服務團隊遍及全國,員工人數也從起初的30多人增加到現在的600餘人,其中“90後”已經擔當主力。“我們團隊擴張得很快。”陳運文告訴記者,光今年一季度,達觀數據就聘用了58名新員工。“我們看上的人才,阿里、騰訊、華為也都想要。”他笑言,從這個角度來説,公司一直在努力跟“大廠”搶人,“雖然很難,但對於一家科技公司來説,人才是最寶貴的資源,所以我們必須盡全力吸引優秀人才”。
引才不易,留才更難。陳運文&&,公司將持續在選、用、育、留等方面下功夫,讓更多青年人才在上海這片創新創業熱土上實現人生價值。同時,達觀數據將立足上海,將産品推廣到全國各個省市,爭取早日上市,成為上海人工智能大數據行業的一面旗幟。






