(資料圖片)
人民網(wǎng)上海7月 7日電 (記者唐小麗)今天下午,正值2023世界人工智能大會舉辦期間,由語言智能科技企業(yè)蜜度主辦的“語言智能與內(nèi)容生成高峰論壇”在上海世博展覽館舉行。論壇現(xiàn)場,蜜度發(fā)布了自研的國內(nèi)首個專為智能校對領域打造的垂直大語言模型——蜜度文修。
蜜度文修正式發(fā)布。蜜度供圖
“‘唐宋八大家’之一的歐陽修曾任館閣??保?,亦有修文之意,文修便取名于此?!泵鄱戎悄苄κ聵I(yè)部總經(jīng)理張曉娟一語道出了名字的由來。
張曉娟介紹,蜜度文修以大語言模型為技術底座,通過運用高質(zhì)量數(shù)據(jù)學習多種特色子任務,可以大幅度提升中文校對和潤色能力的智能化程度?!熬劢剐侣劤霭妗⒚襟w稿件、政府公文等專業(yè)領域,蜜度文修能夠輔助專業(yè)用戶提高校對質(zhì)量、提升校對速度、降低差錯率,為新時代語言文字工作高質(zhì)量發(fā)展賦能?!?/p>
早在2020年,蜜度就推出了智能文本檢測服務,并以深度學習模型為方向,嘗試智能化解決基礎校對問題。蜜度還成立了多語言校對檢測實驗室,圍繞“文字標點差錯”“知識性差錯”“內(nèi)容導向風險識別”三個主要能力開展建設。在去年的世界人工智能大會上,蜜度發(fā)布了支持本地化部署的蜜度校對通AI-Box,這也是首個通過華為昇騰AI生態(tài)認證的自然語言處理智能文本校對應用解決方案。今年年初,蜜度智能校對系統(tǒng)成功入選國家新聞出版署2022年出版業(yè)科技與示范創(chuàng)新項目“科技創(chuàng)新成果”。
今年4月,蜜度智能校對多語言版正式上線,除了漢字、英文之外,還覆蓋了蒙古文、藏文、維吾爾文、朝鮮文等12種少數(shù)民族語言文字。6月,蜜度正式推出中文潤色服務,重點解決用詞不當、句式雜糅等措辭與表述問題。
而今天,在世界人工智能大會的現(xiàn)場,蜜度推出全新的蜜度文修,讓大模型時代的全新工作范式走入校對場景,除了刷新多類校對任務的最佳效果之外,完善了過去較為薄弱的易混詞細微語義辨析難題,同時在尊重原意表達的基礎上,更好地修正句式雜糅、邏輯錯亂等問題,使句子表達更流暢,實現(xiàn)對句子的潤色功能。蜜度文修的發(fā)布,可以視為蜜度在大模型時代,采用與時俱進的前沿科技積極賦能垂直辦公場景的一次實踐。
關于全新發(fā)布的蜜度文修,張曉娟認為,創(chuàng)新點主要集中在兩個方面:一是引入多任務學習策略提升校對能力,設計了與校對任務密切相關的多種子任務,讓模型進行自監(jiān)督學習,通過做關聯(lián)任務提升校對的智能化程度;其次,大幅度提升模型學習的數(shù)據(jù)質(zhì)量,引入自動化手段對大規(guī)模數(shù)據(jù)進行質(zhì)量評估,解決噪音數(shù)據(jù)對校對任務影響更為敏感的問題。
“其實,蜜度的產(chǎn)品一直深度活躍在各類辦公和業(yè)務發(fā)展場景里?!泵鄱仁紫夹g官劉益東談到,在前大模型時代,蜜度就用當時的新銳計算機技術幫助用戶實現(xiàn)辦公場景的數(shù)字化、智能化轉(zhuǎn)型升級,“現(xiàn)在,大模型讓我們的產(chǎn)品和服務更為強大,我們從客戶那里感知到的是,經(jīng)由AI大幅度提升的效率和精準度,不僅讓用戶體驗更好,也讓業(yè)務增速更快?!?/p>