![]()
4月26日,訊飛星火V3.5春季上新,科大訊飛董事長劉慶峰發布訊飛星火大模型一系列新功能:
支持長文本、長圖文、長語音的大模型正式上新,首發星火圖文識別大模型,快速識別和學習多類型海量知識,行業場景下的回答更專業、更精準。
星火合同助手首次上線,審核規避合同風險、提煉總結關鍵要素、一鍵起草合同文件。星火智能評標助手升級,投標文件解析更高效,讓評標更便捷、更高效、更準確。
“多情感超擬人合成”和“一句話聲音復刻”首發,實現更生動、更具個性化的表達,帶來更有溫度的人工智能體驗。
星火智能體平臺全新發布,解決大模型企業落地最后一公里,為員工打造專屬助理,為企業解放生產力。
此外,訊飛AI學習機、星火智慧黑板、星火科研助手也進行了升級。
劉慶峰介紹:“星火APP在安卓上的下載量已經達到9600多萬次,在國內工具類通用大模型APP中排名第一。”在1月30日訊飛星火V3.5發布后,新增了55萬實名認證的開發者,其中一半以上是來自企業。
400多年前,英國哲學家弗蘭西斯·培根說:“知識就是力量,但更重要的是運用知識的技能。”400多年后的今天,訊飛星火正在成為每個人獲取知識、學習知識的“超級助手”,成為解放生產力、釋放想象力的“超級杠桿”。
春季上新,次第花開,劉慶峰最后透露:今年6月27日,訊飛星火V4.0將正式發布 。
以下為科大訊飛董事長劉慶峰發布實錄:
訊飛星火APP安卓下載量超9600萬次
國內工具類通用大模型APP排名第一
大家好!在這個春意盎然、萬物勃發的季節,我們訊飛星火春季上新了。
自從今年1月30日星火V3.5發布以來,作為首個全國產算力訓練的完全自主知識產權的大模型,訊飛星火受到了各行業伙伴和廣大開發者的廣泛歡迎。
特別是在一些關鍵行業和重大戰略領域,星火大模型“云、邊、端”的整體解決方案正在賦能汽車、家電、運營商等越來越多的行業。
![]()
在過去三個月不到的時間里,我們已經新增了55萬實名認證的開發者,這其中一半以上來自企業。
![]()
從星火APP的應用上也再次看到,使用的最高峰不是周末,而是工作日,使用的最高峰時間是在工作日上午9:30和下午3:30,也就是說,絕大部分用戶是用訊飛星火來解決和工作相關的問題的。
![]()
截止到今天,星火APP在安卓上的下載量已經達到9600多萬次,在國內所有工具類通用大模型APP中,我們是排名第一的。
![]()
我們一直在踐行用大模型、用通用人工智能解放生產力、釋放想象力的目標。
一段時間以來,我們的開發者和用戶都高度關注知識的獲取和學習的問題。這個過程中,我們不僅要解決長文本的問題,能夠把各種信息來源的海量文本快速學習,能夠進行問答,特別重要的還有在各種企業和專業行業應用的準確率的問題,尤其是在金融、汽車、政務等等非常關鍵的領域,我們希望它的回答要足夠準確。
垂直領域的知識問答
星火總體水平超GPT-4 Turbo
![]()
![]()
目前星火大模型通用長文本能力,包括長文檔信息抽取、長文檔知識問答、長文檔歸納總結、長文檔文本生成等,總體已經達到GPT-4 Turbo 今年4月最新長文本版本的97%的水平,而在多個垂直領域的知識問答任務上,星火大模型長文本總體水平已經超過GPT-4 Turbo。
另外,還有一個非常重要的問題,當我們的文本越來越長,到了幾十萬字甚至上千萬字的時候,效率是一個非常關鍵的問題,因為,長文本在后臺消耗的運算資源非常大。
這一次,我們不僅把大模型在多個領域做到業界最優,還進行了非常重要的“剪枝”和“蒸餾”,從而推出了業界最高性能的13B,也就是130億的模型來處理長文本。在效果損失僅3%以內的情況下,使得我們在文檔上傳解析、知識問答的首響時間以及文字生成上都獲得極大的效率提升,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本,星火大模型的上述性能都是業界最優的。
![]()
下面,我們把《星火相傳》這本書送到訊飛星火大模型中,看看它是如何快速學習理解和回答關鍵問題的。這本書向我們呈現了一個實驗室的研究成果,怎么經過多年探索和研究,最終在市場上試點,并變成海量用戶使用的產品這樣一個過程,它對于我們現在的源頭技術創新、產學研合作都具有非常重要的啟發意義。
下面,讓我們再次有請大家的老朋友、科大訊飛研究院院長劉聰博士來給大家演示。
首發訊飛星火圖文識別大模型
覆蓋31個場景、18種版面要素
另外,在知識的獲取和學習過程中,我們還看到,往往廣大用戶能夠拿到的資料,并不是在網上現成的海量的長文本,而是隨手可見的報刊書籍上的內容,能不能用手機一拍就成為用戶的后臺知識來源?能不能把參加各種學術研討會上拍到的PPT、上課時老師黑板上的板書以及各種同學筆記,大家分享過來,都能成為后臺知識獲取和學習的內容?
![]()
經過多年積累,科大訊飛屢次在國際圖文識別、公式識別大賽中獲得第一名。在這基礎上,這次,我們首次推出訊飛星火圖文識別大模型。圖文識別大模型可以處理非常復雜的版面分析,可以結合篇章的語義和文字的理解能力進一步提升,而且可以覆蓋更多專用領域的特殊的專業符號。
![]()
比如說,我們的圖文識別現在已經覆蓋了31個最常見的典型場景,像教育類的書刊、學術論文、專利、報紙、海報、產品白皮書、甚至PPT和菜單等都已經進行了覆蓋,從而使得它的理解能力和易用性大幅提升。
![]()
而且,對于上述場景中最常見的18種版面要素可以進行非常快速的識別和處理。例如頁眉、頁腳、標題、欄目、段落、表格、插圖等要素,甚至還包括比較難、但很實用的公式、印章、二維碼、手寫材料等。
![]()
可以看到,我們的圖文識別大模型,無論是在國際公開的權威英文測試集,還是在科研、金融以及企業產品技術文檔等等的識別效果都是業界最領先的。
![]()
星火智能評標升級
助力評標更高效更準確
基于長文本、長圖文的能力,是科大訊飛在知識獲取和學習上非常重要的代表行業的進步。
在招投標領域,智能評標助手全面升級,星火大模型優秀的文本理解、邏輯推理和數學能力,再加上本次升級的多模態知識獲取和學習能力,將進一步提升對招投標文件解析的效率、最終評標結果呈現的準確率和可靠性,以及來源佐證的豐富性。我們和國家能源物資公司在企業采購場景合作的智能無人評審系統在國資委網站上已經被作為典型案例推薦。
這一次,基于訊飛星火大模型的知識獲取和學習能力提升,我們給大家帶來一個福利。這就是星火合同助手。你去裝修房子、租賃房屋、買賣商品以及各種生活中可能會出現的糾紛,都可以用星火合同助手來更好地保護自己,來更好地防范風險。
我相信,大家在使用過程中,都會真正看到大模型給我們每個人在工作和生活中所帶來的便捷和細心的保護。
首個支持“長文本、長圖文、長語音”大模型
正式上新
除了隨時隨地用手機拍攝就能夠獲取到的各種各樣的圖片書籍等資料之外,還有很多場景需求。有些時候,我們需要從長時間的錄音、會談以及采訪中獲得資料內容,我們希望將網上看到的各種發布會、各種培訓教育視頻作為知識獲取的來源。
訊飛星火也提供了這樣一種能力,把領先的語音識別和翻譯技術結合起來,不僅僅是對中文、也對英文等等這些資料,(訊飛星火)都能夠跟純文字一樣進行快速地獲取和學習。
今天,我們首個支持長文本、長圖文、長語音的大模型正式上新。
![]()
訊飛星火持續賦能教育
訊飛AI學習機&星火智慧黑板再升級
當然,大模型賦能行業,一個全社會都高度關注的領域就是教育。今年召開的世界數字教育大會上,大模型已經成為全球在教育領域的高度共識。如何培養通用人工智能時代的人才?如何根據能力素質模型實現人機協同、更好地發展我們每個人的想象力和創造力?這已成為所有教育專家的共識。
這一次,我們又用新上線的長文本、長圖文、長語音的知識獲取和學習能力,進一步升級了在教育場景的應用。
訊飛AI學習機不僅使我們對作文的批改、對數學等理科的批改更加精準,讓智能化輔學更有針對性、更高效,而且還結合了長文本、長圖文等能力升級了百科問答功能。訊飛星火大模型理解并融合了大量圖書知識,面對孩子的奇思妙問,即使問題再復雜,愛因斯坦和他的“大咖”虛擬人朋友們都能回答,讓孩子們在趣味互動中學知識、長見識。這個功能還有一個特別重要的價值就是,能夠進一提升孩子們主動提問的意愿和能力。
![]()
星火智慧黑板也再次升級。首先是星火實錄,搭載長文本和長語音能力,可以讓轉寫效果得以提升的同時,提升篇章梳理能力。
其次是星火教師助手。以往更多的是圍繞單元教學或者課時教學,按課標和教材生成相關內容,這次融入長文本能力后,我們可以把各種優質教輔內容融入,老師在備課過程中,看到好的教輔教參的內容,馬上就可以導入,進一步豐富備課資源,提升備課效率。
本次星火大模型的升級還賦能了星火科研助手,可以把論文問答、綜述生成、實驗解讀等等的效果進一步提升,而且它獲取的來源不僅是海內外的各種報刊、學術文章,還包括更豐富的各種各樣的照片、錄音等學術資料。
![]()
首發多情感超擬人合成
一句話完成聲音復刻
訊飛星火APP上有一個非常受大家歡迎、也特別有意思的功能,就是超擬人對話。
你可以跟它隨時隨地聊天,它像真人一樣有各種各樣的感情、有生動的口語表達,還有笑聲、有語氣、有情調等等。
這段時間以來,很多人對比了我們的技術和OpenAI的Whisper,包括微軟最新發布的語音。我可以非常自豪地告訴大家,我們的語音技術一直都是行業領先!大家如果拿星火APP跟微軟對比,無論從語音的可懂度、流暢度還是表現力,我們都是超越他的。
當然,我們的技術也要不斷提升,也還有很多待完善的地方。
過去三個月,根據用戶各種各樣的反饋和建議,我們進一步提升了情緒表達的可感知度,高興、抱歉、安慰、撒嬌、困惑等這些語氣表達,比原來更加生動,也可以滿足我們用戶在各種場景下自我減壓、釋放需求,以及用星火來給周邊的朋友和親人們帶來幫助。
![]()
當然,說到超擬人對話,一個繞不過去的話題就是一直以來大家對我們提出來的“個性化合成”:能不能模仿我們家的聰明可愛的小朋友每天給爺爺奶奶讀書讀報?能不能在我們出差的時候模仿我們的聲音給孩子講故事?
實際上,科大訊飛這個技術一直都是業界領先的,而且,我們早就推向市場:
我們當年模仿志玲姐姐的聲音,需要到臺灣錄一個禮拜的聲音,后來模仿郭德綱需要一天的聲音,再往后用一個小時的聲音,再后來5分鐘的聲音,現在一句話就能模仿。當然,我們也會提供工具,如果你愿意錄更多的聲音,就可以模仿得更惟妙惟肖。
![]()
技術在不斷進步,我們希望在安全可控的前提下,能夠帶給社會更有溫度的人工智能體驗,能夠真的幫助到那些特別需要幫助的人,今天這個世界更需要有溫度的科技。
訊飛星火智能體平臺
敏捷觸達大模型企業落地的最后一公里
我們說,訊飛星火的使命是“解放生產力、釋放想象力”。解放生產力非常重要的主體就是我們各類企業,企業在知識獲取和學習中,如何把智能體更快地構建?如何更好地使用大模型的這些能力?
這一次,我們推出來全新的智能體構建的平臺:訊飛星火智能體平臺。
企業的智能體構建有幾個非常重要的環節:首先,是如何針對輸入,往往可能就是一句話的輸入,能夠精準解析出這句話所對應的相關任務;然后,要能夠把這個任務所對應的、需要的工具給它找到、調用起來;然后,還要把這個工具所需要的內外部知識信源給它打通;最終,根據相關的每一個任務的執行結果,匯總出最后的答案。這樣一個完整的過程,才能夠最終完成智能體的構建。
![]()
在這些基礎上,當構建了企業智能體的時候,還有一個非常重要的工具,就是能不能讓人工也參與進來,形成人機協同下的智能體構建,從而使得構建出來的智能體工具更高效、更可靠、更加的人機協同下的持續發展。
我覺得,這是未來的主流,線上線下結合、虛擬現實結合、人和機器結合。這一次,我們要通過技術進步,解決企業知識學習和獲取的最后一公里問題。讓每一個人都擁有屬于自己的智能體助手,解放每個人的生產力,釋放出更多精力做更有想象力、更代表未來的工作。
以上,就是我們訊飛星火V3.5春季上新的全部內容,感謝大家觀看。
同時,也敬請期待,今年6月27日,訊飛星火V4.0版正式發布。
![]()
來源:科大訊飛集團公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.