首頁 > 資訊 > 財經 > 正文

中文通用大模型基準測試SuperCLUE發布:GPT居首、星火第三

2023-05-10 10:46:33來源:中國證券網


(資料圖片僅供參考)

新華財經上海5月10日電 5月9日,中文通用大模型綜合性評測基準SuperCLUE正式發布。該基準測試主要關注以下問題:中文大模型在不同任務上的表現如何;與國際代表性模型相比,中文大模型的表現達到了何種程度;中文大模型與人類表現相比如何等。

該機構利用SuperCLUE測試基準,對市面上主流的支持中文的通用大模型進行了評測與排名。由于大模型會不斷迭代,所以該排行榜會定期更新,并于CLUEbenchmarks官方網站進行公示。最新排名顯示,GPT-4 一騎絕塵,已經非常接近人類的能力。國產大模型中訊飛科技研發的星火認知大模型總排名第三,國內排名第一。

該模型可通過多個層面,考驗市面上主流的中文GPT大模型的能力。一是基礎能力,包括常見的有代表性的模型能力,如語義理解、對話、邏輯推理、角色模擬、代碼、生成與創作等10項能力;二是專業能力,包括中學、大學與專業考試,涵蓋從數學、物理、地理到社會科學等50多項能力;三是中文特性能力,針對有中文特點的任務,包括中文成語、詩歌、文學、字形等10項能力。

編輯:林鄭宏

關鍵詞:

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!

關于我們 - 聯系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網站統計
 

太平洋財富主辦 版權所有:太平洋財富網

?中國互聯網違法和不良信息舉報中心中國互聯網違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(www.yuyoo.com.cn) All rights reserved.

未經過本站允許 請勿將本站內容傳播或復制 業務QQ:3 31 986 683