中文通用大模型基準測試SuperCLUE發布：GPT居首、星火第三

2023-05-10 10:46:33來源：中國證券網

(資料圖片僅供參考)

新華財經上海5月10日電 5月9日，中文通用大模型綜合性評測基準SuperCLUE正式發布。該基準測試主要關注以下問題：中文大模型在不同任務上的表現如何；與國際代表性模型相比，中文大模型的表現達到了何種程度；中文大模型與人類表現相比如何等。

該機構利用SuperCLUE測試基準，對市面上主流的支持中文的通用大模型進行了評測與排名。由于大模型會不斷迭代，所以該排行榜會定期更新，并于CLUEbenchmarks官方網站進行公示。最新排名顯示，GPT-4 一騎絕塵，已經非常接近人類的能力。國產大模型中訊飛科技研發的星火認知大模型總排名第三，國內排名第一。

該模型可通過多個層面，考驗市面上主流的中文GPT大模型的能力。一是基礎能力，包括常見的有代表性的模型能力，如語義理解、對話、邏輯推理、角色模擬、代碼、生成與創作等10項能力；二是專業能力，包括中學、大學與專業考試，涵蓋從數學、物理、地理到社會科學等50多項能力；三是中文特性能力，針對有中文特點的任務，包括中文成語、詩歌、文學、字形等10項能力。

編輯：林鄭宏

關鍵詞：

責任編輯：孫知兵

免責聲明：本文僅代表作者個人觀點，與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關內容。
如有問題，請聯系我們！

精彩推薦

上海“大零號灣”，何以打造世界級科創灣區？|當前獨家

閱讀排行

前沿資訊!渣打證券CEO耿琳：將專注固收領域進一步助力跨境市場聯通
上一篇2023-05-10 10:56:23

未經過本站允許請勿將本站內容傳播或復制業務QQ：3 31 986 683

中文通用大模型基準測試SuperCLUE發布：GPT居首、星火第三

精彩推薦

上海“大零號灣”，何以打造世界級科創灣區？|當前獨家

閱讀排行

推薦閱讀