C-Eval – 一个适用于大语言模型的多层次多学科中文评估套件

Clash 小火箭 v2ray节点购买

好用的梯子,海外网络,快速稳定

Google

C-Eval - 一个适用于大语言模型的多层次多学科中文评估套件
https://cevalbenchmark.com/index_zh.html排行榜
https://cevalbenchmark.com/static/leaderboard_zh.htmlGithub
https://github.com/SJTU-LIT/ceval
#AI #排行榜 #网站 | 网站涵盖了 52 个不同学科的 13948 个多项选择题,分为四个难度级别,并且网站根据这些评估套件对模型做了个排行榜毫无意外的 GPT-4 获得了最高分!排行榜由上海交通大学和清华大学的学生提供支持

相关文章

#AI #排行榜 #网站
评论(0)
游客的头像
表情
全部评论
最新