今天,笔者无意中刷到一张图片。

据该图片显示,OpenAI的GPT-4在11个大模型中(*名序号为0),已经排到了最后。还有网友配上了“GPT4:我的冤屈怎么诉?”的字样。
这不禁让人好奇,今年年初,ChatGPT爆火以后,其他公司才开始提大模型的概念。
这才半年多,GPT就已经“垫底”了?
于是,笔者想看看GPT排名到底咋样了。
测试时间不同
测试团队不同
GPT-4排第十一
从前文中图片上显示的信息来看,这个排名是出自C-Eval榜单。
C-Eval榜单,全称C-Eval全球大模型综合性考试测试榜,是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。
据悉,该套件覆盖人文、社科、理工、其他专业四个大方向,包括52个学科,涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目,难度分为中学、本科、研究生、职业等四个考试级别。
于是笔者查看了最新的C-Eval榜单。
C-










