AI来做2024高考:最高分303
近日,上海人工智能实验室旗下的司南评测体系OpenCompass,对七个不同来源的大模型进行了高考“语数外”全卷能力测试。6月19日,OpenCompass公布了这一开创性评测的初步结果。
在总分420分的三科测试中,阿里通义千问2-72B以303分的优异成绩位居榜首,紧随其后的是OpenAI的GPT-4o,得分296分。参与此次测试的模型来自不同的领域和机构,包括阿里巴巴、零一万物、智谱AI、上海人工智能实验室,以及法国Mistral的开源模型。
从评测结果来看,大模型在语文和英语方面的表现普遍较好,但在数学方面则显得力不从心。最高分仅为75分,由书生·浦语2.0获得,而GPT-4o也取得了73分的不错成绩。在语文方面,通义千问拔得头筹,而在英语方面,GPT-4o则独占鳌头。
已有0位网友发表了看法
精彩专题推荐
AI来做2024高考:最高分303
麻将在美国的首次亮相与本土化改造
2024年六月LPR稳定未变
揭秘红豆薏米水的真正功效
遭遇中暑的紧急措施
2024浙江省电动自行车质量抽查
北京高考成绩揭晓在即,6月25日起多渠道可查分!
时尚印花美成画 会穿衣女纸才是天仙攻
站在夏天的尾巴上 买条中裤抓紧时髦一下
五大单品打造一个完美女人 想当女神请看过来
谁说夏天不能穿靴子?明星不分四季混搭逆袭
入伏天穿凉爽吊带 就这个Feel倍儿爽
短裤短裙能有多短 8条小建议穿着得体
腰部镂空露肤 教你如何展现完美身材曲线
露出肩膀锁骨 最优雅的夏季露肤计划
露出性感小蛮腰 街头达人演绎Crop上衣穿搭
要时髦不要病号服 竖条纹的实用5搭
复古风又吹来了?但今年特爱布尔乔亚色!
时髦星人都在穿的All White 让戛纳街头比红毯还好看!
米兰男装周:王子异走秀成瘾欲成职业男模?
- 精彩推荐
- 热点排行
- 星辉娱乐涨停:西班牙足球俱乐部晋级西甲
- 网购奢侈品有“七天无理由退货”权益?
- 教你节省装修预算的技巧
- 女明星减肥的独家秘密
- 夏日瘦身口诀:饮食与运动的结合
- 酒窝发型的无尽魅力究竟源自何处?
- 独特的美肤秘诀
- 五个配色公式穿出高级女人美
- 像街拍达人这样穿 才有机会被邀请去时装周
- 说基本款不好看的都退后 看大飒蜜美上天!
- 站在夏天的尾巴上 买条中裤抓紧时髦一下
- 五大单品打造一个完美女人 想当女神请看过来
- 谁说夏天不能穿靴子?明星不分四季混搭逆袭
- 入伏天穿凉爽吊带 就这个Feel倍儿爽
- 短裤短裙能有多短 8条小建议穿着得体
- 腰部镂空露肤 教你如何展现完美身材曲线
- 露出肩膀锁骨 最优雅的夏季露肤计划
- 露出肩膀锁骨 最优雅的夏季露肤计划
- 露出性感小蛮腰 街头达人演绎Crop上衣穿搭
- 露出性感小蛮腰 街头达人演绎Crop上衣穿搭
热点文章