據(jù)新浪科技報道,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考“語數(shù)外”全卷能力測試。OpenCompass發(fā)布了首個大模型高考全卷評測結(jié)果。
語數(shù)外三科加起來的滿分為420分,此次高考測試結(jié)果顯示,阿里通義千問2-72B排名第一,為303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創(chuàng)公司的Mistral排名末尾。
從結(jié)果來看,大模型的語文、英語考試水平普遍不錯但數(shù)學(xué)都不及格,最高分也只有75分。
動作格斗
64.7MB
休閑益智
41MB
15.1MB
98.4MB
模擬經(jīng)營
125MB
63.1MB
游戲輔助 | 4.5GB
2024-04-24
動作格斗 | 20GB
2024-04-23
角色扮演 | 3.2GB
2024-04-22
角色扮演 | 500MB
休閑益智 | 30.17MB
2024-04-18
生活服務(wù) | 144.35MB
學(xué)習(xí)教育 | 24.26MB
2023-11-08
系統(tǒng)工具 | 6.78MB
游戲輔助 | 4.5GB
動作格斗 | 20GB
休閑益智 | 35.93MB
卡牌策略 | 19.6MB
動作格斗 | 98.31MB
角色扮演 | 372.08MB
卡牌策略 | 78.64MB
休閑益智 | 150.45MB
休閑益智 | 114MB
聯(lián)系:81537344@qq.com
CopyRight?2023 yiwangvip.com All Right Reserved 京ICP備12030808號-4
AI高考數(shù)學(xué)全不及格 語數(shù)英最高分303
據(jù)新浪科技報道,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考“語數(shù)外”全卷能力測試。OpenCompass發(fā)布了首個大模型高考全卷評測結(jié)果。
語數(shù)外三科加起來的滿分為420分,此次高考測試結(jié)果顯示,阿里通義千問2-72B排名第一,為303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創(chuàng)公司的Mistral排名末尾。
從結(jié)果來看,大模型的語文、英語考試水平普遍不錯但數(shù)學(xué)都不及格,最高分也只有75分。
動作格斗
64.7MB
休閑益智
41MB
休閑益智
15.1MB
動作格斗
98.4MB
模擬經(jīng)營
125MB
休閑益智
63.1MB
游戲輔助 | 4.5GB
2024-04-24
動作格斗 | 20GB
2024-04-23
角色扮演 | 3.2GB
2024-04-22
角色扮演 | 500MB
2024-04-22
休閑益智 | 30.17MB
2024-04-18
生活服務(wù) | 144.35MB
2024-04-18
生活服務(wù) | 144.35MB
2024-04-18
生活服務(wù) | 144.35MB
2024-04-18
學(xué)習(xí)教育 | 24.26MB
2023-11-08
系統(tǒng)工具 | 6.78MB
2023-11-08
游戲輔助 | 4.5GB
動作格斗 | 20GB
休閑益智 | 35.93MB
卡牌策略 | 19.6MB
動作格斗 | 98.31MB
角色扮演 | 372.08MB
卡牌策略 | 78.64MB
休閑益智 | 150.45MB
休閑益智 | 114MB