當(dāng)前位置: 首頁 > 攻略教程 > 游戲資訊 > AI高考數(shù)學(xué)全不及格 語數(shù)英最高分303

AI高考數(shù)學(xué)全不及格 語數(shù)英最高分303

時間:2024-06-20 10:05:20 編輯:易網(wǎng)VIP游戲門戶 閱讀:0

據(jù)新浪科技報道,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進(jìn)行高考“語數(shù)外”全卷能力測試。OpenCompass發(fā)布了首個大模型高考全卷評測結(jié)果。

語數(shù)外三科加起來的滿分為420分,此次高考測試結(jié)果顯示,阿里通義千問2-72B排名第一,為303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創(chuàng)公司的Mistral排名末尾。

從結(jié)果來看,大模型的語文、英語考試水平普遍不錯但數(shù)學(xué)都不及格,最高分也只有75分。