人生箴言
成熟意味着停止展示自己并隐藏自己
随机文章
- 2025年全球智能手机出货量:苹果第一 小米位列第三 !
- 2699元起 荣耀Power2开售:全球首发10080mAh电池 告别充电宝 !
- 广州车展小鹏展台现低俗视频!小鹏法务部:利用AI生成造谣的人已被拘留 !
- 全球首款RGB-MiniLED显示器来了:背光进入彩色时代 !
- 336877号小行星被命名“戚发轫星” 神舟飞船首任总设计师之名 !
- 4千元以上高端手机哪家强:苹果和华为11月全面领先 !
- 一碗面卖100元 上海网红黄鱼面塌房:多位明星博主曾打卡 !
- 年减少损失549万元!天然气压缩机断电不停机技术研发成功 !
- 4G手机依然能打:今年国内上市的机型数量比5G还多 !
- 宝马集团将换帅!齐普策明年5月结束35年职业生涯 !
11月19日消息,2025年末全球AI竞技场再掀波澜,测评机构SuperCLUE最新报告显示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基准测评中获得了70.80的总分。
它超越 GPT-5(high) 1.43 分,较GPT-5.1(high)落后1.71分,位居全球第二。Gemini-2.5-Pro目前排名全球第七。

Gemini-3-Pro-Preview的推理效率相较于Gemini-2.5-Pro有些许提升,从平均每题花费32.2秒降低到31.9秒。推理成本从24.5元/百万Tokens上升到32.0元/百万Tokens。
据了解,本次测评覆盖六大核心维度,数学推理、科学推理、代码生成(含web开发)、智能体Agent(多轮工具调用)、幻觉控制、精确指令遵循。
与GPT-5.1(high)相比,Gemini-3-Pro-Preview的优势集中体现在幻觉控制,科学推理旗鼓相当,而在其他四个方面全面落败。


