如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？_湖北省荆州市荆州区秦细水利水电设施有限责任公司

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

魏都区

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

专探乡

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

秦溪镇

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

结斯乡

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

纪畔乡

梁山镇魏都区专探乡秦溪镇结斯乡纪畔乡

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？_湖北省荆州市荆州区秦细水利水电设施有限责任公司

联系人：

手机：

E-mail：

地址：

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

发布时间：2025-06-24 21:10:16 人气：

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 长期使用的大佬来说说，MacOS 真的比 Windows 稳定吗？

下一篇 : 小米澎湃OS和华为鸿蒙OS，他们有什么不一样，谁更有发展前途？

相关新闻

PHP现在真的已经过时了吗？一个社区语言能泛起多大浪花？PHP30周年线上活动PHPve...
为什么 macOS 并不差，可市场总敌不过 Windows？我两个都用，有一天忽然想到一个问题，就苹果电脑的体量，愿意做...
想买一台显示器，主要用于设计和办公，4K分辨率最好，刷新率不追求，1500左右的有吗？ MacBook Air/Pro 的痛点，就是屏幕太小，有必要...
为什么中国刀在国际上不如日本刀出名？很简单，冷兵器已经失去了实用功能，而流传下来的日本刀的保存状...
老婆生了孩子，我对她完全没有感觉怎么办？我生了两个娃，我老公还是很喜欢我，说我的身材很火辣，很***...
消息称三大运营商将于今年下半年全面重启eSIM，eSIM有哪些好处？为何此前暂停这一业务？个人办个号，材料审核大半天，多打几个电话，或者接到海外电话，...

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？_湖北省荆州市荆州区秦细水利水电设施有限责任公司

地址：

手机：　联系人：

邮箱：

辽-ICP备88026917号-1|网站地图

版权@|备案:辽-ICP备88026917号-1|网站地图备案号：

在线客服

客服

联系方式

热线电话

上班时间

周一到周五

公司电话

二维码

在线客服