两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
上一篇 : 全世界都在等中美开战吗?
下一篇 : 小米发布了 REDMI 首款旗舰小平板 K Pad,仅 8.8 英寸,小巧便携,如何评价这一设计?
你捡过最大的漏是什么?...
国内***购 5000 万台电脑,***用100% 国产芯和操作系统,意味着什么?...
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?...
人常说女人味,到底是个什么味?...