两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
各双拼输入方案之间有明显的优劣之分吗?
能发一张在暧昧期的聊天记录吗?
obsidian用一两年后会有多大?全文搜索还快吗?
为什么那么多美国人对特定食物过敏,而在中国很少听说?
如何评价DuckDB?
几年前吹得神乎其神的福建舰电磁弹射为什么现在销身匿迹了?
蔚来怎么感觉有点方寸大乱呢?
你为什么卸载了火绒?
27寸显示器有必要上4K吗?
如何在不重装系统和软件的情况下换系统盘?
Mini-LED 显示器有什么特点,是否值得入手?
***如你财务自由,是买一个大平层还是买一个大别墅?
如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑?
程序员的时间管理真的是写代码1小时,调试8小时吗?
一个非常漂亮的残疾女孩,会有人愿意娶吗?
cloudflare的1.1.1.1和warp有什么区别?
有一张巨强的显卡是什么体验?
你知道哪些关于夏天的冷知识?
西班牙拒绝执行北约提高军费开支至GDP 5%的目标,透露哪些信息?
为什么 macOS 并不差,可市场总敌不过 Windows?
你身边身材最好的女生是什么样?
为什么现在推出跨境支付通?
不限制语言,客户端GUI开发用什么好?
为什么买的小乌龟总是养不活呀?
山姆超市是怎么在中国火起来的?