当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
你生活中做过最自律的一件事是什么?
为什么大家不再提星链了(包括外网)?
为什么国内的黄***站不被查封?是难发现吗?
敢不敢发一张你的自拍照?
全平台应用框架会是趋势吗?flutter、tauri、maui你更看好哪一个?
人究竟可以悲惨到什么程度?
能分享你相册里最青春的照片吗?
金山办公继续聘任雷军为“名誉董事长”,但不享权利、不担义务、不领薪酬,这个头衔的实际意义是什么?
俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
Rust的工程配置为何用toml格式?
学编程要不要买电脑?
能分享一下你写过的rust项目吗?
中了一个亿 你会做什么?
买到烂尾楼到底该有多绝望?
用K8s的公司有多少人会部署K8s?
Golang和J***a到底怎么选?
为什么抱10kg的小孩比抱10kg的大米,感觉上要轻?
2025 年有哪些值得关注的开源项目?
女明星做了什么医美项目保持童颜?
有人对sse(server sent events)了解的吗?
新婚不久,老婆的闺蜜搬进来一起住,是什么意思啊?
本人女20,平胸跟男生一样怎么办 ?
一万亿人民币和龙珠一万战斗力,你选择哪个?
亲眼见到明星本人是什么体验?
我的儿子随我姓,为啥婆家反应那么大?
实体店为什么生意越来越难做了?
《甄嬛传》中祺贵人为什么和甄嬛反目?
为什么没有人在意iPad Pro 2024标准版仅搭载的8GB内存(RAM)?
怎么看待准噶尔部被灭族?