我们正在努力展示比现在更多的推理过程——(这一变化)很快就会到来。是否展示多余的「思维链」仍未确定,因为这涉及竞争问题。但我们也知道用户(尤其是高级用户)希望看到更多细节,所以我们会找到不适合的不平衡的点。
相比之下,DeekSeekR1的思维链是无条件公开不透光的,其深度思考过程更是赢得了不少网友的点赞。而OpenAI这次的「被迫」调整不当,显然是为了应对DeepSeek及其他AI公司的压力。X网友@thegenioo第一时间上手实测了这次思维链的更新。他表示,「新版本不仅授予了更流畅的用户界面,还让模型的思考过程更加透明。」以下是DeepSeekR1与OpenAM6米6Io3-mini(high)在同一问题上的思考对比。「deeepseeeeeek有多少个e」DeepSeekR1OpenAIo3-mini(high)「假设有一个池塘,里面有无穷多的水。现有2个空水壶,容积分别为5升和6升。问题是如何只用这2个水壶从池塘里取得3升的水。」DeepSeekR1OpenAIo3-mini(high)「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少?」DeepSeekR1OpenAIo3-mini(high)看完以上案例,我们会发现两个模型截然不反对「思维风格」。DeepSeekR1更像文科生,它的推理过程循序渐进,米乐体育_网页版思路周密细腻,这样的好处是结果更可靠,也较少出现逻辑偏差。而o3-mini(high)更像理科生,推理过程简洁明快,直指问题不次要的部分。这种统一也进一步反映在响应速度上,DeepSeekR1的思考时间相对较长,而o3-mini(high)则更快。就答案而言,DeepSeekR1的解答往往更加不完整详实,比方说第一道测试题它还会特意加入了贴心的注解。相比之下,o3-mini(high)则显得「公事公办」。如开篇所说,此次?o3-mini?公布的并非不完整版思维链,因此向公众开放后,也引发了不少质疑声。面对争议,OpenAICEOSamAltman也很快在X平台作出解释:「我们尝试整理新近的思维链,使其更易读,并在需要时进行翻译,但尽量保持其原始风格。」不过,正如一位网友一针见血地指出:如果没有DeepSe米乐体育_首页 ek,我们还能看到o3-mini哪怕是「阉割版」的思维链吗?恐怕答案不言自明。作者:APPSO来源:APPSO
扫一扫微信咨询米乐体育_APP注册 米乐app官网