今日,首次实现思考OpenAI新款AI模型o3、图像o4-mini重磅发布,重磅这是发布OpenAI迄今最强、最智能的首次实现思考模型。
据了解,图像OpenAI o3/o4-mini首次具备真正的重磅视觉推理能力,看图识图已经是发布小菜一碟了,现在还会看图思考。首次实现思考
OpenAI o3/o4-mini能同时处理文本、图像图像和音频,重磅并且能作为Agent智能体自动调用网络搜索、发布图像生成、首次实现思考代码解析等工具以及深度思考模式。图像
通过强化学习,重磅OpenAI训练了o3/o4-mini如何使用工具,不仅知道如何用、何时用,还能以正确格式快速生成可靠答案。
测试结果显示,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,远超前代o1的74.3%。
在AIME 2025题目中,两者准确率分别达88.9%和92.7%,在Codeforces编程竞赛评分中,支持终端工具的o3和o4-mini分别取得了2706和2719的ELO分数,领先o1的1891和o3-mini的2073。
即日起,ChatGPT的Plus、Pro会员以及Team用户可直接体验o3、o4-mini和o4-mini-high。
2025-07-18 22:37360人浏览
2025-07-18 22:371778人浏览
2025-07-18 21:562479人浏览
2025-07-18 21:551376人浏览
2025-07-18 21:22638人浏览
2025-07-18 20:222781人浏览
根据市场研究公司IHS,2016年第三季度中国的太阳能光伏装机量预计急速下降,下降幅度达80%。这将引发大部分国家太阳能需求放缓,从而导致大部分国家太阳能光伏组件供过于求,尤其是太阳能电池组件。IHS
海峡网讯 据海峡导报报道 孩子明明考了90分,竟然还是全班倒数――90分以下的根本没剩几人。眼下,岛内外学校都已完成了期中考试,许多第一年当小学生家长的爸爸妈妈突然发现,时代真的不同了,连一年级的期中
“五一”假期,洪雅县柳江古镇景区迎来了各地游客。为给游客带来更好的游玩体验,景区准备了丰富多彩的节目,受到游客欢迎。5月1日上午,一场独具特色的民俗文化表演在柳江古镇老榕树下上