吴梦梦av一区二区三区,啊啊啊啊操我好爽视频在线观看,国产乱乱无码,久久精品亚洲天堂av

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

最新!OpenAI上架推理模型o3-mini,首次向免費(fèi)用戶開放!AIME測試中,o3-mini最高準(zhǔn)確率達(dá)87.3%

每日經(jīng)濟(jì)新聞 2025-02-01 07:49:09

當(dāng)?shù)貢r間1月31日,OpenAI正式推出全新推理模型o3-mini,并首次向免費(fèi)用戶開放。測試顯示,在美國數(shù)學(xué)邀請賽(AIME 2024)中,o3-mini的準(zhǔn)確率隨推理努力提升,最高可達(dá)87.3%,速率也顯著優(yōu)于前代o1-mini。在編程競賽及通用知識評測中,o3-mini表現(xiàn)優(yōu)異,響應(yīng)速度比o1-mini快24%。

每經(jīng)編輯 杜宇

當(dāng)?shù)貢r間1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免費(fèi)用戶開放推理模型。這是OpenAI推理系列中最新、成本效益最高的模型,現(xiàn)在已經(jīng)在ChatGPT和API中上線。

圖片來源:OpenAI

輕量級推理大模型o3-mini最早于2024年12月的直播活動中亮相,一同亮相的還有“滿血版”的o3模型。OpenAI宣稱,o3具備更先進(jìn)、近似人類的推理能力,在解決編程、數(shù)學(xué)、科學(xué)等理工科問題方面均超越現(xiàn)役的o1模型。OpenAI曾表示,o3-mini會在2025年1月底先上架,o3則“會在不久之后推出”。

OpenAI介紹稱,o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”的選項(xiàng)——分為低、中、高三個級別。這種靈活性使得o3-mini可以在面對難題時“更努力思考”,而需要效率時優(yōu)先考慮回應(yīng)速度。

在當(dāng)?shù)貢r間1月31日的新聞稿中,OpenAI披露,在2024年美國數(shù)學(xué)邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng)。在最高努力水平時,o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。

在博士級科學(xué)問題(GPQA Diamond)方面,三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%。

FrontierMath前沿數(shù)學(xué)與Codeforces等編程競賽方面,o3-mini也顯示出明顯優(yōu)勢,甚至在某些評測中遠(yuǎn)超前代模型。

通用知識方面,在各種知識評測中,o3-mini的表現(xiàn)也超過了o1-mini,能夠?yàn)橛脩籼峁└鼫?zhǔn)確的答案。

在智能水平與o1相當(dāng)?shù)那疤嵯?,o3-mini提供了更快的性能和更高的效率。除了上述提及的STEM評估之外,采用中等推理努力的情況下,o3-mini在數(shù)學(xué)和事實(shí)性評估中也展現(xiàn)出更出色的表現(xiàn)。在A/B測試中,o3-mini的響應(yīng)速度比o1-mini快24%,其平均響應(yīng)時間為7.7 秒,而o1-mini為10.16 秒。延遲方面,o3-mini的首個token平均比o1-mini快2500毫秒。

橫向?qū)Ρ?,DeepSeek-R1模型在AIME 2024測試中的準(zhǔn)確率為79.8%,而在GPQA Diamond測試中的準(zhǔn)確率為71.5%。

有專家在社交媒體表示:受DeepSeek影響,OpenAl現(xiàn)在也顯示推理模型的思維過程了。

此外,對于付費(fèi)用戶,o3-mini將在模型選擇器中替代o1-mini。作為升級的一部分,每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無限制地訪問o3-mini。

每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、公開資料

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

MINI 模型 Ai

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

露脸国产真实精品自在| 精品免费国产观在线| 在线视频精品免费一区| 亚洲国产欧美国产综合在线一区| 午夜在线a级毛片| 久久久久久无码免费| 亚洲无码污黄视频| 5D肉蒲团奶吃| 综合激情97| 久久国产中文亚洲| 精品国产三级A在线| www.亚洲一区| 下面好爽视频在线观看| 久久超级碰热视频人人国产| 久久久留| 亚中文字幕区七| 精品日韩亚洲欧美高清a| 激情综合激情五月俺也| 亚洲丰满少妇人妻| www黄在线观看| 亚洲一级内射涩爱av| 亚洲一区88| 国产亚洲av片在线观看16女人 | 欧美精品午夜久久久伊人| 少妇国模无码人体一区二区| 国产99色片高清免费看| 欧美限制午夜精品| 亚洲精品乱码久久久久久按摩| 99热精品国产三级在线| 亚洲天天综合色制服丝袜在线| 色欲国产精品国产AV片国产| 在线色天堂| 日韩特级AV毛片| 日本电影成人一区| 亚洲黄色视频国产无码99| 日韩亚洲最大综合精品网站| 99热这里只有精品中文无码 | 伊人久久凹凸视频| 厕所露脸精品一区二区| 超碰群交| 久久精品视频国产刘涛|