剛剛,GPT-4.5發(fā)布!OpenAI最大最貴模型,主打情商高

剛剛,GPT-4.5發(fā)布!OpenAI最大最貴模型,主打情商高
2025年02月28日 05:19 網(wǎng)易新聞

GPT-4.5正式發(fā)布,號稱OpenAI最大最好的聊天模型。

但很意外啊,這么大的事奧特曼都不來。

這次OpenAI也不打算秀炫酷的解題,也不打算曬各種榜單的排名,反而強調(diào)起了情商。

第一個現(xiàn)場演示:

o1意識到這樣會“友盡”,但也只是很忠實的按要求完成了任務(wù)。

GPT-4.5甚至都沒完成提示詞中的任務(wù),但整個互動顯得更自然了:

第二個現(xiàn)場演示,強調(diào)GPT-4.5掌握更多世界知識,以及講述知識的方式更自然。

GPT-4 Turbo掌握很多知識,但回答就像是在炫耀它很有知識,只是把事實羅列在一起。

同樣這些知識,GPT-4.5的語氣更有互動感,還考慮到用一句簡潔的開場,讓用戶更容易記住三個關(guān)鍵詞。

面對更專業(yè)的問題“用第一性原理解釋AI對齊的必要性”,o1的回答像是寫論文,而GPT-4.5通過“第1步、第2步、第3步……”來引導(dǎo)用戶思考這個問題。

除了演示之外,直播中也透露了GPT-4.5開發(fā)過程的一些內(nèi)幕:

如“激進地”使用了低精度訓(xùn)練,預(yù)訓(xùn)練階段跨多個數(shù)據(jù)中心完成。GPT-4.5會成為未來推理模型的基礎(chǔ)模型

從今天起,GPT-4.5開放給200美元一個月的Pro用戶。下周逐步開放給20美元一個月的Plus用戶。

技術(shù)報告中表示:GPT-4.5不是一個前沿模型,但它是OpenAI最大的語言模型,比GPT-4的計算效率提高了10倍以上。

OpenAI稱通過擴展無監(jiān)督學(xué)習(xí)和推理提升AI的能力。

GPT?4.5通過擴展計算和數(shù)據(jù)以及架構(gòu)優(yōu)化擴展了無監(jiān)督學(xué)習(xí),擁有更廣泛的知識和更深入的世界理解能力,所以幻覺更少。

在衡量LLM事實準確性的SimpleQA基準上,GPT-4.5準確率62.5%,幻覺率37.1%,比GPT-4o、o1、o3mini優(yōu)化了不少。

以下是一個具體的幻覺降低的案例。

假如用戶詢問“第一種語言是什么”,GPT-4.5會誠實回答不知道、這還是人類未解之謎,而不是隨便蒙一個答案。

此外,Blog中還稱開發(fā)了新的可擴展的技術(shù),能夠利用從小型模型衍生出的數(shù)據(jù)來訓(xùn)練更大更強的模型,由此提升了GPT?4.5的可操控性、對細微差別的理解以及自然對話能力。

在人類偏好評估中,測試者更傾向于選擇GPT?4.5而非GPT?4o。

OpenAI表示,GPT?4.5對人類意圖的理解更深刻,能夠以更細膩的“情商”解讀微妙的線索或隱含的期望,還展現(xiàn)出了更強的審美直覺和創(chuàng)造力,在協(xié)助寫作和設(shè)計方面表現(xiàn)出色。

比如,當(dāng)用戶表達“考試不及格、很難過”,它會安慰、鼓勵用戶。作為對比,4o給出的回答就更加冰冷,沒什么安慰的話語。

在一些回復(fù)上,GPT?4.5對比4o回答也更簡潔。

另外,OpenAI還曬出了GPT?4.5在標準學(xué)術(shù)基準測試中的結(jié)果,全面超越GPT-4o,在SWE-Lancer Diamond(coding)和MMMLU(multilingual)上超越o3-mini。

值得一提的是,GPT-4.5的API定價非常貴。

75美元/百萬tokens輸入、150美元/百萬tokens輸出。

對比GPT-4o,定價高出去15-30倍。

到底這個價格值不值呢?不少人已經(jīng)分享了搶先體驗的效果。

拿到內(nèi)測的博主表示,實際使用中GPT-4.5非常有創(chuàng)造力、一定上了很多人文課。

他還列舉了GPT-4.5視覺理解能力很強的例子。它能從這張星露谷截圖中發(fā)現(xiàn)非常小的元素蝴蝶。他還列舉了GPT-4.5視覺理解能力很強的例子。它能從這張星露谷截圖中發(fā)現(xiàn)非常小的元素蝴蝶。

“獨角獸評估”的實測表現(xiàn)也很好。

后續(xù)隨著更多實測放出,應(yīng)該還能看到更多有意思的例子。

最后,大家一定很關(guān)心,奧特曼去哪了呢?

在醫(yī)院照顧小孩。

是的,他最近剛剛喜提一子。

直播回放:https://www.youtube.com/watch?v=cfRYp0nItZ8

參考鏈接:https://openai.com/index/introducing-gpt-4-5/

海量資訊、精準解讀,盡在新浪財經(jīng)APP
直播

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經(jīng)公眾號
新浪財經(jīng)公眾號

24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 03-10 江南新材 603124 --
  • 03-07 恒鑫生活 301501 --
  • 03-04 弘景光電 301479 --
  • 02-28 漢朔科技 301275 27.5
  • 02-28 永杰新材 603271 20.6
  • 新浪首頁 語音播報 相關(guān)新聞 返回頂部