少妇流白浆普通话对白,亚洲AV片无码久久五月,AVTT2020手机在线,久久精品熟妇丰满人妻99

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

DeepSeek最新模型硬剛o1！英偉達(dá)科學(xué)家等大佬：這才配叫OpenAI

每日經(jīng)濟(jì)新聞 2025-01-21 19:08:09

1月20日，月之暗面推出多模態(tài)思考模型Kimi k1.5，DeepSeek開(kāi)源R1推理模型，雙雙“硬剛”O(jiān)penAI。性能測(cè)試顯示，這兩款模型在多項(xiàng)測(cè)試中能與o1“叫板”。R1更是得到英偉達(dá)高級(jí)研究科學(xué)家Jim Fan等一眾業(yè)界大佬的稱(chēng)贊。不過(guò)，R1與開(kāi)源模型V3一樣，面臨著幻覺(jué)問(wèn)題。

每經(jīng)記者｜岳楚鵬每經(jīng)編輯｜蘭素英

OpenAI怎么也沒(méi)想到，o3還在畫(huà)餅階段，中國(guó)一夜之間就冒出來(lái)兩個(gè)能和o1打?qū)ε_(tái)的模型。

1月20日，月之暗面正式推出多模態(tài)思考模型Kimi k1.5，并首次公開(kāi)該模型的訓(xùn)練技術(shù)報(bào)告。

Kimi k1.5在short-CoT（短鏈思考）方面達(dá)到領(lǐng)先水平，在其他多個(gè)測(cè)試中也大幅超越GPT-4和Claude Sonnet 3.5。在Long-CoT（長(zhǎng)鏈思考）方面，該模型在多個(gè)領(lǐng)域的表現(xiàn)也與o1持平。

同一天，DeepSeek也正式開(kāi)源R1推理模型，并發(fā)布技術(shù)報(bào)告。R1在多個(gè)基準(zhǔn)測(cè)試中也與o1持平，并且成本只有o1的三十分之一。

隨著R1模型的開(kāi)源，英偉達(dá)科學(xué)家Jim Fan稱(chēng)：“我們生活在這樣一個(gè)時(shí)代：由非美國(guó)公司保持OpenAI最初的使命——做真正開(kāi)放的前沿研究、為所有人賦能。”Perplexity CEO Aravind Srinivas表更是直言：“DeepSeek才配叫做OpenAI。”

不過(guò)，R1依然面臨著開(kāi)源模型V3一樣的毛病。有網(wǎng)友向它提問(wèn)“誰(shuí)訓(xùn)練你的”時(shí)，它回答道：“我是被OpenAI開(kāi)發(fā)的”。

DeepSeek、Kimi新模型發(fā)布“撞車(chē)”，硬剛OpenAI

北京時(shí)間1月20日，月之暗面發(fā)布了多模態(tài)思考模型Kimi k1.5。

在short-CoT模式下，Kimi k1.5的數(shù)學(xué)、代碼、視覺(jué)多模態(tài)和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet，領(lǐng)先幅度高達(dá)550%。在Long-CoT模式下，Kimi k1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力達(dá)到了OpenAI o1正式版的水平。

月之暗面表示，這應(yīng)該是全球范圍內(nèi)，有OpenAI之外的公司首次實(shí)現(xiàn)o1正式版的多模態(tài)推理性能。

圖片來(lái)源：X

同一天，DeepSeek也正式開(kāi)源R1推理模型，允許所有人在遵循MIT License（注：被廣泛使用的一種軟件許可條款）的情況下，蒸餾R1訓(xùn)練其他模型。

在數(shù)學(xué)、代碼和自然語(yǔ)言推理等任務(wù)上，R1的性能比肩o1正式版。同時(shí)根據(jù)DeepSeek公布的測(cè)試數(shù)據(jù)，R1在美國(guó)AIME 2024、MATH-500和SWE-bench Verified測(cè)試中的比分均高于o1。AIME 2024和MATH-500測(cè)試專(zhuān)注于數(shù)學(xué)能力，SWE-bench Verified則用于評(píng)估AI模型解決現(xiàn)實(shí)世界軟件問(wèn)題的能力。

圖片來(lái)源：X

更重要的是，R1的價(jià)格只有o1的約三十分之一，百萬(wàn)token輸出只需16元人民幣，相較而言，o1的百萬(wàn)token輸出需要60美元（約合人民幣436元）。

圖片來(lái)源：DeepSeek官網(wǎng)

另外，R1的參數(shù)量較低，開(kāi)發(fā)人員可以用相對(duì)較低的成本在本地運(yùn)行模型。Exo Lab創(chuàng)始人Alex Cheema在家使用7個(gè)MacMini串聯(lián)一個(gè)MacBook成功運(yùn)行起了R1模型。他感嘆道：“AGI（通用人工智能）到家了。”

圖片來(lái)源：X

英偉達(dá)科學(xué)家等大佬：DeepSeek才配叫OpenAI

R1的技術(shù)文檔發(fā)布后，英偉達(dá)高級(jí)研究科學(xué)家Jim Fan第一時(shí)間對(duì)論文進(jìn)行研究，之后發(fā)出了這樣的感慨：“我們生活在這樣一個(gè)時(shí)代：由非美國(guó)公司保持OpenAI最初的使命——做真正開(kāi)放的前沿研究、為所有人賦能。”

他補(bǔ)充道：“DeepSeek-R1不僅開(kāi)源了大量模型，還泄露了所有訓(xùn)練秘密。他們可能是第一個(gè)顯示 RL（強(qiáng)化學(xué)習(xí)）飛輪發(fā)揮主要作用、持續(xù)增長(zhǎng)的OSS項(xiàng)目。（對(duì)AI研究的）影響不僅可以通過(guò)‘內(nèi)部實(shí)現(xiàn)了ASI’或‘草莓計(jì)劃’等神話名稱(chēng)來(lái)實(shí)現(xiàn)，也可以通過(guò)簡(jiǎn)單地轉(zhuǎn)儲(chǔ)原始算法和matplotlib學(xué)習(xí)曲線來(lái)產(chǎn)生影響。”

Jim Fan的每一句話都在戳喜歡搞神秘，賣(mài)期貨的OpenAI的肺管子。

圖片來(lái)源：X

實(shí)際上，業(yè)界有這種看法的人還不少。Abacus ai的CEO Bindu Reddy評(píng)價(jià)道：“這是開(kāi)源AGI的勝利，一家來(lái)自中國(guó)的小型初創(chuàng)公司擊敗了所有人”。

UC Berkeley教授Alex Dimakis也認(rèn)為，DeepSeek現(xiàn)在已經(jīng)處于領(lǐng)先位置，美國(guó)公司可能需要迎頭趕上了。

Perplexity CEO Aravind Srinivas表更是直言：“DeepSeek才配叫做OpenAI。”

圖片來(lái)源：X

除了對(duì)OpenAI的諷刺之外，Jim Fan還深入解讀了R1模型的創(chuàng)新之處。

他表示，R1模型純粹由RL驅(qū)動(dòng)，完全沒(méi)有SFT（“冷啟動(dòng)”）。這讓人想起 AlphaZero——從頭開(kāi)始掌握圍棋、將棋和國(guó)際象棋，而無(wú)需先模仿人類(lèi)大師級(jí)的動(dòng)作。

而且，R1使用由硬編碼規(guī)則計(jì)算的真值獎(jiǎng)勵(lì)，避免使用任何RL容易攻擊的學(xué)習(xí)獎(jiǎng)勵(lì)模型。隨著訓(xùn)練的進(jìn)行，模型的思考時(shí)間穩(wěn)步增加。Jim Fan強(qiáng)調(diào)，這不是預(yù)先編程好的，而是一種模型自主的突發(fā)特性，并且模型也出現(xiàn)了自我反省和探索行為。

DeepSeek還使用了一種名為GRPO（組相對(duì)策略優(yōu)化）的新優(yōu)化方法，有效減少了內(nèi)存使用。GRPO由DeepSeek于2024年2月發(fā)明。這也是為什么家用設(shè)備也能完整運(yùn)行R1的原因。

基于此，有網(wǎng)友指出，鑒于Deepseek仍在使用GRPO等GPU性能較差的方法，可以推斷出，該公司可能沒(méi)有很多功能強(qiáng)大的Hopper GPU。這意味著，算力訓(xùn)練成本也是極低的。

有網(wǎng)友評(píng)價(jià)，這是AI的“頓悟時(shí)刻”：“R1-Zero（注：R1是R1-Zero調(diào)整后的模型）證明模型可以自我開(kāi)發(fā)推理策略。舉個(gè)例子：當(dāng)遇到問(wèn)題時(shí)，它學(xué)會(huì)了回溯并質(zhì)疑其最初的假設(shè)——這是一種從未明確編程的行為。”這代表著DeepSeek的新模型已經(jīng)能夠具有像人類(lèi)一樣的自主學(xué)習(xí)能力了。

知名AI評(píng)測(cè)員Matthew Berman表示，R1擁有他所見(jiàn)過(guò)的最像人類(lèi)的內(nèi)心獨(dú)白。

圖片來(lái)源：X

然而，R1依然面臨著開(kāi)源模型V3一樣的毛病。有網(wǎng)友向他提問(wèn)誰(shuí)訓(xùn)練你的時(shí)，它回答道：“我是被OpenAI開(kāi)發(fā)的”。

圖片來(lái)源：X

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

模型 Ai DeepSeek Kimi

上一篇文章

金冠股份：預(yù)計(jì)2024年虧損3億元-3.8億元

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

中偉股份：全資二級(jí)子公司取得采礦許可證

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專(zhuān)區(qū)

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專(zhuān)區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

国产国拍亚洲精品永久污| 国语人妻| 亚洲V日韩V精品v无码专区| 自慰无码一区二区三区| 亚洲视频天堂| sw一331在线播放| 国产AⅤ精品一区二区久久动漫| 国产成人免费网站在线观看| 999久久久国产精免费观| 欧美激情久久精品| 中文精品久久久久人妻不卡。| 久久久成人午夜精品电影| 日本乳汁在线播放视频| 中文字幕成人免费| 中文日韩无码人妻| 99久久久免费国产精品| 亚州激情| 亚洲欧美人妻一区二区| 国产免费成人久久综合一区| 国产精品久久久午夜夜伦鲁鲁| 久久国产欧美一区二区免费看| a级www| 亚洲国产老鸭窝一区二区三区| AV一区二区三区一杨思敏| 亚洲国产日韩欧美愉拍精品| 阳新县| 尤物啪啪啪视频| 99久久精品国产免费观看| 精品国产无码在线观看| 国产精品区一区二区三含羞草| 亚洲无码日韩粉嫩av| 久99re在线观看视频96| 西西888WWW大胆无码| 精品久久久无码午夜福利| 亚洲成人免费在线观看| 久久久久亚洲黄片| 95sao国产成视频永久免费| 人妻av乱片av出轨av| 97视频热人人精品免费| 人禽AV影院| 无码字幕AV一区二区三区 |