少妇流白浆普通话对白,亚洲AV片无码久久五月,AVTT2020手机在线,久久精品熟妇丰满人妻99

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

憋大招,MiniMax發(fā)布全球首個(gè)混合架構(gòu)開(kāi)源模型M1 能后來(lái)者居上嗎?

每日經(jīng)濟(jì)新聞 2025-06-17 22:59:19

6月17日,MiniMax發(fā)布M1系列模型,被定義為“全球首個(gè)開(kāi)源的大規(guī)模混合架構(gòu)推理模型”。M1在處理長(zhǎng)文本能力上實(shí)現(xiàn)突破,成本下降,推理效率數(shù)倍于競(jìng)爭(zhēng)對(duì)手。MiniMax不僅開(kāi)源模型權(quán)重,還提供API服務(wù),價(jià)格主打性價(jià)比。知名數(shù)字經(jīng)濟(jì)學(xué)者盤(pán)和林表示,M1有進(jìn)步,但商業(yè)價(jià)值待驗(yàn)證。

每經(jīng)記者|陳婷    每經(jīng)編輯|文多    

總部位于上海的人工智能獨(dú)角獸企業(yè)MiniMax突然放了個(gè)大招。

6月17日,MiniMax正式發(fā)布其自主研發(fā)的MiniMax-M1(以下簡(jiǎn)稱M1)系列模型。根據(jù)MiniMax方面的介紹,M1被定義為“全球首個(gè)開(kāi)源的大規(guī)模混合架構(gòu)推理模型”。

此外,技術(shù)報(bào)告顯示:M1模型在處理百萬(wàn)Token(大模型處理文本時(shí)的最小單位)級(jí)長(zhǎng)文本的能力方面實(shí)現(xiàn)了重大突破,成為上下文最長(zhǎng)的推理模型;其RL(強(qiáng)化訓(xùn)練)成本下降一個(gè)量級(jí),成本僅53萬(wàn)美金,推理效率則數(shù)倍于競(jìng)爭(zhēng)對(duì)手。

今年開(kāi)年以來(lái),DeepSeek持續(xù)沖擊著大模型行業(yè)的格局,接入DeepSeek-R1一度被很多企業(yè)視為擁抱AI(人工智能)的標(biāo)志。

如今,MiniMax推出號(hào)稱具備“全球最長(zhǎng)上下文”的M1模型,有可能后來(lái)者居上嗎?

當(dāng)前上下文最長(zhǎng)的推理模型 價(jià)格還主打性價(jià)比

據(jù)了解,MiniMax不僅開(kāi)源了模型權(quán)重,還提供了API(應(yīng)用程序編程接口)服務(wù),價(jià)格主打性價(jià)比。

其定價(jià)策略為:

在0~3.2萬(wàn)(含)Token范圍,輸入時(shí)0.8元/百萬(wàn)Token,輸出時(shí)8元/百萬(wàn)Token;

在3.2萬(wàn)~12.8萬(wàn)(含)Token范圍,輸入時(shí)1.2元/百萬(wàn)Token,輸出時(shí)16元/百萬(wàn)Token;

在12.8萬(wàn)~100萬(wàn)Token范圍,輸入時(shí)2.4元/百萬(wàn)Token,輸出時(shí)在24元/百萬(wàn)Token。

據(jù)介紹,前兩個(gè)檔位的定價(jià)均低于DeepSeek-R1,而第三個(gè)超長(zhǎng)文本檔位則是該模型目前尚未覆蓋的領(lǐng)域。此外,MiniMax宣布,在其自有的App(應(yīng)用程序)和Web(網(wǎng)絡(luò))端,M1模型將保持不限量免費(fèi)使用。

此外,在長(zhǎng)文本能力上,M1模型原生支持高達(dá)100萬(wàn)Token的上下文窗口,這一數(shù)字與谷歌最新的Gemini 2.5 Pro持平,是DeepSeek-R1(12.8萬(wàn)Token)的近8倍。同時(shí),它還支持業(yè)內(nèi)最長(zhǎng)的8萬(wàn)Token推理輸出。

圖片來(lái)源:開(kāi)源技術(shù)報(bào)告截圖

MiniMax方面表示,實(shí)現(xiàn)這一突破的關(guān)鍵在于獨(dú)創(chuàng)的“Lightning Attention”混合構(gòu)架。傳統(tǒng)的“Transformer”模型在處理長(zhǎng)序列時(shí),注意力機(jī)制的計(jì)算量會(huì)隨序列長(zhǎng)度呈平方級(jí)增長(zhǎng),成為制約性能和成本的主要瓶頸。M1的混合架構(gòu),特別是注意力機(jī)制,能夠顯著優(yōu)化長(zhǎng)下文輸入的計(jì)算效率。

就這一模型,知名數(shù)字經(jīng)濟(jì)學(xué)者、工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤(pán)和林對(duì)《每日經(jīng)濟(jì)新聞》記者表示,之前大模型采用的“PPO/GRPO”裁剪方式有一些缺陷,MiniMax通過(guò)“CISPO”(Clipped IS-weight Policy Optimization)對(duì)這些缺陷進(jìn)行了一些優(yōu)化,其目的還是為了降低訓(xùn)練成本和推理成本。

據(jù)記者了解,MiniMax此次提出的CISPO算法是另辟蹊徑,它沒(méi)有采用傳統(tǒng)算法中調(diào)整Token的更新方式,而是通過(guò)裁剪重要性采樣權(quán)重來(lái)提升、強(qiáng)化學(xué)習(xí)的效率、穩(wěn)定性。

“這是進(jìn)步,但這個(gè)進(jìn)步是否能夠轉(zhuǎn)化為商業(yè)價(jià)值暫時(shí)還不清楚。要看具體工具在應(yīng)用層面的反饋。”盤(pán)和林說(shuō)。

值得一提的是,今年4月,阿里巴巴開(kāi)源新一代通義千問(wèn)模型Qwen3(以下簡(jiǎn)稱千問(wèn)3),參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,據(jù)稱性能全面超越DeepSeek-R1、OpenAI o1等全球頂尖模型。

3月16日,百度正式發(fā)布“文心大模型4.5”“文心大模型X1”。據(jù)介紹,文心大模型4.5是百度首個(gè)原生多模態(tài)大模型,API調(diào)用價(jià)格僅為GPT-4.5的1%。文心大模型X1為深度思考模型,性能對(duì)標(biāo)DeepSeek-R1,調(diào)用價(jià)格約為其一半。

圖片來(lái)源:視覺(jué)中國(guó)-VCG211431510188

大模型還有優(yōu)化空間,誰(shuí)找對(duì)方向就是下一科技巨頭

或許可以說(shuō),M1是MiniMax憋了許久的大招之一。

在DeepSeek的沖擊之下,大模型創(chuàng)業(yè)公司今年一開(kāi)年就面對(duì)著戰(zhàn)略方向的轉(zhuǎn)折點(diǎn):是做技術(shù)還是做產(chǎn)品?

今年1月,MiniMax創(chuàng)始人兼CEO閆俊杰在接受媒體采訪時(shí)表示,在更明確“智能水平的提升,沒(méi)那么依賴很多用戶”后,他做出了取舍,結(jié)束了整整半年多的焦慮。閆俊杰明確,現(xiàn)在MiniMax最重要的目標(biāo)不是增長(zhǎng),也不是收入,是“加速技術(shù)迭代”。

同樣在1月,MiniMax發(fā)布并開(kāi)源新一代“01系列”模型,包含基礎(chǔ)語(yǔ)言大模型“MiniMax-Text-01”和視覺(jué)多模態(tài)大模型“MiniMax-VL-01”。

到了3月,MiniMax對(duì)品牌進(jìn)行了更清晰的拆分,據(jù)悉,MiniMax將旗下AI應(yīng)用“海螺AI”正式更名為“MiniMax”,國(guó)內(nèi)版和國(guó)際版同步調(diào)整。

5月,MiniMax發(fā)布新一代語(yǔ)音大模型“Speech-02”。據(jù)介紹,基于超強(qiáng)技術(shù)與足夠泛化的模型能力,Speech-02為用戶帶來(lái)超擬人、個(gè)性化、多樣性的語(yǔ)音服務(wù)。

雖說(shuō)在重要性上讓步于技術(shù)攻堅(jiān),但在商業(yè)化上,MiniMax在B端(商業(yè)端)和C端(消費(fèi)者端)上皆有布局,對(duì)國(guó)內(nèi)市場(chǎng)和海外市場(chǎng)皆有涉獵。

此外,在今年1月發(fā)布并開(kāi)源新一代01系列模型時(shí),MiniMax方面便提及,2025年,AI將迎來(lái)至關(guān)重要的發(fā)展節(jié)點(diǎn),AI Agent(智能體)有望成為新一年最重要的產(chǎn)品形態(tài),引領(lǐng)AI從傳統(tǒng)的“工具”角色向更具互動(dòng)性與協(xié)作性的“伙伴”角色轉(zhuǎn)變。

當(dāng)時(shí),MiniMax便表示:“首先,我們認(rèn)為這有可能啟發(fā)更多長(zhǎng)上下文的研究和應(yīng)用,從而更快促進(jìn)Agent時(shí)代的到來(lái);第二,開(kāi)源也能促使我們努力做更多創(chuàng)新,更高質(zhì)量地開(kāi)展后續(xù)的模型研發(fā)工作。”

國(guó)泰海通證券在近期的研報(bào)中提及,大模型在多模態(tài)理解和復(fù)雜推理上的突破,為AI Agent的發(fā)展提供了核心技術(shù)支撐。AI 應(yīng)用雖尚處于落地初期,但未來(lái)發(fā)展路徑明晰,當(dāng)前處于B端萌芽期,未來(lái)C端有望大規(guī)模爆發(fā),最終將實(shí)現(xiàn)B端與C端并行發(fā)展,全面推動(dòng)AI產(chǎn)業(yè)繁榮。

MiniMax剛剛推出的M1是否能助力其在AI Agent這一方向上的發(fā)展?對(duì)此,盤(pán)和林肯定其“有幫助”,但認(rèn)為還沒(méi)有到革命性的程度,屬于漸進(jìn)性算法優(yōu)化。

早在今年1月接受采訪時(shí),閆俊杰就明確了技術(shù)和產(chǎn)品的關(guān)系,他表示,更好的模型可以導(dǎo)向更好的應(yīng)用,但更好的應(yīng)用和更多用戶并不會(huì)導(dǎo)向更好的模型。

在DeepSeek火爆全網(wǎng)時(shí),MiniMax堅(jiān)持將目標(biāo)定為“加速技術(shù)迭代”。半年后,MiniMax終于來(lái)到了自己的“主場(chǎng)時(shí)刻”。據(jù)記者了解,M1的發(fā)布僅僅是拉開(kāi)了MiniMax“開(kāi)源周”的序幕。在接下來(lái)的4個(gè)工作日里,MiniMax計(jì)劃每天發(fā)布一項(xiàng)新技術(shù)或產(chǎn)品更新。

就MiniMax堅(jiān)持技術(shù)攻堅(jiān)的前景,盤(pán)和林表示,他看好加碼大模型的創(chuàng)業(yè)公司。盤(pán)和林進(jìn)一步分析說(shuō):“現(xiàn)階段的基礎(chǔ)模型依然有很大的提升空間,很多用戶并不喜歡用AI來(lái)干活,因?yàn)锳I不聰明且很慢。之前,有人用所謂的智能體來(lái)生成報(bào)告,這些智能體卻用了數(shù)天乃至數(shù)周的時(shí)間還沒(méi)有完成,這效率并不比真人高。如今很多人用AI,也只能解決一部分工作,無(wú)法做到直接交付工作的程度。”

在盤(pán)和林看來(lái),大模型一定還有優(yōu)化空間,誰(shuí)找對(duì)了大模型算法優(yōu)化的方向,誰(shuí)就是下一個(gè)科技巨頭。“DeepSeek向前走了一步,但還不夠。”盤(pán)和林說(shuō)。

封面圖片來(lái)源:視覺(jué)中國(guó)-VCG211431510188

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 MiniMax Ai DeepSeek

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0

久久精品国产亚洲精品色婷婷| 精品品品品品成人片| 亚洲激情一区二区在线| 久播影院无码中文字幕| 精品日本乱码久久久久久真人版| WWW亚洲造逼啊啊啊| 99精品播放| 欧美成人中文字幕一区二区 | 变态另类亚洲无码| 国模精品一区二区亚洲| 色婷婷日本综合色| 日韩无码艹狠狠| 精品国产亚洲无码在线| 亚洲欧美激情久久| 亚洲人人妻偷人人| 午夜亚洲理论片在线观看手机视频免费 | 肇东市| 成人影院精品看片| 超碰97久久国产精品牛牛| 在线观看亚洲视频| 东方影库亚洲无码| 亚洲成人精品一区| 国产尤物无码在线观看| 亚洲欧美色国产综合| 91精品福利在线| 亚洲视频按摩店| 亚洲精品无码专区久久下载| 亚洲—区二区三区| 精品无码久久久久久久久消防| 久久精品天天操| 天天爽夜夜爽五月丁香| 粉嫩AV无码一区二区三区水牛| 四虎免费在线观看影院| 天天谢天天干| 国产精品美女久久久久AV福利| 尤物九九久久国产精品| 91情侣在线偷精品国产 | 中文字幕系列天堂网| 激情综合网、激情五月天| 亚洲精品视频网址| 人妻少妇久久毛片|