亚洲一区二区三区不卡国产,日本VA电影在线观看,亚洲自偷观看高清久久

中國(guó)AI公司幾個(gè)月就弄通了OpenAI的推理模型，美研究人員：我們很驚訝

觀察者網(wǎng) 2024-12-25 14:36:56

【文/觀察者網(wǎng) 賴(lài)家琪】“中國(guó)初創(chuàng)公司已展現(xiàn)出趕超美國(guó)人工智能（AI）模型的跡象，而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快?！泵绹?guó)《華爾街日?qǐng)?bào)》在12月24日的一篇報(bào)道中，通過(guò)對(duì)比中美兩國(guó)AI企業(yè)推理模型的表現(xiàn)以及研發(fā)速度，得出了以上結(jié)論。

11月，由中國(guó)私募巨頭幻方量化投資的AI公司DeepSeek（深度求索）發(fā)布了其推理模型DeepSeek-R1的預(yù)覽版。根據(jù)DeepSeek的說(shuō)法，這一模型的能力已接近甚至超越了OpenAI于今年9月發(fā)布的推理模型o1的預(yù)覽版。

除了DeepSeek外，擁有中國(guó)互聯(lián)網(wǎng)巨頭阿里巴巴和騰訊投資的初創(chuàng)公司Moonshot AI（月之暗面）表示，他們開(kāi)發(fā)了一種專(zhuān)門(mén)用于數(shù)學(xué)的模型，其功能接近o1。阿里巴巴也稱(chēng)，他們自己的一個(gè)實(shí)驗(yàn)?zāi)Ｐ驮诮鉀Q數(shù)學(xué)問(wèn)題上的表現(xiàn)優(yōu)于美國(guó)模型的預(yù)覽版。

《華爾街日?qǐng)?bào)》稱(chēng)，由于這些公司尚未發(fā)表描述其模型的論文，且現(xiàn)在沒(méi)有一致認(rèn)可的對(duì)AI模型能力進(jìn)行評(píng)估的單一測(cè)試，目前很難驗(yàn)證這些中國(guó)公司的說(shuō)法。盡管如此，一些美國(guó)專(zhuān)家表示，他們對(duì)此“印象深刻”。

“中國(guó)正在更快地迎頭趕上?！監(jiān)penAI前研究員、現(xiàn)為AI企業(yè)家的安德魯·卡爾（Andrew Carr）說(shuō)，DeepSeek研究員在“在幾個(gè)月內(nèi)就弄通了OpenAI推理模型的辦法，坦率地說(shuō)，我的許多同事都對(duì)此感到驚訝”。

《華爾街日?qǐng)?bào)》用今年美國(guó)數(shù)學(xué)競(jìng)賽AIME中的15個(gè)問(wèn)題進(jìn)行了測(cè)試。他們發(fā)現(xiàn)，OpenAI的推理模型還是要比中國(guó)幾家公司的推理模型更快地找到答案。測(cè)試結(jié)果顯示，OpenAI模型在10秒內(nèi)給出了答案，而DeepSeek花了2分多鐘。

不過(guò)，該報(bào)仍稱(chēng)贊了DeepSeek的表現(xiàn)，稱(chēng)在目前很多AI模型被簡(jiǎn)單數(shù)學(xué)問(wèn)題難倒的情況下，DeepSeek第一次就得到正確答案是“一項(xiàng)壯舉”。

DeepSeek（深度求索）官網(wǎng)

中國(guó)AI公司能在短時(shí)間內(nèi)達(dá)成“壯舉”得益于多重原因。

與許多美國(guó)公司不同，大部分中國(guó)公司更愿意與其他企業(yè)和軟件開(kāi)發(fā)商共享底層代碼。這種共享代碼的行為在AI領(lǐng)域被稱(chēng)為“開(kāi)源”。美國(guó)《紐約時(shí)報(bào)》稱(chēng)，開(kāi)源一直是計(jì)算機(jī)軟件、互聯(lián)網(wǎng)以及當(dāng)前AI發(fā)展的基石，因?yàn)殚_(kāi)源的支持者認(rèn)為，當(dāng)代碼可供任何人免費(fèi)檢查、使用和改進(jìn)時(shí)，技術(shù)就會(huì)進(jìn)步得更快。

“開(kāi)源技術(shù)是中國(guó)的戰(zhàn)略?xún)?yōu)勢(shì)?！泵绹?guó)《科技時(shí)報(bào)》12月17日稱(chēng)，中國(guó)公司讓任何人都能接觸到模型源代碼，可以在全球范圍內(nèi)引發(fā)創(chuàng)新并建立開(kāi)發(fā)人員社區(qū)，這不僅推動(dòng)了技術(shù)的進(jìn)步，而且使中國(guó)的模型出現(xiàn)在全球AI地圖上。

《紐約時(shí)報(bào)》也注意到了開(kāi)源模式給中國(guó)帶來(lái)的優(yōu)勢(shì)。該報(bào)稱(chēng)，2023年年底有人發(fā)現(xiàn)，李開(kāi)復(fù)創(chuàng)建的AI公司01.AI（零一萬(wàn)物）使用了美國(guó)公司Meta的開(kāi)源模型構(gòu)建其AI系統(tǒng)。但轉(zhuǎn)折發(fā)生在6個(gè)月后。當(dāng)時(shí)，01.AI發(fā)布了新一代模型，美國(guó)斯坦福大學(xué)的一個(gè)團(tuán)隊(duì)也在那段時(shí)間也推出了Llama 3-V開(kāi)源模型。但隨后，Llama 3-V很快被爆出與中國(guó)大模型公司面壁智能的開(kāi)源成果MiniCPM-Llama3-V 2.5擁有幾乎完全相同的模型架構(gòu)與代碼，引發(fā)“抄襲”質(zhì)疑。

該報(bào)指出，這與01.AI去年面臨的爭(zhēng)議相反：中國(guó)開(kāi)發(fā)人員不再在美國(guó)技術(shù)之上構(gòu)建，而是美國(guó)開(kāi)發(fā)人員在中國(guó)技術(shù)之上構(gòu)建。

總部位于紐約的AI公司Hugging Face（抱抱臉）的首席執(zhí)行官克萊門(mén)特·德朗格（Clément Delangue）表示，美國(guó)監(jiān)管機(jī)構(gòu)限制美國(guó)的開(kāi)源項(xiàng)目，中國(guó)的開(kāi)源模型成為黃金標(biāo)準(zhǔn)，此類(lèi)事情可能會(huì)成為常態(tài)，“如果這種趨勢(shì)繼續(xù)下去，美國(guó)將面臨越來(lái)越大的挑戰(zhàn)”。

為了扼制中國(guó)發(fā)展AI的能力，美國(guó)政府自2022年來(lái)一直在限制中國(guó)獲得世界上最先進(jìn)的AI芯片。今年12月，臨卸任的拜登政府再次收緊了對(duì)中國(guó)出口AI芯片的途徑。

但是，《華爾街日?qǐng)?bào)》稱(chēng)，中國(guó)開(kāi)發(fā)人員已經(jīng)找到了解決方法。Moonshot AI創(chuàng)始人楊植麟稱(chēng)，該公司專(zhuān)注于強(qiáng)化學(xué)習(xí)（Reinforcement Learning，一種機(jī)器學(xué)習(xí)方法），模仿人類(lèi)的試錯(cuò)。報(bào)道稱(chēng)，這種方法在提高性能時(shí)，可能會(huì)減少算力的使用強(qiáng)度。

《華爾街日?qǐng)?bào)》報(bào)道稱(chēng)，自去年年底以來(lái)，AI開(kāi)發(fā)人員越來(lái)越多地使用一種稱(chēng)為“混合專(zhuān)家模型”（MoE）的技術(shù)。該技術(shù)將問(wèn)題引導(dǎo)到專(zhuān)門(mén)的子模型（即“專(zhuān)家”）處去解決問(wèn)題，就像主廚將意大利面訂單定向到廚房的意大利廚師處那樣。這個(gè)過(guò)程也減輕了對(duì)芯片的要求。

騰訊的混合專(zhuān)家模型于今年11月發(fā)布。據(jù)稱(chēng)，該模型的性能與Meta今年7月推出的Llama 3.1模型相當(dāng)。審查了兩家公司論文的研究人員表示，騰訊的模型可能僅用了Meta約1/10的算力訓(xùn)練的。

DeepSeek在2021年用1萬(wàn)個(gè)英偉達(dá)A100芯片構(gòu)建了一個(gè)用于AI訓(xùn)練的Fire-Flyer 2集群。今年8月，DeepSeek在一篇論文中表示，F(xiàn)ire-Flyer 2的性能接近于英偉達(dá)的一個(gè)包含類(lèi)似芯片的系統(tǒng)，但DeepSeek的系統(tǒng)成本更低，能耗更低。

美國(guó)AI初創(chuàng)公司Anthropic聯(lián)合創(chuàng)始人杰克·克拉克（Jack Clark）在他的博客中寫(xiě)道，“中國(guó)繞過(guò)出口管制的一種方式是，利用他可以訪(fǎng)問(wèn)的硬件構(gòu)建非常好的軟件和硬件訓(xùn)練堆?！保熬拖耠妱?dòng)汽車(chē)、無(wú)人機(jī)和其他技術(shù)一樣，中國(guó)制造將在AI模型中占據(jù)一席之地”。

《華爾街日?qǐng)?bào)》指出，缺乏尖端芯片、籌資難等問(wèn)題仍是中國(guó)AI公司面臨的幾大挑戰(zhàn)。但接受該報(bào)采訪(fǎng)的中國(guó)AI公司高管將這比作帶著鐐銬跳舞，他表示“專(zhuān)注于我們擅長(zhǎng)的事情是生存的唯一機(jī)會(huì)，而且可能是獲勝”。

《科技時(shí)報(bào)》稱(chēng)，美國(guó)和中國(guó)在AI生態(tài)系統(tǒng)上的競(jìng)爭(zhēng)，與過(guò)去windows和iOS操作系統(tǒng)的競(jìng)爭(zhēng)類(lèi)似，贏家可能會(huì)主導(dǎo)數(shù)字行業(yè)，影響未來(lái)幾年全球市場(chǎng)和用戶(hù)的行為。雖然美國(guó)制裁很難突破，但中國(guó)更加專(zhuān)注于開(kāi)源模型和國(guó)內(nèi)創(chuàng)新，這使它成為世界上最大的AI大國(guó)之一。“全世界都在等著看，中國(guó)是否會(huì)超越西方競(jìng)爭(zhēng)對(duì)手?！?/p>

責(zé)編：李傳新

一審：李傳新

二審：段涵敏

三審：楊又華

來(lái)源：觀察者網(wǎng)

我要問(wèn)