亚洲欧美国产精品一区二区,台湾佬中文娱乐佬,国产精品碰碰现在自

上海大模型從業(yè)者為何要去北京這條馬路多走走？

上觀新聞 2024-12-06 12:49:01

擁抱瞬息萬變的大模型產(chǎn)業(yè)，需要“誠心誠意、真金白銀、揚長補短”。

從年頭到年尾“高質(zhì)量語料短缺”始終是討論人工智能大模型時的熱點議題。臨近年末，業(yè)界對“解題之道”似乎已有推進結(jié)果。

在12月5日舉行的2024科創(chuàng)大會“‘模速’賦能空間共塑”分論壇上，在AI大模型的關(guān)鍵三要素“算力、算法、數(shù)據(jù)”層面，三個領(lǐng)域的代表企業(yè)圍繞今年政府工作報告中提到的“加快發(fā)展新質(zhì)生產(chǎn)力”提出了一番真知灼見。

高質(zhì)量語料比“高質(zhì)量人類”更難培育？

當天論壇上發(fā)布了來自上海庫帕思科技有限公司的“庫帕思語料終端”及其聯(lián)合體，華為、商湯、兆芯、聯(lián)想、東海、浪潮信息等行業(yè)頭部企業(yè)成為首批成員。

大模型的“語料”，廣義上理解就是人們常說的“數(shù)據(jù)”。但在庫帕思首席執(zhí)行官黃海清看來，眼下，大模型語料領(lǐng)域面臨諸多行業(yè)挑戰(zhàn)，具體可總結(jié)為“行業(yè)沒標準、安全沒保障、生態(tài)不協(xié)同、部署太復(fù)雜、技術(shù)不解渴、語料低質(zhì)量”。

挑戰(zhàn)紛繁復(fù)雜，但并非無解。尤其針對“語料質(zhì)量低”這一大模型領(lǐng)域日漸“老生常談”的問題，黃海清把英文“VALID有效的”拆解為“Vividness鮮活度”“Authenticity真實性”“Large Sample大樣本”“Integrity完整性”“Diversity多樣性”以及“High Density Knowledge高知識密度”，從行業(yè)角度為高質(zhì)量語料進行了定義。

不過，如何同時解決六大挑戰(zhàn)，就不只是下定義這么簡單。當天發(fā)布的庫帕思語料終端“小庫”是全國首個語料終端產(chǎn)品，其標準版使用場景可滿足200人并發(fā)使用的部門級應(yīng)用需求，旗艦版一個機架則能容納4個終端，同時滿足1500并發(fā)的企業(yè)級應(yīng)用需求。

不僅如此，“小庫”的模型區(qū)還配置了“書生”“千問”“商湯日日新”“階躍”“智譜”等幾乎當下所有最主流的基礎(chǔ)大模型。語料區(qū)則包含了行業(yè)垂類語料庫、向量數(shù)據(jù)庫和語料加工工具。算力區(qū)囊括了來自壁仞、天數(shù)、寒武紀、華為、登臨、燧原、沐曦、陣量等主流算力供應(yīng)商的服務(wù)。

“語料終端的誕生，是希望為‘0-1’階段的種子企業(yè)挨過最艱難的時期，與‘1-3’發(fā)展階段的燈塔用戶共同打磨產(chǎn)品，最終為‘3到無限大’發(fā)展階段的各類企業(yè)服務(wù)，讓大模型真正實現(xiàn)賦能千行百業(yè)的愿景?！秉S海清說。

黃海清

算力和算法“代表”怎么看

華院計算技術(shù)（上海）股份有限公司董事長宣曉華最近觀察到，大模型領(lǐng)域一系列算法創(chuàng)新正在為不同行業(yè)提升效率添磚加瓦。例如，語言領(lǐng)域的智能問答已經(jīng)是走在最前列的大模型應(yīng)用場景；醫(yī)療領(lǐng)域的輔助診斷也有大模型廣泛應(yīng)用的身影。

相比之下，工業(yè)領(lǐng)域的大模型應(yīng)用相對滯后，原因在于傳統(tǒng)工業(yè)的數(shù)字化尚顯不足，其本身又對知識水平有較高要求。

在探索工業(yè)領(lǐng)域大模型應(yīng)用的過程中，宣曉華梳理出算法研究領(lǐng)域目前存在的挑戰(zhàn)。最明顯的就是如何把“大”模型“變小”，用盡量小的算力成本，生成最有效率的大模型應(yīng)用。這一議題目前是國內(nèi)外業(yè)界共同關(guān)注的焦點。

事實上，不僅傳統(tǒng)企業(yè)、AI初創(chuàng)企業(yè)關(guān)注如何降低大模型的研發(fā)成本，頭部企業(yè)同樣關(guān)注成本控制。商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆表示，無論是算力、算法還是語料數(shù)據(jù)，降低研發(fā)成本、少走彎路都需要很強的專業(yè)能力在背后供給。

“最近有人問我，如果時間倒退至五年前，作為國內(nèi)最大整機廠商，我們是否會選擇做芯片，答案或許還是堅持我們當時的選擇，專注做整機?！崩顺奔瘓F副總裁郭強表示，目前市面上常見的算力來源包括先進算力、合規(guī)算力以及國產(chǎn)自主可控的芯片產(chǎn)品。三種算力多元共存，衍生出算力出海、算力入關(guān)、算力購買等不同的應(yīng)用模式。

在大模型行業(yè)總體欣欣向榮的趨勢下，作為算力企業(yè)的代表，郭強也提出了幾點建議。

其一是大模型企業(yè)應(yīng)堅持“發(fā)展”和“底線”兩種思維，了解自己應(yīng)該生成怎樣的大模型應(yīng)用，來支撐當下我國的數(shù)字化轉(zhuǎn)型戰(zhàn)略，同時兼顧技術(shù)的自主可控。其二是當數(shù)據(jù)的作用和能量越來越大，企業(yè)應(yīng)該把80%以上的精力放在非算力上，不要盲目擴大算力支出。其三是選擇算力時，應(yīng)當綜合考慮性價比，包括能耗、穩(wěn)定性、安全性等，“持有算力設(shè)備和用好手中的算力，其實是兩碼事?！?/p>

大模型社區(qū)重塑區(qū)域產(chǎn)業(yè)空間

過去人們會問，“為何沒有互聯(lián)網(wǎng)大廠在上海?！比缃襁@個問題似乎開始“過時”。

圓桌討論環(huán)節(jié)，主持人在介紹全國首個大模型創(chuàng)新生態(tài)社區(qū)“模速空間”一年多來的建設(shè)成果時，上海大模型生態(tài)發(fā)展有限公司（模速空間）總經(jīng)理陳海慈現(xiàn)場“校準”了數(shù)據(jù)：目前，模速空間三期總計交付3萬平方米，集聚104家大模型企業(yè)，上海通過備案上線的34款大模型中，模速空間所在的徐匯區(qū)占到了22個，占比高達65%。

記者發(fā)現(xiàn)，過去一年來，每隔一段時間參與此類科技論壇，模速空間的“成績單”都有動態(tài)變化的增量，側(cè)面反映出大模型產(chǎn)業(yè)的發(fā)展速度。在陳海慈看來，擁抱瞬息萬變的大模型產(chǎn)業(yè)，徐匯區(qū)和模速空間的具體舉措可用“誠心誠意、真金白銀、揚長補短”來概括。

“本周，模速空間就將發(fā)放完畢今年第三批算力補貼，今年累計已達1億元；預(yù)計到四季度結(jié)束，全年為入駐企業(yè)發(fā)放的算力補貼將達1.5億元。”陳海慈表示，北京、上海和深圳被視為中國三大“大模型之城”，其中上海正用“真金白銀”的算力補貼支持大模型產(chǎn)業(yè)發(fā)展。在此過程中，上海正積極發(fā)揮在營商環(huán)境、市場環(huán)境、金融中心建設(shè)等方面的優(yōu)勢，規(guī)模達225億元的上海三大先導(dǎo)產(chǎn)業(yè)人工智能母基金已于今年8月正式落地徐匯區(qū)。

“上海的大模型行業(yè)從業(yè)者可以經(jīng)常去北京的中關(guān)村東路走走，那里集聚了清華、北大、人大，是創(chuàng)新濃度高度集聚的地方?！标惡４日f。

在創(chuàng)新策源力上“補短”，上海已經(jīng)邁開了步子。眼下，包括上海人工智能實驗室、國家人工智能學院、上海交通大學人工智能學院等高校和新型研發(fā)機構(gòu)均已落地徐匯區(qū)。上述機構(gòu)均位于模速空間15分鐘車程之內(nèi)，助力模速空間打造垂直向的高濃度創(chuàng)新容器。

當天論壇現(xiàn)場，徐匯區(qū)還同步啟動了“科創(chuàng)繡帶”系列項目，其中包括了“央視聽媒體大模型體育技戰(zhàn)術(shù)分析系統(tǒng)”、大模型語料“超級工廠”等一批新項目。記者了解到，未來，徐匯區(qū)將整合科創(chuàng)成果、機構(gòu)、人才、資金等資源，提供更優(yōu)質(zhì)的成果轉(zhuǎn)化全周期服務(wù)。

責編：寧靜

一審：寧靜

二審：胡澤匯

三審：張德會

來源：上觀新聞

我要問