上海大模型從業(yè)者為何要去北京這條馬路多走走?

  上觀新聞   2024-12-06 12:49:01

擁抱瞬息萬變的大模型產業(yè),需要“誠心誠意、真金白銀、揚長補短”。

從年頭到年尾“高質量語料短缺”始終是討論人工智能大模型時的熱點議題。臨近年末,業(yè)界對“解題之道”似乎已有推進結果。

在12月5日舉行的2024科創(chuàng)大會“‘模速’賦能空間共塑”分論壇上,在AI大模型的關鍵三要素“算力、算法、數(shù)據”層面,三個領域的代表企業(yè)圍繞今年政府工作報告中提到的“加快發(fā)展新質生產力”提出了一番真知灼見。

高質量語料比“高質量人類”更難培育?

當天論壇上發(fā)布了來自上海庫帕思科技有限公司的“庫帕思語料終端”及其聯(lián)合體,華為、商湯、兆芯、聯(lián)想、東海、浪潮信息等行業(yè)頭部企業(yè)成為首批成員。

大模型的“語料”,廣義上理解就是人們常說的“數(shù)據”。但在庫帕思首席執(zhí)行官黃海清看來,眼下,大模型語料領域面臨諸多行業(yè)挑戰(zhàn),具體可總結為“行業(yè)沒標準、安全沒保障、生態(tài)不協(xié)同、部署太復雜、技術不解渴、語料低質量”。

挑戰(zhàn)紛繁復雜,但并非無解。尤其針對“語料質量低”這一大模型領域日漸“老生常談”的問題,黃海清把英文“VALID有效的”拆解為“Vividness鮮活度”“Authenticity真實性”“Large Sample大樣本”“Integrity完整性”“Diversity多樣性”以及“High Density Knowledge高知識密度”,從行業(yè)角度為高質量語料進行了定義。

不過,如何同時解決六大挑戰(zhàn),就不只是下定義這么簡單。當天發(fā)布的庫帕思語料終端“小庫”是全國首個語料終端產品,其標準版使用場景可滿足200人并發(fā)使用的部門級應用需求,旗艦版一個機架則能容納4個終端,同時滿足1500并發(fā)的企業(yè)級應用需求。

不僅如此,“小庫”的模型區(qū)還配置了“書生”“千問”“商湯日日新”“階躍”“智譜”等幾乎當下所有最主流的基礎大模型。語料區(qū)則包含了行業(yè)垂類語料庫、向量數(shù)據庫和語料加工工具。算力區(qū)囊括了來自壁仞、天數(shù)、寒武紀、華為、登臨、燧原、沐曦、陣量等主流算力供應商的服務。

“語料終端的誕生,是希望為‘0-1’階段的種子企業(yè)挨過最艱難的時期,與‘1-3’發(fā)展階段的燈塔用戶共同打磨產品,最終為‘3到無限大’發(fā)展階段的各類企業(yè)服務,讓大模型真正實現(xiàn)賦能千行百業(yè)的愿景。”黃海清說。

黃海清

算力和算法“代表”怎么看

華院計算技術(上海)股份有限公司董事長宣曉華最近觀察到,大模型領域一系列算法創(chuàng)新正在為不同行業(yè)提升效率添磚加瓦。例如,語言領域的智能問答已經是走在最前列的大模型應用場景;醫(yī)療領域的輔助診斷也有大模型廣泛應用的身影。

相比之下,工業(yè)領域的大模型應用相對滯后,原因在于傳統(tǒng)工業(yè)的數(shù)字化尚顯不足,其本身又對知識水平有較高要求。

在探索工業(yè)領域大模型應用的過程中,宣曉華梳理出算法研究領域目前存在的挑戰(zhàn)。最明顯的就是如何把“大”模型“變小”,用盡量小的算力成本,生成最有效率的大模型應用。這一議題目前是國內外業(yè)界共同關注的焦點。

事實上,不僅傳統(tǒng)企業(yè)、AI初創(chuàng)企業(yè)關注如何降低大模型的研發(fā)成本,頭部企業(yè)同樣關注成本控制。商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆表示,無論是算力、算法還是語料數(shù)據,降低研發(fā)成本、少走彎路都需要很強的專業(yè)能力在背后供給。

“最近有人問我,如果時間倒退至五年前,作為國內最大整機廠商,我們是否會選擇做芯片,答案或許還是堅持我們當時的選擇,專注做整機。”浪潮集團副總裁郭強表示,目前市面上常見的算力來源包括先進算力、合規(guī)算力以及國產自主可控的芯片產品。三種算力多元共存,衍生出算力出海、算力入關、算力購買等不同的應用模式。

在大模型行業(yè)總體欣欣向榮的趨勢下,作為算力企業(yè)的代表,郭強也提出了幾點建議。

其一是大模型企業(yè)應堅持“發(fā)展”和“底線”兩種思維,了解自己應該生成怎樣的大模型應用,來支撐當下我國的數(shù)字化轉型戰(zhàn)略,同時兼顧技術的自主可控。其二是當數(shù)據的作用和能量越來越大,企業(yè)應該把80%以上的精力放在非算力上,不要盲目擴大算力支出。其三是選擇算力時,應當綜合考慮性價比,包括能耗、穩(wěn)定性、安全性等,“持有算力設備和用好手中的算力,其實是兩碼事。”

大模型社區(qū)重塑區(qū)域產業(yè)空間

過去人們會問,“為何沒有互聯(lián)網大廠在上海。”如今這個問題似乎開始“過時”。

圓桌討論環(huán)節(jié),主持人在介紹全國首個大模型創(chuàng)新生態(tài)社區(qū)“模速空間”一年多來的建設成果時,上海大模型生態(tài)發(fā)展有限公司(模速空間)總經理陳海慈現(xiàn)場“校準”了數(shù)據:目前,模速空間三期總計交付3萬平方米,集聚104家大模型企業(yè),上海通過備案上線的34款大模型中,模速空間所在的徐匯區(qū)占到了22個,占比高達65%。

記者發(fā)現(xiàn),過去一年來,每隔一段時間參與此類科技論壇,模速空間的“成績單”都有動態(tài)變化的增量,側面反映出大模型產業(yè)的發(fā)展速度。在陳海慈看來,擁抱瞬息萬變的大模型產業(yè),徐匯區(qū)和模速空間的具體舉措可用“誠心誠意、真金白銀、揚長補短”來概括。

“本周,模速空間就將發(fā)放完畢今年第三批算力補貼,今年累計已達1億元;預計到四季度結束,全年為入駐企業(yè)發(fā)放的算力補貼將達1.5億元?!标惡4缺硎?,北京、上海和深圳被視為中國三大“大模型之城”,其中上海正用“真金白銀”的算力補貼支持大模型產業(yè)發(fā)展。在此過程中,上海正積極發(fā)揮在營商環(huán)境、市場環(huán)境、金融中心建設等方面的優(yōu)勢,規(guī)模達225億元的上海三大先導產業(yè)人工智能母基金已于今年8月正式落地徐匯區(qū)。

“上海的大模型行業(yè)從業(yè)者可以經常去北京的中關村東路走走,那里集聚了清華、北大、人大,是創(chuàng)新濃度高度集聚的地方?!标惡4日f。

在創(chuàng)新策源力上“補短”,上海已經邁開了步子。眼下,包括上海人工智能實驗室、國家人工智能學院、上海交通大學人工智能學院等高校和新型研發(fā)機構均已落地徐匯區(qū)。上述機構均位于模速空間15分鐘車程之內,助力模速空間打造垂直向的高濃度創(chuàng)新容器。

當天論壇現(xiàn)場,徐匯區(qū)還同步啟動了“科創(chuàng)繡帶”系列項目,其中包括了“央視聽媒體大模型體育技戰(zhàn)術分析系統(tǒng)”、大模型語料“超級工廠”等一批新項目。記者了解到,未來,徐匯區(qū)將整合科創(chuàng)成果、機構、人才、資金等資源,提供更優(yōu)質的成果轉化全周期服務。

責編:寧靜

一審:寧靜

二審:胡澤匯

三審:張德會

來源:上觀新聞

我要問