上觀新聞 2024-09-05 10:31:11
向外界展示如何用好AI、管好AI是本屆外灘大會(huì)和過去最大的不同。
9月4日,2024外灘大會(huì)在上海開幕的前一天,一條人工智能相關(guān)的新聞沖上網(wǎng)絡(luò)熱搜:外灘大會(huì)全球Deepfake(深度偽造技術(shù))挑戰(zhàn)賽的參賽選手之一,中國(guó)科學(xué)院的“95后”女性算法工程師張欣怡宣布,已將近期參加挑戰(zhàn)賽的AI模型向全球開源,希望以此降低Deefake對(duì)抗的使用門檻,援助Deepfake受害者,守護(hù)真實(shí)世界。
結(jié)合近期韓國(guó)互聯(lián)網(wǎng)爆出的Deepfake女性受害事件,張欣怡的做法在網(wǎng)絡(luò)刷屏。人工智能的應(yīng)用與擔(dān)憂再次成為飽受集體關(guān)注的公共性事件。
探尋2024外灘大會(huì),AI等未來技術(shù)不再是空想,大量的落地應(yīng)用已經(jīng)成為展會(huì)主流。向外界展示如何用好AI、管好AI是本屆外灘大會(huì)和過去最大的不同。無論想與不想,安全與風(fēng)險(xiǎn),人工智能都在迅速地改變現(xiàn)實(shí)世界。
AI應(yīng)用勢(shì)如破竹
多年前,金庸先生在接受采訪時(shí)透露過他的文學(xué)創(chuàng)作門道:先構(gòu)思好人物性格,然后再按設(shè)定好的人物性格去編情節(jié)。這可能代表了許多人類作家的文學(xué)創(chuàng)作思路。
金庸先生肯定不會(huì)想到,如今機(jī)器也是循著同樣的路徑創(chuàng)作作品的(雖然我們還不能確定機(jī)器的創(chuàng)作是不是真的稱得上作品)。在本屆外灘大會(huì)的現(xiàn)場(chǎng),有關(guān)輔助創(chuàng)作的大模型產(chǎn)品層出不窮,有的定位于幫寫作者梳理寫作線索和思路,生成思維導(dǎo)圖;有的定位于幫寫作者完成擴(kuò)寫,豐富文章內(nèi)容;甚至還有工具可以幫助創(chuàng)作者將剛剛寫好的故事生成視頻,頃刻之間,想法已經(jīng)轉(zhuǎn)化成多種形態(tài)的作品。
不僅是模仿人、替代人完成一部分工作,人工智能甚至可以超越人類,完成一些過去很難實(shí)現(xiàn)的任務(wù)。2020年,麻省理工學(xué)院的研究人員宣布發(fā)現(xiàn)了一種新型抗生素,能夠消滅此前對(duì)所有已知抗生素都有耐藥性的細(xì)菌菌株。傳統(tǒng)上,一種新藥的研發(fā)需要研究人員從上千種潛在分子著手,通過不斷試錯(cuò),篩選出少量候選分子。麻省理工學(xué)院則另辟蹊徑,讓人工智能參與篩選分子數(shù)據(jù)庫,最終在6.1萬個(gè)分子中找到一個(gè)符合標(biāo)準(zhǔn)的,研究人員把它命名為海利霉素(Halicin)。
近兩三年,人工智能快速發(fā)展,人們大膽預(yù)測(cè):它正在“接管藥物研發(fā)”“改變好萊塢講故事的方式”,并可能“改變科學(xué)本身”。它的一些能力甚至已經(jīng)超越了人類的理解。
雖說預(yù)期有無限可能,但人工智能究竟能做什么、不能做什么,我們依然沒有完全確定。只是業(yè)界發(fā)現(xiàn),越大的模型、越多的數(shù)據(jù),就有可能讓人工智能更加智能。業(yè)界把它稱作“規(guī)模法則”(scaling laws),也有人更具象化地說成是“暴力美學(xué)”。
我們也還沒有完全確定,現(xiàn)有的千行百業(yè)如何嫁接人工智能的魔力。到目前為止,人工智能只在一些特定領(lǐng)域顯示了超凡的能力,比如人臉識(shí)別、文字翻譯、內(nèi)容生成……但是人工智能模型不擅長(zhǎng)邏輯和推理,因而也不清楚自己的輸出是否符合人類需求,它依賴人類來界定它所解決的問題。就像發(fā)現(xiàn)海利霉素,人工智能需要人類為目標(biāo)分子設(shè)立標(biāo)準(zhǔn):能夠殺死致病菌、與現(xiàn)有抗生素不同、無毒。
也許更多模型參數(shù)、更大數(shù)據(jù)量能改善人工智能的邏輯和推理,使它涌現(xiàn)出更高智能。但“規(guī)模法則”是否有邊界?起碼現(xiàn)在看來,人工智能只是精心制作的代碼,沒有生命或自主能力。人工智能的革命性能力仍然依賴于人類的判斷。
2024外灘大會(huì)上展示的一些AI輔助辦公工具。
數(shù)據(jù)問題仍需解決
人類是如何學(xué)習(xí)的?這個(gè)問題很難有一個(gè)簡(jiǎn)單的回答。我們耳濡目染,我們歸納推理,我們做科學(xué)實(shí)驗(yàn),我們甚至去天馬行空地冥想。人類學(xué)習(xí)不依賴于某種單一途徑。
人工智能的學(xué)習(xí)方法和人類迥異。當(dāng)前人工智能普遍運(yùn)用一種叫作“深度學(xué)習(xí)”的方法。在這種學(xué)習(xí)方法中,人工智能依據(jù)數(shù)學(xué)和統(tǒng)計(jì)學(xué)方法處理大量數(shù)據(jù),從中獲得某種規(guī)律。數(shù)據(jù)是人工智能的食糧,數(shù)量越多、質(zhì)量越高,就意味著人工智能可能有越優(yōu)良的表現(xiàn)。谷歌和Meta的人工智能模型已經(jīng)接受了超過1萬億個(gè)單詞的訓(xùn)練。要知道,維基百科的總單詞量只有約40億個(gè)。
在外灘大會(huì)的提前探訪中,不少AI企業(yè)都提到了數(shù)據(jù)的問題:高質(zhì)量數(shù)據(jù)的生成速度遠(yuǎn)低于人工智能大模型的需求,數(shù)據(jù)短缺問題已初現(xiàn)端倪。研究機(jī)構(gòu)Epoch AI預(yù)計(jì),可用于訓(xùn)練的高質(zhì)量文本可能在2028年前耗盡。在中文世界,數(shù)據(jù)問題更加棘手。阿里研究院5月發(fā)布的《大模型訓(xùn)練數(shù)據(jù)白皮書》顯示,互聯(lián)網(wǎng)上中文語料和英文語料占比存在顯著差異:在全球網(wǎng)站中,英文占比高達(dá)59.8%,而中文僅占1.3%。在業(yè)界,數(shù)據(jù)短缺問題也被稱為“數(shù)據(jù)墻”。 如何處理這堵墻迫在眉睫。
一種方法是注重?cái)?shù)據(jù)質(zhì)量而非數(shù)量。人工智能企業(yè)對(duì)數(shù)據(jù)進(jìn)行過濾和排序,以最大限度地提高模型的學(xué)習(xí)效率。關(guān)于世界的真實(shí)信息顯然很重要,邏輯推理也很重要。因此,學(xué)術(shù)教科書(而不是未經(jīng)篩選的互聯(lián)網(wǎng)數(shù)據(jù))就顯得尤為珍貴。
另一種方法是使用合成數(shù)據(jù),這些數(shù)據(jù)由機(jī)器創(chuàng)建,因此是無限的。谷歌子公司DeepMind制作的圍棋模型AlphaGo Zero就是一個(gè)很好的例子。AlphaGo Zero沒有使用任何已有棋譜數(shù)據(jù),而是通過自我對(duì)弈490萬次來學(xué)習(xí)圍棋,并記錄下獲勝的策略。這種“強(qiáng)化學(xué)習(xí)”通過模擬大量可能的應(yīng)對(duì)方法,并選擇勝算最大的,教會(huì)模型如何應(yīng)對(duì)對(duì)手的棋步。
就像深藏地底的石油驅(qū)動(dòng)了工業(yè)進(jìn)步,散布在互聯(lián)網(wǎng)和人類文本中的數(shù)據(jù)驅(qū)動(dòng)了人工智能不斷升級(jí)。但在不久的未來,石油、數(shù)據(jù)終將枯竭,我們需要尋找新的、可再生的替代品。
數(shù)據(jù)在未來會(huì)變成像石油一樣的寶貴資源。
安全擔(dān)憂從未停止
一個(gè)擺在人們面前的問題是,隨著AI落地應(yīng)用的普及,越來越多由AI引發(fā)的倫理安全風(fēng)險(xiǎn)也隨之暴露。
8月底,一場(chǎng)對(duì)Deepfake濫用的聲討席卷韓國(guó)互聯(lián)網(wǎng)。事件的起因是有部分韓國(guó)網(wǎng)民在社交媒體上傳播用Deepfake技術(shù)制造的“換頭”色情圖片、影像,被涉及對(duì)象有女明星、女學(xué)生,甚至有未成年女孩。
Deepfake“換頭”,通俗來說就是使用人工智能生成技術(shù),將不同個(gè)人的聲音、面部特征和身體動(dòng)作拼接起來,合成虛構(gòu)的圖像或視頻。
這些用AI技術(shù)合成的影像、視頻幾乎以假亂真,被用于制作和傳播不僅嚴(yán)重侵犯了個(gè)人隱私權(quán)和名譽(yù)權(quán),更對(duì)涉及女性心理造成了深刻的負(fù)面影響。
人們不得不承認(rèn),客觀上,AI技術(shù)的快速發(fā)展加劇了犯罪手段的更新。今年年初,國(guó)外“文生視頻”應(yīng)用軟件Sora曾刷屏互聯(lián)網(wǎng)。當(dāng)時(shí)即有人提出,人工智能生成技術(shù)發(fā)展太快,內(nèi)容很容易不受控制,被應(yīng)用于黃色、犯罪產(chǎn)業(yè)。
考慮到內(nèi)容生產(chǎn)上的風(fēng)險(xiǎn)和成本控制,截至目前,Sora模型尚未正式向公眾免費(fèi)開放。OpenAI選擇向一組精選的“紅隊(duì)成員”開放Sora,這些成員是專門評(píng)估AI模型風(fēng)險(xiǎn)和識(shí)別潛在問題的專家,他們將從各個(gè)角度“對(duì)抗性”地測(cè)試這個(gè)模型。
為了解決這些AI內(nèi)容生成安全問題,業(yè)界已經(jīng)開始了探索。在本次外灘大會(huì)的前沿科技展區(qū),專門設(shè)立了一所未來安全實(shí)驗(yàn)室,囊括了多個(gè)國(guó)內(nèi)互聯(lián)網(wǎng)安全、AI安全和檢測(cè)的前沿產(chǎn)品,其中就包括了螞蟻集團(tuán)蟻天鑒推出的“AI鑒真”解決方案。參觀者可以現(xiàn)場(chǎng)對(duì)AI生產(chǎn)的圖片、視頻、音頻進(jìn)行鑒定。
螞蟻大安全的一位工作人員告訴記者,目前大部分利用AI生成技術(shù)進(jìn)行的違法活動(dòng)都是批量化生產(chǎn),單個(gè)目標(biāo)的偽造成本不會(huì)很高,通過對(duì)抗模型的構(gòu)建,一般都可以甄別其真?zhèn)巍S绕湓趫D像識(shí)別領(lǐng)域,準(zhǔn)確率甚至可達(dá)99.99%。
此外,本次外灘大會(huì)首次舉辦的AI創(chuàng)新賽還專門設(shè)立了全球Deepfake挑戰(zhàn)賽,邀請(qǐng)來自海外高校的技術(shù)團(tuán)隊(duì),聚焦國(guó)際最熱的安全、欺詐風(fēng)險(xiǎn)問題,探索更多Deepfake對(duì)抗技術(shù)。
外灘大會(huì)設(shè)立的“AI鑒真”展臺(tái)
AI已經(jīng)無處不在
盡管人們對(duì)AI還不能完全掌控,但市場(chǎng)對(duì)AI應(yīng)用的熱情并不會(huì)就此停下。
可能在不知不覺中,普通人的生活就已被AI產(chǎn)品包圍。除了前文提到的兒童手表,AI大模型可以嵌入一切智能設(shè)備,例如智能手機(jī)、智能音箱、智能家電等。再大一點(diǎn),內(nèi)置了AI大模型的智能汽車也已經(jīng)問市多時(shí)。
就拿AI上車來說,目前已有蔚來、理想、小米、智己等多家車企宣布將AI大模型嵌入汽車的智能座艙,以實(shí)現(xiàn)用戶和車機(jī)的智能語音互動(dòng)。更重要的是,AI技術(shù)突破正在幫助全球智能駕駛研發(fā)提速,無人車正離人類越來越近。
近期武漢的“無人出租車”爆火后,其“無人駕駛”技術(shù)曾受到多方質(zhì)疑。很多人猜測(cè),“無人出租車”之所以能夠無人駕駛,是有駕駛員在線上遠(yuǎn)程控制,全靠真人遠(yuǎn)程代駕。實(shí)際上,“蘿卜快跑”出租車雖然配備了遠(yuǎn)程操控員,但操控員并不會(huì)直接干預(yù)汽車的駕駛,只會(huì)在極端情況發(fā)生時(shí)對(duì)車輛進(jìn)行接管,而且一人負(fù)責(zé)監(jiān)測(cè)多臺(tái)汽車。商業(yè)出租車能夠?qū)崿F(xiàn)無人駕駛,正是因?yàn)锳I技術(shù)的賦能,讓車機(jī)能夠?qū)崟r(shí)處理來自傳感器的數(shù)據(jù),識(shí)別道路狀況,做出駕駛決策,如加速、減速、轉(zhuǎn)向等。
這就是一則AI影響人類生活的直觀案例。技術(shù)的突飛猛進(jìn)正在改變車主的生活,甚至司機(jī)的生活。不少人可能會(huì)因此失業(yè),但新的就業(yè)機(jī)會(huì)也在AI產(chǎn)業(yè)浪潮中不斷涌現(xiàn)。
在上海臨港,一批過去從事網(wǎng)約車行當(dāng)?shù)乃緳C(jī)已經(jīng)上崗無人車安全員。賽可智能測(cè)試車隊(duì)的一名安全測(cè)試員告訴記者,在測(cè)試車隊(duì)上班,一天8到10個(gè)小時(shí),工資和過去開網(wǎng)約車差不多,都能過萬元,但是工作量確實(shí)小了不少。這種新的生活方式正在逐漸被大眾所接受。
責(zé)編:寧靜
一審:寧靜
二審:胡澤匯
三審:張德會(huì)
來源:上觀新聞
我要問