人工智能大模型應(yīng)用落地,算力需求該如何滿足?
在算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展2025年目標(biāo)時(shí)間表的大政策背景下,我國(guó)生成式人工智能(AIGC)服務(wù)和大模型產(chǎn)業(yè)生態(tài)發(fā)展現(xiàn)狀如何?通用大模型和行業(yè)大模型產(chǎn)業(yè)發(fā)展的核心競(jìng)爭(zhēng)力到底是什么?在產(chǎn)業(yè)數(shù)字化進(jìn)程中,國(guó)產(chǎn)大模型的“千模大戰(zhàn)”狀態(tài)會(huì)持續(xù)多久?
——編者
想要回答上述問題,我們可以從剛剛在遼寧沈陽(yáng)閉幕的中國(guó)計(jì)算機(jī)大會(huì)(CNCC2023)上尋找答案。作為中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的計(jì)算機(jī)領(lǐng)域級(jí)別高、規(guī)模大的高端學(xué)術(shù)會(huì)議,CNCC今年以“發(fā)展數(shù)字基礎(chǔ)設(shè)施,支撐數(shù)字中國(guó)建設(shè)”為主題,在130個(gè)技術(shù)論壇和20余場(chǎng)專題活動(dòng)中,有近30場(chǎng)活動(dòng)都對(duì)近來火熱的人工智能與大模型做了深層次解析。記者在同期舉辦的“超智融合AI大模型應(yīng)用落地發(fā)展,高效計(jì)算新范式”專題論壇中,找到了一些可以回答這些問題的觀點(diǎn)和建議。
算力、算法、數(shù)據(jù)
——AIGC技術(shù)發(fā)展與安全并重
“無算力、不模型”。自生成式人工智能服務(wù)(AIGC)和GPT大模型訓(xùn)練爆火后,圍繞算力、算法和數(shù)據(jù)相關(guān)的討論此起彼伏,中文語(yǔ)境下的國(guó)產(chǎn)大模型應(yīng)用更是呈現(xiàn)出“千模大戰(zhàn)”的狀態(tài)。
今年,我國(guó)先后出臺(tái)了《生成式人工智能服務(wù)管理暫行辦法》和《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,對(duì)AIGC技術(shù)與產(chǎn)業(yè)發(fā)展背后的算力基礎(chǔ)設(shè)施做了詳細(xì)規(guī)劃。其中,《行動(dòng)計(jì)劃》從計(jì)算力、運(yùn)載力、存儲(chǔ)力以及應(yīng)用賦能四個(gè)方面提出了到2025年算力基礎(chǔ)設(shè)施發(fā)展的量化指標(biāo),計(jì)算力方面,算力規(guī)模超過300EFLOPS,智能算力占比達(dá)到35%;存儲(chǔ)力方面,存儲(chǔ)總量超過1800EB,先進(jìn)存儲(chǔ)容量占比達(dá)到30%以上。
智能算力是上述專題活動(dòng)探討的主題。圍繞人工智能大模型算法優(yōu)化以及應(yīng)用落地過程中面臨的現(xiàn)實(shí)問題,來自中國(guó)科學(xué)院、中國(guó)信息通信研究院、中國(guó)人民大學(xué)、北京平博pinnacle体育官网計(jì)算有限責(zé)任公司等產(chǎn)學(xué)研用機(jī)構(gòu)的嘉賓共同討論了技術(shù)應(yīng)用、人才培養(yǎng)、行業(yè)創(chuàng)新、內(nèi)容安全等焦點(diǎn)話題。
“人工智能大模型在業(yè)務(wù)訓(xùn)練過程中從推理、問答、檢測(cè)到描述,重點(diǎn)在于解決連續(xù)性問題?!敝袊?guó)人民大學(xué)高瓴人工智能學(xué)院教授、博導(dǎo)盧志武表示,通用大模型在文本、圖片、音視頻等多模態(tài)內(nèi)容生成能力上還存在許多需要解決的問題,“從多圖理解、物體定位、OCR等業(yè)務(wù)功能上,多模態(tài)大模型對(duì)于任務(wù)預(yù)訓(xùn)練和數(shù)據(jù)指令微調(diào)等都需要完善升級(jí),在應(yīng)用場(chǎng)景落地時(shí),如何通過大模型訓(xùn)練去解決用戶的多元化復(fù)雜需求非常重要?!?/p>
“數(shù)據(jù)對(duì)于大模型的訓(xùn)練和應(yīng)用來說是至關(guān)重要的,現(xiàn)在大模型需要的數(shù)據(jù)是用哪些數(shù)據(jù)和指令集類型來讓大模型具備什么樣的能力。本質(zhì)上它是一個(gè)多樣性和覆蓋面的研究性問題,這與記憶學(xué)習(xí)和深度學(xué)習(xí)的數(shù)據(jù)有所區(qū)別?!敝袊?guó)科學(xué)院自動(dòng)化所副研究員孔慶超認(rèn)為,人工智能大模型在國(guó)內(nèi)的發(fā)展仍需要投入研發(fā)力量,行業(yè)大模型在不同行業(yè)的應(yīng)用探索是否一定會(huì)產(chǎn)生成果,這就需要通過大量的算法去做邏輯推理,例如,金融行業(yè)大模型是否有更多算法來支持生成投資決策參考意見,這樣的大模型是否具備迭代和學(xué)習(xí)等能力,都需要做充足的預(yù)訓(xùn)練和技術(shù)研發(fā)。
專家指出,數(shù)據(jù)、算法和算力是新型信息基礎(chǔ)設(shè)施的重要組成部分,算力基礎(chǔ)設(shè)施呈現(xiàn)多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對(duì)于助推產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、賦能科技創(chuàng)新進(jìn)步等具有重要意義。在生成式人工智能技術(shù)方面,打造并完善算力、數(shù)據(jù)和算法三位一體的協(xié)同應(yīng)用生態(tài),通用大模型和行業(yè)大模型都在做應(yīng)用“減法”,讓大模型從“玩具”到“工具”轉(zhuǎn)變。讓技術(shù)落地、讓成果產(chǎn)生價(jià)值、讓服務(wù)匹配業(yè)務(wù),這或許就是人們正在討論的大模型未來生態(tài)。
中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心人工智能部副主任王玨認(rèn)為,國(guó)產(chǎn)大模型在應(yīng)用落地和業(yè)務(wù)適配方面,關(guān)鍵在于數(shù)據(jù)清洗?!拔覀円苍趪L試各種模型,無論是準(zhǔn)確度還是計(jì)算效率,面臨的挑戰(zhàn)就是國(guó)產(chǎn)開源大模型的穩(wěn)定性,這方面我們做了很多工作,通過文獻(xiàn)數(shù)據(jù)促進(jìn)各學(xué)科科研發(fā)展。同時(shí),讓國(guó)產(chǎn)大模型好用也是我們的研究方向。”
“人工智能、大數(shù)據(jù)、云計(jì)算等新一代信息技術(shù)加速了大模型的發(fā)展。通用或行業(yè)大模型研究訓(xùn)練離不開大量的算力支撐。”并行科技董事長(zhǎng)陳健博士認(rèn)為,從產(chǎn)業(yè)發(fā)展的角度來看,算力是工業(yè)產(chǎn)品,行業(yè)大模型訓(xùn)練對(duì)于算力的需求需要找準(zhǔn)方向才好發(fā)力。
技術(shù)、應(yīng)用、生態(tài)
——提升大模型準(zhǔn)確率與效率
大模型應(yīng)用對(duì)于高頻次的算力資源需求,往往與大模型升級(jí)迭代的多元場(chǎng)景應(yīng)用能力建設(shè)息息相關(guān)。當(dāng)前、中文語(yǔ)境下的大模型生態(tài)還面臨哪些問題,交叉學(xué)科人才培養(yǎng)合作機(jī)制和產(chǎn)業(yè)鏈上下游能為大模型帶來哪些深層次變革?在接受記者提問時(shí),多位嘉賓也談到了目前大模型所提供服務(wù)過程中亟待解決的一些行業(yè)性問題。
早期AIGC技術(shù)的發(fā)展,從各個(gè)鏈條和語(yǔ)義理解上產(chǎn)生了大量的大模型內(nèi)容生成的“幻覺”問題,即“一本正經(jīng)的胡說八道”。在中國(guó)信息通信研究院融創(chuàng)中心主任田輝看來,新興技術(shù)的行業(yè)應(yīng)用一定是需要產(chǎn)學(xué)研用結(jié)合才能健康的狀態(tài),“AIGC技術(shù)的分工角色更細(xì),產(chǎn)業(yè)應(yīng)用的開發(fā)、部署和應(yīng)用都是需要產(chǎn)業(yè)鏈共同合作。如大模型的二次開發(fā),迭代升級(jí)、運(yùn)維服務(wù)等領(lǐng)域的人才培養(yǎng)機(jī)制,都需要細(xì)分與合作?!?/p>
AIGC技術(shù)產(chǎn)業(yè)進(jìn)入“千模大戰(zhàn)”狀態(tài)后,最終我們所依靠的核心競(jìng)爭(zhēng)力是什么?業(yè)內(nèi)人士認(rèn)為,AIGC技術(shù)產(chǎn)業(yè)的發(fā)展方向或路徑是從人工智能技術(shù)升級(jí)方面,提升大模型的理解、生成、邏輯推理和記憶等核心基礎(chǔ)能力;在場(chǎng)景應(yīng)用落地方面,強(qiáng)化大模型的學(xué)習(xí)能力,提升生成服務(wù)準(zhǔn)確率和效率;在行業(yè)生態(tài)建設(shè)方面,提升大模型的智能化水平和生態(tài)應(yīng)用空間,打造成為輔助決策的實(shí)操性工具。
“平博pinnacle体育官网采用超算架構(gòu)模式構(gòu)建智能算力資源,將分布在國(guó)內(nèi)的各大算力中心資源進(jìn)行整合,可以最大限度地利用現(xiàn)有資源,降低因空閑資源浪費(fèi)而產(chǎn)生的損失。同時(shí)也可以有效滿足人工智能大模型訓(xùn)練對(duì)算力的高頻次需求?!北本?#24179;博pinnacle体育官网計(jì)算有限責(zé)任公司總經(jīng)理吳迪介紹說,以超級(jí)計(jì)算機(jī)為代表的超算架構(gòu)能夠提供更加全面高效的并行計(jì)算能力,為大模型訓(xùn)練處理提供算力服務(wù)支持,實(shí)現(xiàn)更高效的模型訓(xùn)練以及更好的預(yù)測(cè)準(zhǔn)確度。
王玨表示,行業(yè)大模型的發(fā)展離開算力就會(huì)拉大行業(yè)差距?!白屗懔Y源能更好地去跑這些大模型,保持其精度或者泛化能力不變,提升大模型訓(xùn)練的速度和效率,能夠真正并盡快在大模型訓(xùn)練上實(shí)現(xiàn)全棧國(guó)產(chǎn)化,這是研究的熱點(diǎn)。”
“希望大模型的行業(yè)應(yīng)用發(fā)展看到有百花齊放的生態(tài),但需要關(guān)注的是低水平重復(fù)工作的問題。無論是數(shù)量還是類型,大模型的產(chǎn)品或商業(yè)形態(tài)還有很多探索空間?!碧镙x認(rèn)為,AIGC技術(shù)的發(fā)展最終的落地在于內(nèi)容服務(wù)?!叭绾翁嵘郎?zhǔn)確率和效率,誰(shuí)的平臺(tái)投入的力量足夠,大模型訓(xùn)練的速度和效率,以及應(yīng)用適配更強(qiáng),誰(shuí)就能突破成功?!?/p>