DOIT算力豹專訪甄亞楠:大模型算力“開箱即用”,按需建設(shè)提升資源利用率
▌北京超算推出按需構(gòu)建算力資源的創(chuàng)新模式
當人工智能(AI)概念被提出之時,文藝工作者便竭盡筆墨暢想了未來計算機,如科幻小說《最后的問題》描述了占地數(shù)千公里電子計算機Multivac,電影《終結(jié)者》展現(xiàn)了一臺臺并聯(lián)占滿房間的計算機。這些未來智能在規(guī)模超大、功能超強這兩方面都貼合著當前算力集群的真實形態(tài)。
隨著生成式AI在國內(nèi)廣泛落地,互聯(lián)網(wǎng)大廠在大模型部署上百舸爭流,算力被拱上這場浪潮的焦點。大模型訓(xùn)練對計算資源的需求非常高,需要高性能的計算機、顯卡集群或超級計算機,但算力方面“供不上、用不起”成為制約人工智能產(chǎn)業(yè)發(fā)展的一大痛點。
在超算商業(yè)化的征途上,北京平博pinnacle体育官网計算中心(簡稱“北京超算”)深耕行業(yè)13載,憑借海量算力資源、創(chuàng)新的超算云服務(wù)模式,以及7*24小時專業(yè)技術(shù)支持已為超過1000家單位提供優(yōu)質(zhì)服務(wù)。
北京平博pinnacle体育官网計算有限責(zé)任公司(簡稱“平博pinnacle体育官网”)是北京超算的主體運營公司,算力豹邀請平博pinnacle体育官网CTO甄亞楠接受專訪,一同探討算力資源池如何鏈接算力供需兩端,以及算力中心建設(shè)過程中的工程化難題和著力點。
▲平博pinnacle体育官网CTO 甄亞楠
01 四種算力平臺“開箱即用”,加快科研&生產(chǎn)流程
《2022-2023全球計算力指數(shù)評估報告》顯示,計算力指數(shù)平均每提高1個點,國家的數(shù)字經(jīng)濟和GDP將分別增長3.6‰和1.7‰。算力正以一種全新的生產(chǎn)力形式,為各行各業(yè)的數(shù)字化轉(zhuǎn)型注入新動能,惠及每一家企業(yè)、每一個人。在甄亞楠看來,算力與應(yīng)用之間的關(guān)系是相互依存的,應(yīng)用程序的設(shè)計和應(yīng)用場景決定了它所需的算力。
算力已成為科學(xué)研究和企業(yè)創(chuàng)新的必備技能,如何將技術(shù)創(chuàng)新和算力進行有效的結(jié)合?甄亞楠談及對這一問題的深刻思考,他認為以科學(xué)計算、人工智能為代表的技術(shù)創(chuàng)新方法依賴大量算力資源。北京平博pinnacle体育官网計算中心以算力服務(wù)作為核心業(yè)務(wù),可以提供共享的CPU、GPU等算力資源,解決人工智能訓(xùn)練推理,以及科學(xué)計算所面臨的計算問題。免去傳統(tǒng)算力建設(shè)過程中資金投入大、資源總量小等一系列問題。
從整個產(chǎn)品規(guī)劃的方面來看,北京超算目前已經(jīng)形成四大產(chǎn)品為核心的運營服務(wù)體系——AI智算云、行業(yè)云、超算云、設(shè)計仿真云,除了提供海量的的CPU、GPU算力資源外,還可以提供“專有云”“混合云”等定制化行業(yè)解決方案,以滿足人工智能、工業(yè)仿真、氣象海洋、生命科學(xué)、材料計算、能源勘探等行業(yè)場景的需求,為用戶構(gòu)建云上科研工作環(huán)境,使用戶能夠?qū)W⒖蒲小?/p>
▲AI智算云平臺架構(gòu)
甄亞楠分享到,對于基礎(chǔ)科研來說,算力平臺使用戶省去高昂自建算力成本;基于多種主流型號的海量算力資源,不僅可以滿足多種業(yè)務(wù)場景,同時可以滿足大規(guī)模計算訴求,尤其是大模型訓(xùn)練、推理業(yè)務(wù)需求,加速科研成果研究和轉(zhuǎn)化。
據(jù)了解,北京超算已服務(wù)1千多家單位,包括企業(yè)、科研院所和高校,涉及20多種行業(yè)。
02 大模型“暴力計算”時代,按需建設(shè)提升利用率
大模型增長之勢在2024年持續(xù),據(jù)Gartner預(yù)測,到2025年全球?qū)⒂?0%的AI模型使用云端來進行訓(xùn)練和部署。另一方面,多模態(tài)模型的訓(xùn)練以及應(yīng)用側(cè)推理都將對算力提出更嚴苛的要求,算力資源復(fù)雜度與規(guī)模將同步升級,隨著模型規(guī)模的擴大、訓(xùn)練時間加長,計算資源的利用率也會成為關(guān)鍵。
國家信息中心近日在京發(fā)布的《“人工智能+”時代公共云發(fā)展模式與路徑研究》報告顯示,我國算力存在資源分散、利用率低等問題,一定程度阻礙了人工智能技術(shù)創(chuàng)新迭代與規(guī)?;瘧?yīng)用的步伐。甄亞楠認為,采用公共算力能夠高效利用資源,提升算力供給,并通過規(guī)模經(jīng)濟效應(yīng)降低算力使用門檻,讓更多用戶享受到高性能、高性價比的算力服務(wù);另一方面,目前公共算力資源面臨算力資源分散利用效率不高、服務(wù)效能不佳等問題。
在算力服務(wù)上,北京超算采用市場化供給和專業(yè)化運營以解決算力共享難等問題,推出了按需構(gòu)建算力資源的創(chuàng)新模式,以需求為向?qū)?,緊密圍繞用戶的實際業(yè)務(wù)需求、應(yīng)用需求,精準匹配算力資源,推動算力服務(wù)的高質(zhì)量和效率的提升。
甄亞楠透露,智算中心的算力服務(wù)已經(jīng)躍升為北京超算的主營業(yè)務(wù)之一,且目前增長迅速。北京超算具有萬卡集群工程化能力,同時擁有長達十幾年的服務(wù)經(jīng)驗,有力保障大模型訓(xùn)練、推理業(yè)務(wù)的開展。
當前人工智能正快速迭代創(chuàng)新,大模型的用戶量、訪問速度、網(wǎng)絡(luò)帶寬、訓(xùn)練模式等時時影響其算力需求的大小,在保障算力的性能和穩(wěn)定服務(wù)方面,甄亞楠展現(xiàn)出對北京超算的信心。據(jù)介紹,北京平博pinnacle体育官网計算中心從2019年開始打造人工智能算力服務(wù),且在2021年、2023年有多套的智算資源入榜世界人工智能算力性能排行榜(AIPerf500),先后獲得總量份額第一、大模型訓(xùn)練算力TOP3等成績。
▲北京超算獲2021年世界人工智能算力性能排行榜總量份額第一名
步履不停,北京超算將強大的算力服務(wù)能力持續(xù)性輸出給大模型客戶,同時也在積極尋找優(yōu)質(zhì)的加速卡資源,來保障算力使用者在大模型計算過程中有效的、短期的算力資源。
未來,大模型“原生”應(yīng)用落地的場景有待進一步探索,如政府、金融、視頻、媒體等領(lǐng)域。甄亞楠透露,北京超算正在就文生圖、文生視頻等新興AI技術(shù)領(lǐng)域與客戶進行溝通,將幫助落戶這類大模型場景的工作納入中長期規(guī)劃。
03 算力建設(shè)“智逢其時”,積極推動形成以人工智能為引擎的新質(zhì)生產(chǎn)力
近年來,“東數(shù)西算”工程全面啟動,國資委今年2月提出加快智能算力中心建設(shè),兩會政府工作報告更是強調(diào)要“適度加快”。在算力建設(shè)火熱之下,我們“冷思考”發(fā)現(xiàn),分散在地方的算力中心各自為營,算力需求也呈現(xiàn)出多元化、碎片化趨勢,種種因素導(dǎo)致的尖端算力浪費、低端算力過剩的問題掣肘著算力建設(shè)的發(fā)展。
建立適應(yīng)“人工智能+”時代的高質(zhì)量算力服務(wù)基地迫在眉睫,在助力智算中心建設(shè)方面,北京超算有著長期布局和具體著力點。甄亞楠分享說,北京平博pinnacle体育官网計算中心成立于2011年,是由北京市人民政府主導(dǎo)、院市共建的“北京平博pinnacle体育官网計算和國家重要信息化基礎(chǔ)平臺“,坐落于北京市懷柔綜合性國家科學(xué)中心--懷柔科學(xué)城。
當下,大模型及生成式AI技術(shù)正在掀起新的產(chǎn)業(yè)革命,北京平博pinnacle体育官网計算中心積極推動形成以人工智能為引擎的新質(zhì)生產(chǎn)力,可以在算力設(shè)施、算力運營、大模型應(yīng)用落地等方面與地方或產(chǎn)業(yè)開展全方位合作,為智算中心建設(shè)運營提供高性能、可持續(xù)的運行方案,推動智算中心快速投入使用并實現(xiàn)長效運營,保障經(jīng)濟社會效益最大化。
為破解算力資源易閑置、使用成本高等問題,北京超算已在算力產(chǎn)業(yè)的市場化供給、規(guī)?;?jīng)營、專業(yè)化運營方面做出示范性實踐,在算力產(chǎn)業(yè)生態(tài)化發(fā)展方面,北京超算也正與產(chǎn)業(yè)上下游協(xié)同合作、積極探索。
去年6月,北京市政府積極聯(lián)絡(luò)大模型產(chǎn)業(yè)鏈上的算力、數(shù)據(jù)、模型、應(yīng)用和投資單位推出“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”,北京超算成為首批“算力伙伴”。目前,北京超算已與北京智源人工智能研究院、智譜AI、瀾舟科技、深勢科技等單位形成了算力合作,為國產(chǎn)大模型如智譜GLM-4、孟子大模型等提供了算力服務(wù)支撐,幫助訓(xùn)練進行優(yōu)化以及數(shù)據(jù)分析,為大模型團隊提升效率。
▲3月18日,在瀾舟科技大模型技術(shù)和產(chǎn)品發(fā)布會上,
北京平博pinnacle体育官网計算中心等與瀾舟科技簽約并合影。
結(jié)語 算力產(chǎn)業(yè)格局重整,以服務(wù)助跑國產(chǎn)算力
海外算力供給受限,國產(chǎn)算力迎難而上,在新技術(shù)、新政策重整算力產(chǎn)業(yè)格局的同時,行業(yè)還需要正視國內(nèi)算力利用率低的底層鴻溝。甄亞楠談道,北京超算可以將積淀十余年的運營經(jīng)驗進行輸出,幫助政府和企業(yè)建設(shè)算力中心,同時提供高質(zhì)量的運營服務(wù)解決方案,來幫助他們?nèi)ヌ嵘麄€平臺的運營效率和經(jīng)濟效益。
在人工智能加速迭代和創(chuàng)新的當下,北京超算已不僅僅是一個算力服務(wù)提供商,甄亞楠提到,北京超算密切關(guān)注芯片、軟件以及服務(wù)生態(tài)國產(chǎn)化方面的相關(guān)進展,同時以算力服務(wù)為核心讓資源利用最大化,與業(yè)界合力讓算力資源供需兩端形成一個有機整體,讓國產(chǎn)算力跟上產(chǎn)業(yè)價值共振。