精品久久天干天天天按摩,色婷婷亚洲六月婷婷中文字幕无,日韩国产成人无码AV在线,亚欧AV无码乱码在线观看性色

平博pinnacle體育官網(wǎng)-谷歌宣布開(kāi)源多模態(tài)大模型Gemma3 媲美DeepSeek

2025-04-03

  平博pinnacle體育官網(wǎng)日前,谷歌首席執(zhí)行官Sundar Pichai宣布開(kāi)源最新多模態(tài)大模型Gemma-3,主打低成本與高性能。Gemma-3提供四種不同參數(shù)規(guī)模的版本,分別為10億、40億、120億和270億參數(shù)。即便在參數(shù)量最大的270億版本中,僅需一張H100顯卡即可實(shí)現(xiàn)高效推理。相比之下,同類(lèi)模型若要達(dá)到類(lèi)似效果,至少需要提升10倍算力。因此,Gemma-3也是目前性能最強(qiáng)的小參數(shù)模型之一。

谷歌宣布開(kāi)源多模態(tài)大模型Gemma3 媲美DeepSeek

  在性能測(cè)試方面,根據(jù)LMSYS ChatbotArena的盲測(cè)數(shù)據(jù),Gemma-3的表現(xiàn)僅次于DeepSeek的R1-671B,優(yōu)于OpenAI的o3-mini和Llama3-405B等知名模型。

  在架構(gòu)設(shè)計(jì)上,Gemma-3延續(xù)了前兩代的通用解碼器Transformer架構(gòu),并進(jìn)行了多項(xiàng)創(chuàng)新和優(yōu)化。為解決長(zhǎng)上下文帶來(lái)的內(nèi)存占用問(wèn)題,Gemma-3采用了局部和全局自注意力層交錯(cuò)的架構(gòu):每5個(gè)局部層之間插入1個(gè)全局層,局部層的跨度僅為1024個(gè)token。由于只有全局層負(fù)責(zé)處理長(zhǎng)上下文,局部層僅關(guān)注1024個(gè)token的小跨度,從而有效降低了內(nèi)存占用。

谷歌宣布開(kāi)源多模態(tài)大模型Gemma3 媲美DeepSeek

谷歌宣布開(kāi)源多模態(tài)大模型Gemma3 媲美DeepSeek

  多模態(tài)能力是Gemma-3的一大技術(shù)亮點(diǎn)。該模型能夠同時(shí)處理文本和圖像,并集成了定制版的SigLIP視覺(jué)編碼器。這一編碼器基于Vision Transformer架構(gòu),通過(guò)CLIP損失的變體進(jìn)行訓(xùn)練。

  為了評(píng)估Gemma-3的性能,谷歌在MGSM、Global-MMLU-Lite、WMT24++、RULER、MRCR等多個(gè)主流平臺(tái)進(jìn)行了測(cè)試。結(jié)果顯示,Gemma-3在多模態(tài)任務(wù)中表現(xiàn)出色,例如在DocVQA、InfoVQA和TextVQA等任務(wù)中,其性能顯著優(yōu)于前代模型。在長(zhǎng)文本處理方面,270億參數(shù)版本的Gemma-3在RULER128K任務(wù)上達(dá)到了66.0%的準(zhǔn)確率。

-平博pinnacle體育官網(wǎng)

構(gòu)建云上科研工作環(huán)境

讓計(jì)算更簡(jiǎn)單,讓生活更美好

免費(fèi)試算