英偉達(dá)于4月28日正式發(fā)布新一代多模態(tài)AI模型Nemotron 3 Nano Omni,這是該公司首次在單個(gè)模型中實(shí)現(xiàn)視覺、音頻和語言的統(tǒng)一處理。該模型能夠同時(shí)理解圖像、聲音和文本等多模態(tài)信息,使AI智能體的運(yùn)行效率相比前代提升高達(dá)9倍。Nemotron 3 Nano Omni面向邊緣計(jì)算和端側(cè)推理場(chǎng)景優(yōu)化,能夠在資源受限的設(shè)備上流暢運(yùn)行,適用于小語種翻譯、智能座艙語音交互、工業(yè)視覺檢測(cè)等多樣化應(yīng)用場(chǎng)景。從4月28日起,該模型已在Hugging Face、GitHub等多個(gè)開發(fā)者平臺(tái)上開放下載。

英偉達(dá)創(chuàng)始人兼CEO黃仁勛表示,多模態(tài)能力是AI智能體走向通用化的關(guān)鍵一步,Nemotron 3系列的發(fā)布將進(jìn)一步降低開發(fā)者構(gòu)建智能應(yīng)用的門檻。與此同時(shí),工信部近日宣布將啟動(dòng)“模數(shù)共振”行動(dòng),推動(dòng)人工智能高水平賦能新型工業(yè)化,并開展“人工智能+軟件”專項(xiàng)行動(dòng)。在政策與技術(shù)的雙重推動(dòng)下,AI大模型的產(chǎn)業(yè)應(yīng)用正加速落地。英偉達(dá)還將繼續(xù)完善其CUDA生態(tài)和推理優(yōu)化工具鏈,為開發(fā)者提供從模型訓(xùn)練到部署的全流程支持。業(yè)內(nèi)預(yù)計(jì),多模態(tài)AI將成為2026年人工智能產(chǎn)業(yè)的核心競(jìng)爭(zhēng)賽道。





























浙公網(wǎng)安備 33010502007447號(hào)