3月10日消息,據(jù)媒體報道,理想汽車正在研發(fā)下一代VLA(視覺-語言-動作)智駕大模型,目標(biāo)是于今年下半年實現(xiàn)項目落地。
理想汽車在去年二季度財報電話會議上表示已啟動端到端VLA模型的研究,將兩個模型合二為一,使多模態(tài)大模型內(nèi)化為端到端智駕大模型的一種能力。
那么,VLA智駕大模型與此前的智駕系統(tǒng)有何區(qū)別呢?
VLA智駕大模型結(jié)合了端到端和VLM(視覺語言)多模態(tài)模型的優(yōu)勢,能夠提升智駕系統(tǒng)對復(fù)雜場景的理解能力,從而提高智能駕駛的精準(zhǔn)度。
與端到端大模型相比,VLM對圖像和場景的理解能力更強,但端到端大模型存在決策不可解釋以及難以處理部分場景的缺陷。
當(dāng)前,VLA是智能駕駛領(lǐng)域的核心競賽之一,理想汽車、吉利汽車和元戎啟行都在積極推動其落地。
然而,VLA的落地面臨較大挑戰(zhàn),除了模型研發(fā)需要時間外,目前市面上的芯片性能大多無法支持其運行。
不過,英偉達(dá)即將量產(chǎn)的Thor系列芯片有望解決這一問題。
本文鏈接:http://www.zh1234.com/news33441.html不止卷硬件!理想新一代VLA智駕大模型有望下半年落地