近期有消息顯示,理想汽車正在加緊開發下一代視覺-語言-動作(VLA)智能駕駛大模型,並計劃於今年下半年實現項目落地。
作為當前智能駕駛領域的重要競爭方向之一,VLA技術備受關注。除了理想汽車之外,包括吉利汽車和元戎啟行在內的多家企業也在積極推進相關研發工作,力爭成為行業內首個成功實現VLA落地的企業。然而,這一目標的實現麵臨諸多挑戰。除了模型開發本身需要較長時間外,現有市場上大部分芯片的性能尚無法滿足VLA運行的需求。不過,業內普遍認為,英偉達即將量產的Thor係列芯片或將有效解決這一問題。
值得注意的是,目前端到端大模型仍存在一定的局限性,例如決策過程缺乏可解釋性,以及在少數難以預測的場景中表現不佳等。相比之下,視覺語言(VLM)多模態模型在圖像識別與場景理解方麵具備更強的能力。通過引入VLM,智能駕駛係統能夠更好地應對複雜場景,從而顯著提升駕駛精度。
早在去年第二季度的財報電話會議上,理想汽車便透露已著手開展端到端VLA模型的研究。VLA的一大優勢在於能夠將端到端模型與VLM多模態模型相結合。這意味著,在新的架構中,多模態大模型將不再僅作為輔助工具,而是被深度整合為端到端智能駕駛模型的一部分,成為其核心能力之一。
本文屬於原創文章,如若轉載,請注明來源:理想汽車加速研發VLA智能駕駛大模型https://auto.zol.com.cn/958/9584921.html
標簽:
https://auto.zol.com.cn/958/9584921.htmlauto.zol.com.cntrue在線https://auto.zol.com.cn/958/9584921.htmlreport993近期有消息顯示,理想汽車正在加緊開發下一代視覺-語言-動作(VLA)智能駕駛大模型,並計劃於今年下半年實現項目落地。作為當前智能駕駛領域的重要競爭方向之一,VLA技術備受關注。除了理想汽車之外,包括吉利汽車和元戎啟行在內的多家企業也在積極推進相關研發工作,力...