自Chat GPT火爆出圈后,“大模型”掀起了一波接一波的人工智能浪潮,吸引了眾多國家與企業(yè)的強烈關(guān)注,大家普遍認(rèn)為大模型將驅(qū)動各行各業(yè)發(fā)生顛覆性影響。在汽車行業(yè)中大模型的應(yīng)用也引發(fā)了熱烈討論,眾說紛紜。蓋斯特咨詢研究團(tuán)隊對大模型做了系統(tǒng)研究,本研報在解析大模型本質(zhì)的基礎(chǔ)上,研究其社會價值與影響,深入分析了大模型在汽車行業(yè)的應(yīng)用潛力與落地挑戰(zhàn),并為車企提供布局策略建議。
一、對大模型的本質(zhì)解析
1.大模型的概念與本質(zhì)
大模型是一種大規(guī)模預(yù)訓(xùn)練AI模型。AI模型從2000年發(fā)展至今,歷經(jīng)了機器學(xué)習(xí)、深度學(xué)習(xí)到預(yù)訓(xùn)練模型的三個發(fā)展階段。當(dāng)AI模型訓(xùn)練的數(shù)據(jù)量、算法參數(shù)量、算力三者持續(xù)提升并達(dá)到臨界量級(如圖1所示),AI模型的生產(chǎn)力由量變到質(zhì)變,展現(xiàn)出智能推理和內(nèi)容生成的能力,由此誕生了大模型。
目前大模型尚無統(tǒng)一的定義。蓋斯特給出的大模型定義是:指具備龐大參數(shù)體量(參數(shù)量高達(dá)千億甚至萬億級),經(jīng)過海量數(shù)據(jù)集的通用化訓(xùn)練,涌現(xiàn)出在多任務(wù)下自學(xué)習(xí)、自推理、自生成能力的大規(guī)模預(yù)訓(xùn)練AI模型。
圖1 AI核心要素的發(fā)展歷程
大模型與傳統(tǒng)AI模型已有了本質(zhì)的區(qū)別。傳統(tǒng)AI模型不僅需要人工訓(xùn)練AI怎樣做,還需要人對訓(xùn)練樣本進(jìn)行海量的標(biāo)注,這樣AI模型才能完成特定類型的任務(wù)。而AI大模型具有很強的自學(xué)習(xí)能力,在無規(guī)則預(yù)設(shè)前提下具有低樣本甚至零樣本的推理能力,能夠根據(jù)需求直接完成任務(wù);同時具有強泛化性,通常在無標(biāo)注情況下,大模型可以高效學(xué)習(xí)訓(xùn)練集中的通用規(guī)律和復(fù)雜特征,能夠更好應(yīng)對自然語言任務(wù);具有高通用性,通過自監(jiān)督學(xué)習(xí)和巧妙訓(xùn)練原生自然語言,從完成單任務(wù)拓展至多任務(wù)。
也就是說,與傳統(tǒng)AI模型相比,大模型具有強自學(xué)習(xí)性、強泛化性、高通用性三大核心特征,具備了智能理解、推理、生成的能力,從而推動人工智能從基于規(guī)則的“計算智能階段”加速向“認(rèn)知智能階段”發(fā)展。大模型的出現(xiàn)大幅降低了人工在任務(wù)流程中的介入需求,開始打破原有人工與AI之間的平衡,將極大地加速AI產(chǎn)業(yè)化落地進(jìn)程。
2.大模型的關(guān)鍵要素
大模型的關(guān)鍵要素包括數(shù)據(jù)、算法、算力與平臺,具體來看:
第一,數(shù)據(jù)是大模型訓(xùn)練、迭代和優(yōu)化的關(guān)鍵。數(shù)據(jù)主要來源于各類數(shù)據(jù)集、用戶數(shù)據(jù)等,其中人類自然語言信息是大模型的專屬數(shù)據(jù)特征。高質(zhì)量數(shù)據(jù)是稀缺資源,更是在大模型競爭格局中獲勝的核心要素。
第二,算法是大模型的核心技術(shù),決定大模型的能力范疇。算法包括基礎(chǔ)通用化模型算法與專業(yè)微調(diào)模型算法。目前算法掌握在大模型開發(fā)企業(yè)手中。
第三,算力是支撐大模型能力實現(xiàn)的基礎(chǔ)。大模型的龐大參數(shù)量與數(shù)據(jù)體量決定其算力需求遠(yuǎn)超一般AI模型,所以大模型需要AI芯片(如高性能GPU)、云計算、服務(wù)器等企業(yè)提供算力支撐。
第四,平臺是連接大模型和應(yīng)用端的紐帶,也成為新的關(guān)鍵要素。通過平臺可將大模型能力有效釋放于應(yīng)用端,同時借助平臺來吸納數(shù)據(jù),又能反哺大模型迭代和優(yōu)化。平臺包括服務(wù)平臺、開發(fā)平臺、應(yīng)用生態(tài)平臺和信息平臺等。
綜上所述,算力是大模型的基礎(chǔ)支撐,算法和數(shù)據(jù)共同驅(qū)動大模型持續(xù)提升,平臺的部署則是釋放大模型能力的有效途徑。
3.大模型應(yīng)用所需的能力支撐
大模型落地應(yīng)用的支撐能力主要來源于技術(shù)、資源、安全三個層面。
首先在技術(shù)層面,一是大模型的開發(fā)難度大,并非參數(shù)量大或利用海量數(shù)據(jù)訓(xùn)練的模型就是大模型,大模型的關(guān)鍵在于其能否涌現(xiàn)出強大的推理和生成能力;二是多模態(tài)處理性能要求高,隨著應(yīng)用場景越來越豐富,自然語言、語音、圖像、視頻等多類數(shù)據(jù)交織,大模型機器學(xué)習(xí)處理難度高;三是現(xiàn)有大模型輸出的內(nèi)容極度不穩(wěn)定,而且在出現(xiàn)錯誤后難以有效溯源,所以大模型在行為一致性與可解釋性均需有效提升。
其次在資源支撐層面,一是大模型對優(yōu)質(zhì)且海量的數(shù)據(jù)需求高,目前缺少供訓(xùn)練的中文共性基礎(chǔ)庫,同時各行業(yè)內(nèi)均存在數(shù)據(jù)壁壘,導(dǎo)致數(shù)據(jù)獲取難度大;二是算力和內(nèi)存需求大,以GPT聊天機器人模型為例,僅其訓(xùn)練的算力門檻便需一萬張高性能GPU芯片,成本約10億元,同時至少需350GB內(nèi)存來訓(xùn)練1750億參數(shù);三是大模型對電力等能源消耗極大,且成本高。例如,GPT訓(xùn)練的年綜合電力成本高達(dá)數(shù)十億元人民幣。
最后在安全治理層面,當(dāng)前社會對于大模型落地應(yīng)用的主要擔(dān)憂在數(shù)據(jù)安全、AI治理與監(jiān)管效果方面。如果大模型的生成式內(nèi)容能力被濫用,很可能違反社會價值觀,甚至突破法律底線。同時大模型對社會就業(yè)、產(chǎn)業(yè)發(fā)展、道德倫理的沖擊也會引發(fā)一系列的問題。
由此可見,大模型發(fā)展面臨的是全方位、多維度的問題,所以需要從技術(shù)支撐、基礎(chǔ)設(shè)施、社會治理制度等多方面不斷完善,來共同推動大模型的落地應(yīng)用。
4.大模型的演進(jìn)階段
大模型的發(fā)展路線可分為工程化、通用化、行業(yè)化和生態(tài)化四個演進(jìn)階段,具體如圖2所示。當(dāng)前大模型發(fā)展正從通用化向行業(yè)化階段轉(zhuǎn)變,即通用基礎(chǔ)大模型成熟期向垂直應(yīng)用領(lǐng)域大模型成熟期的發(fā)展進(jìn)程中。這個階段需要打通大模型功能與用戶連接之間的橋梁,以契合行業(yè)的特點。合理有效地發(fā)揮大模型的能力是目前面臨的關(guān)鍵問題。
當(dāng)前通用大模型領(lǐng)域呈現(xiàn)出百花齊放、激烈競爭的場面。蓋斯特咨詢判斷,將來僅有少數(shù)寡頭企業(yè)可完全跑通大模型的演進(jìn)路徑。隨著大模型行業(yè)競爭從比參數(shù)過渡到比落地應(yīng)用,將出現(xiàn)越來越多的垂直領(lǐng)域大模型。這類行業(yè)大模型擅長特定的專業(yè)領(lǐng)域及核心的交互場景。相對來說,輕量化的行業(yè)模型及場景模型得益于更聚焦的數(shù)據(jù)訓(xùn)練與更少的參數(shù)設(shè)置,不僅降低部署成本,同時用戶對此的感知程度也將日益加深,因此垂直應(yīng)用領(lǐng)域大模型將迎來蓬勃發(fā)展時期。未來隨著大模型產(chǎn)業(yè)主體更加豐富、各模塊專業(yè)性提升、產(chǎn)業(yè)鏈完善、應(yīng)用生態(tài)繁榮,大模型產(chǎn)業(yè)日趨完善的生態(tài)格局將有效賦能其實現(xiàn)更大的產(chǎn)業(yè)價值。
圖2 大模型演進(jìn)趨勢
二、大模型的社會價值與應(yīng)用潛力
1.大模型的社會價值
大模型的出現(xiàn)意味著人工只需指導(dǎo)AI,甚至用AI控制AI來完成任務(wù),極大降低了人在人工智能任務(wù)中的參與程度需求,大模型將革命性地解放生產(chǎn)力;進(jìn)而大模型將變革生產(chǎn)關(guān)系,引發(fā)社會全方位的資源調(diào)整,甚至資源再分配。因此大模型將驅(qū)動各行業(yè)發(fā)生顛覆性變革,并將變革社會方式。
具體而言,大模型將從開發(fā)生產(chǎn)、產(chǎn)品服務(wù)、企業(yè)經(jīng)營、人才需求等方面驅(qū)動各行業(yè)變革。
第一,突破開發(fā)生產(chǎn)效率。大模型自身高效的數(shù)據(jù)處理、軟件開發(fā)、數(shù)據(jù)化自動化標(biāo)注等能力可以解放低效生產(chǎn)力,提升開發(fā)生產(chǎn)的自動化程度,降低勞動力成本,實現(xiàn)大幅度的降本增效;
第二,創(chuàng)新產(chǎn)品服務(wù)形態(tài)。大模型強大的算法優(yōu)化、數(shù)據(jù)挖掘、多模交互、內(nèi)容生成、用戶情感識別等特點,可實現(xiàn)創(chuàng)意激發(fā)與體驗優(yōu)化,同時讓人機交互更加智能;
第三,優(yōu)化企業(yè)經(jīng)營決策。大模型可提供數(shù)據(jù)分析、智能制造、智能銷售與服務(wù)、成本與決策優(yōu)化等服務(wù),助力企業(yè)做出全面、精準(zhǔn)、靈活的判斷,使決策更科學(xué)、服務(wù)更精準(zhǔn);
第四,引發(fā)社會人才需求變化。大模型顯著降低對低效、低創(chuàng)造性人才的需求,對創(chuàng)造性的高價值人才需求將顯著增加,未來可靈活運用AI技能的人才將具備明顯優(yōu)勢。
未來如何利用大模型有效賦能,形成更低成本及更高效率的開發(fā)生產(chǎn)模式、更智能更友好的產(chǎn)品形態(tài)、更高價值的用戶體驗,將成為產(chǎn)業(yè)智能化發(fā)展中的重要課題。
2.大模型產(chǎn)業(yè)應(yīng)用的范式
大模型產(chǎn)業(yè)應(yīng)用是以“通用預(yù)訓(xùn)練+專業(yè)精調(diào)”的組合模式。如圖3所示,首先通用基礎(chǔ)大模型對海量的多模態(tài)知識開展預(yù)訓(xùn)練,然后針對行業(yè)及業(yè)務(wù)場景進(jìn)行適配化精調(diào)開發(fā),形成垂直類場景模型,提供原子化服務(wù)。而平臺作為大模型能力與產(chǎn)品應(yīng)用之間的連接和溝通工具,將場景模型層的原子能力與上層應(yīng)用打通,為用戶輸出大模型服務(wù)。以Chat GPT為例,大語言模型作為基礎(chǔ)支撐,通過對自然語言的預(yù)訓(xùn)練,結(jié)合人類對話場景進(jìn)行微調(diào),實現(xiàn)對話問答的原子能力,再通過服務(wù)平臺接口將對話功能引入到網(wǎng)頁、APP、汽車座艙等應(yīng)用中,供用戶使用。
圖3 大模型產(chǎn)業(yè)應(yīng)用范式
在此應(yīng)用范式下,新的軟件應(yīng)用不再需要從最底層開始重復(fù)開發(fā),而是基于已有的基礎(chǔ)模型與場景模型便可實現(xiàn)高效的應(yīng)用開發(fā)。因此大模型將重構(gòu)各行業(yè)的軟件體系,不僅有效降低AI模型及軟件應(yīng)用的開發(fā)門檻,提高軟件開發(fā)和硬件優(yōu)化的效率,還將重塑企業(yè)經(jīng)營管理模式,并拓展豐富其產(chǎn)業(yè)應(yīng)用邊界與賦能形態(tài)。蓋斯特咨詢認(rèn)為,未來各行業(yè)的所有軟件都可以用大模型重寫一遍,實現(xiàn)軟件價值效率的革命性提升,賦能各行業(yè)發(fā)展。
3.大模型在不同行業(yè)的應(yīng)用前景預(yù)測
對于具體行業(yè)而言,其聯(lián)網(wǎng)程度、數(shù)字化基礎(chǔ)、行業(yè)內(nèi)容特點等決定大模型的應(yīng)用前景與價值。蓋斯特咨詢按照“影響程度”與“滲透速度”兩個維度,將大模型變革行業(yè)的前景分為四類(詳見圖4):
一是突破顛覆型:大模型可滲透到行業(yè)核心內(nèi)容,能夠快速創(chuàng)造價值的行業(yè),典型代表有互聯(lián)網(wǎng)、游戲、電商等行業(yè);二是快速影響型:該類行業(yè)數(shù)字化范圍較大,但AI滲透行業(yè)核心內(nèi)容的邏輯較難,例如汽車、營銷、通信行業(yè);三是潛在發(fā)展型:該類行業(yè)數(shù)字化程度極低,大模型滲透速度慢、影響弱,例如農(nóng)業(yè)、建筑、政務(wù)等;四是緩慢賦能型:行業(yè)本身數(shù)字化程度低,人工智能的潛在價值兌現(xiàn)較慢,例如教育、藝術(shù)業(yè)等。
圖4 大模型對各行業(yè)變革前景分析(注:圓圈大小代表潛在價值大?。?/span>
結(jié)合各行業(yè)的特點,目前大模型的典型應(yīng)用案例已有不少。例如,最為廣泛的自然語言(NLP)大模型已被用于服務(wù)業(yè)中的智能客服、互聯(lián)網(wǎng)的搜索推薦、影視業(yè)的實時字幕、教育業(yè)的語義理解等;計算機視覺(CV)大模型可用于游戲的三維建模、制造業(yè)的智能監(jiān)控、工業(yè)中的輔助質(zhì)檢、醫(yī)療中的輔助診斷等;跨模態(tài)大模型可支撐多類型生成式人工智能(AIGC)應(yīng)用,如汽車中的智能交互、營銷圖文物料、服務(wù)業(yè)中的內(nèi)容生產(chǎn)等;決策類大模型分析、判斷與優(yōu)化能力將用于汽車自動駕駛、金融投資研判、智能交通規(guī)劃、節(jié)能模型等。
三、大模型在汽車行業(yè)應(yīng)用前景分析
1.大模型在汽車行業(yè)應(yīng)用潛力
當(dāng)前汽車行業(yè)已進(jìn)入數(shù)字化與智能化發(fā)展階段,AI軟件逐漸成為新汽車時代的重要支撐技術(shù)。汽車產(chǎn)業(yè)具有主體多、涉及領(lǐng)域多、流程復(fù)雜的特點,正是大模型當(dāng)前及未來應(yīng)用的重要領(lǐng)域之一。
對于大模型在汽車行業(yè)的應(yīng)用場景和應(yīng)用價值,我們可從“用戶感知程度”和“AI軟件影響潛力”兩個維度來判斷分析。如圖5所示,應(yīng)用場景可分為產(chǎn)品與技術(shù)、用戶服務(wù)運營、企業(yè)經(jīng)營管理三大方面的6個細(xì)分領(lǐng)域。其中,產(chǎn)品及技術(shù)方面包括智能化體驗、技術(shù)研發(fā)創(chuàng)新、產(chǎn)品設(shè)計,大模型的應(yīng)用價值將率先體現(xiàn)在智能化產(chǎn)品提升與技術(shù)研發(fā)創(chuàng)新上,這是行業(yè)當(dāng)前重點關(guān)注領(lǐng)域;服務(wù)運營是用戶感知程度較強的領(lǐng)域,其中營銷、售后、城市出行等場景均可利用大模型進(jìn)行賦能;在企業(yè)經(jīng)營管理方面,大模型在生產(chǎn)制造智能化、企業(yè)數(shù)字化流程變革及組織形態(tài)創(chuàng)新等發(fā)揮作用,通過彌合數(shù)據(jù)流斷點、提升自動化程度、優(yōu)化組織機制等實現(xiàn)企業(yè)經(jīng)營的降本增效。
圖5 大模型在不同汽車領(lǐng)域的應(yīng)用場景分析
由上可知,大模型可賦能汽車行業(yè)多個領(lǐng)域,其能力不僅契合汽車各關(guān)鍵領(lǐng)域的發(fā)展需求,還可助力解決當(dāng)前面臨的諸多問題,具有強大的應(yīng)用潛力。如果汽車企業(yè)有效利用了大模型賦能自身各個環(huán)節(jié),以突破創(chuàng)新和提質(zhì)增效,將在市場競爭中對其他同類企業(yè)形成降維打擊之勢。
2.大模型在汽車領(lǐng)域應(yīng)用的挑戰(zhàn)
盡管大模型在汽車行業(yè)應(yīng)用的潛力巨大,但是由于汽車產(chǎn)業(yè)非常復(fù)雜,同樣面臨著巨大的挑戰(zhàn)。一方面汽車行業(yè)的復(fù)雜性放大了大模型自有的發(fā)展難題,另一方面汽車行業(yè)的獨特性又給大模型帶來了新的應(yīng)用挑戰(zhàn)。
具體來看,大模型在汽車領(lǐng)域應(yīng)用的挑戰(zhàn)主要集中模型算法、數(shù)據(jù)及算力支撐三大方面,如圖6所示。
圖6 大模型在汽車行業(yè)應(yīng)用的主要挑戰(zhàn)領(lǐng)域
第一,在算法層面,由于汽車場景多且復(fù)雜,包括靜態(tài)和動態(tài)、用戶和機器、車內(nèi)和車外、圖片和視頻等等,眾多類型的海量數(shù)據(jù)交織,顯然僅靠單一模態(tài)模型處理無法完成,因此對大模型同時處理不同模態(tài)數(shù)據(jù)的算法能力提出挑戰(zhàn);同時汽車關(guān)乎人類生命安全,車規(guī)級安全性要求大模型的算法必須具有高度的可靠性和一致性,另外還需具備可解釋性。而現(xiàn)有大模型生成的內(nèi)容極度不穩(wěn)定,若出現(xiàn)錯誤又難以有效溯源,無法滿足車輛需求。蓋斯特咨詢認(rèn)為,相比于通用基礎(chǔ)大模型而言,汽車AI模型開發(fā)應(yīng)聚焦在細(xì)分用車場景和數(shù)據(jù)輕量化,打造更符合汽車場景的的汽車AI中模型或小模型,或許能夠有效地應(yīng)對上述問題。
第二,在數(shù)據(jù)層面,面臨著數(shù)據(jù)來源少、質(zhì)量差和數(shù)據(jù)安全等問題。首先汽車行業(yè)缺少大體量、高質(zhì)量的數(shù)據(jù),一方面不同企業(yè)的數(shù)據(jù)具有天然隔閡,另一方面沒有統(tǒng)一的標(biāo)準(zhǔn),數(shù)據(jù)難以流通和使用,因此需要構(gòu)建汽車行業(yè)專屬的數(shù)據(jù)開放平臺,促進(jìn)數(shù)據(jù)的流通和共享;其次,單一模態(tài)數(shù)據(jù)已經(jīng)不能滿足多模算法的訓(xùn)練需求,未來需要海量的多類型數(shù)據(jù);最后,數(shù)據(jù)安全更是汽車行業(yè)需要關(guān)注的重要問題。傳感器數(shù)據(jù)、地圖等信息涉及國家機密,國家對其管控嚴(yán)格;用戶數(shù)據(jù)涉及隱私安全,此類數(shù)據(jù)確權(quán)、開放共享的合法性存在爭議,國家及行業(yè)需要進(jìn)一步明確AI監(jiān)管與治理規(guī)范。
第三,在算力層面,前文談到了大模型自身對算力、能源、成本等需求巨大,高端大算力GPU和電力將成為限制大模型發(fā)展的核心因素。若大模型應(yīng)用到汽車上又有了新的挑戰(zhàn)。例如,GPT僅推理就需近3萬個GPU支持,日耗電量達(dá)50萬度。目前車端系統(tǒng)級芯片最高能提供2000 TOPS的算力,與大模型所需的萬級TOPS的算力需求相差甚遠(yuǎn),另外車端的電池也難以支撐大模型的運行能耗,因此大模型的算力應(yīng)更多地部署到云端和邊緣端,即讓云端和邊緣端承擔(dān)大規(guī)模計算任務(wù),同時芯片架構(gòu)開發(fā)需考慮與大模型算法適配,以提升算力利用率。另外,車云信息傳輸需求必須是極低時延(車端是10毫秒級),所以網(wǎng)絡(luò)通訊能力也需要進(jìn)一步提升。
由上可見,汽車行業(yè)應(yīng)用大模型所面臨的問題是全方位、多維度的,需要跨主體、跨專業(yè)、跨領(lǐng)域的分工合作,以推動其持續(xù)應(yīng)用與發(fā)展。需要注意的是,大模型在汽車行業(yè)有無應(yīng)用潛力,與能否取得商業(yè)成功是兩回事。目前國內(nèi)發(fā)布大模型的數(shù)量早已破百,其背后是大量資源的消耗,但是商業(yè)價值回報尚未真正體現(xiàn)出來。汽車企業(yè)也在積極參與大模型的發(fā)展。蓋斯特認(rèn)為,如果車企一味地“卷”底層基礎(chǔ)模型則會造成巨大的資源浪費。企業(yè)只有以需求為驅(qū)動,打造適合汽車不同領(lǐng)域的垂類大模型,并利用大模型促進(jìn)汽車產(chǎn)品及服務(wù)一體化發(fā)展才是長遠(yuǎn)之計。
3.大模型在汽車應(yīng)用階段劃分
蓋斯特咨詢預(yù)測,大模型在汽車行業(yè)的應(yīng)用將呈現(xiàn)出循序漸進(jìn)的節(jié)奏,前期快速上車、積累場景與數(shù)據(jù),之后隨著技術(shù)持續(xù)演進(jìn),中后期將不斷拓展應(yīng)用范圍,并放大大模型的價值。
如圖7所示,根據(jù)大模型賦能汽車各應(yīng)用場景的滲透時間與應(yīng)用難度,可將大模型應(yīng)用劃分為三個階段:
第一階段產(chǎn)品體驗賦能,大模型在智能化產(chǎn)品應(yīng)用上快速落地,提升汽車產(chǎn)品的用戶體驗;第二階段企業(yè)降本增效,隨著核心技術(shù)積累,大模型賦能企業(yè)經(jīng)營全方面降本增效;第三階段社會效益創(chuàng)造,由于突破了技術(shù)迭代與應(yīng)用落地的瓶頸,大模型覆蓋汽車行業(yè)的深度與廣度顯著提升,進(jìn)而推動社會移動出行的發(fā)展。
圖7 大模型在汽車行業(yè)應(yīng)用的不同階段
四、大模型在汽車行業(yè)的典型應(yīng)用場景
對于汽車產(chǎn)品、技術(shù)和服務(wù)中的難點問題,應(yīng)用大模型或可得到突破性解決方案。例如,當(dāng)前汽車智能化產(chǎn)品體驗面臨兩個突出問題,一是自動駕駛的長尾問題,二是座艙交互系統(tǒng)智能化的程度低。對于前者,大模型賦能核心在自動駕駛算法上;對于后者,大模型可以為用戶提供主動式、個性化的交互。下面詳細(xì)分析大模型的四個典型應(yīng)用場景以及其帶來的影響。
1.大模型徹底改變智能駕駛方案的底層邏輯
大模型智能駕駛方案在本質(zhì)上是把傳統(tǒng)的自動駕駛算法變?yōu)椤皥鼍?車輛控制”全流程的端到端模型,真正實現(xiàn)感知規(guī)劃一體化,可以說是徹底改變以往智能駕駛方案的底層邏輯。
傳統(tǒng)智能駕駛方案采取預(yù)設(shè)規(guī)則的模塊化方案,即感知-決策-規(guī)劃的流水線流程,眾多子模塊對應(yīng)單獨的任務(wù)和功能,基于預(yù)設(shè)規(guī)則的算法進(jìn)行判斷,即使部分模塊引入神經(jīng)網(wǎng)絡(luò),仍存在多個編解碼、輸入輸出環(huán)節(jié)。該方案模型冗余,各模塊均需專門訓(xùn)練、優(yōu)化和迭代,且模塊間環(huán)節(jié)繁瑣。同時對攝像頭、雷達(dá)、高精地圖等傳感信號需求高,而且主要針對感知模塊的圖片信息進(jìn)行訓(xùn)練。所以在性能方面存在信息損失和級聯(lián)誤差,同時難以有效處理長尾場景問題。但是這種方案可解釋強,便于問題回溯,也易于調(diào)試。
圖8 智能駕駛方案邏輯對比
相比之下,基于大模型算法架構(gòu)的端到端方案,即感知-決策-規(guī)劃一體化模型,更接近人的駕駛思維,由感知信息直接生成控制信號。也就是說,傳感器采集到的信息直接輸入神經(jīng)網(wǎng)絡(luò)算法中,經(jīng)過處理后直接輸出命令。這種模型聚焦,研發(fā)針對單個大參數(shù)量模型進(jìn)行整體訓(xùn)練,雖然訓(xùn)練要求高,但功能聚焦。另外對傳感信號需求較低,可降低硬件成本,支持以視覺感知為主,需要對含有駕駛行為的視頻信息進(jìn)行訓(xùn)練。
從性能上,大模型方案可大大降低級聯(lián)誤差,提升系統(tǒng)性能的上限。同時由于大模型強大的泛化能力,端到端方案可提高罕見場景下感知決策的準(zhǔn)確率,有效解決長尾問題。但是這一方案的可解釋性差,由于是黑盒模式,當(dāng)出現(xiàn)錯誤時難以溯源。
當(dāng)前已有多家整車企業(yè)基于大模型架構(gòu)推出城市NOA(城市導(dǎo)航輔助駕駛)解決方案,例如特斯拉、小鵬、理想汽車等。今后隨著大模型算法及應(yīng)用場景的持續(xù)迭代,將有效促進(jìn)高階自動駕駛方案的實現(xiàn)。
2.大模型顛覆了以往的人機交互架構(gòu)
大模型憑借強大的通用預(yù)訓(xùn)練能力,為人機交互帶來更加智能、更加靈活的架構(gòu)方案。如圖9所示,傳統(tǒng)的汽車座艙人機交互架構(gòu)是基于人為預(yù)設(shè)流程進(jìn)行,不論是AI嵌入模式還是AI助理模式,其輸入和輸出均須遵循預(yù)設(shè)的規(guī)則,例如早期的智能語音助手只能識別固定的語句。以前AI算法經(jīng)常被用于某個或多個環(huán)節(jié)以提升效果和效率,例如用深度學(xué)習(xí)提高模糊語音識別的準(zhǔn)確率,但在本質(zhì)上還是人告訴AI“怎么做”。
圖9 人機交互不同模式對比
而以大模型實現(xiàn)端到端全流程的交互決策架構(gòu),人只告訴AI我們所需的結(jié)果即可,機器在大模型強大推理與生成能力下可直接自主完成全流程任務(wù)。例如面對單模態(tài)的指令——“路上怎樣充電最方便”,或者多模態(tài)需求——“營造一個安靜的午休環(huán)境”等,大模型可充分理解和判斷用戶的需求,并做出決策和反饋。大模型應(yīng)用在人機交互中,徹底改變了人類與計算機之間的交流方式,也改變了開發(fā)范式,將推動人機交互應(yīng)用從指令式智能向交互式智能發(fā)展。
3.大模型驅(qū)動生成式技術(shù)研發(fā)模式誕生
大模型在技術(shù)研發(fā)方面的應(yīng)用主要在智能化模式變革上。我們以電池材料開發(fā)智能化為例具體說明。
電池開發(fā)涉及材料研發(fā)、電池設(shè)計、系統(tǒng)組裝、測試驗證等內(nèi)容,復(fù)雜且要求高,傳統(tǒng)方法存在周期長、成本高、人力投入大等問題。不同類型的大模型可根據(jù)電池研發(fā)流程特征,實現(xiàn)有針對性的賦能。
圖10 大模型在電池開發(fā)流程中的應(yīng)用
在電池材料研發(fā)階段,通常需要通過大量的實驗試錯,成本投入大且效率低下,而化學(xué)材料模型庫可對海量材料數(shù)據(jù)進(jìn)行高效地挖掘和分析,篩選出新材料、模擬不同組合,大幅提升材料創(chuàng)新的效率。
在電池設(shè)計階段涉及參數(shù)多,結(jié)構(gòu)復(fù)雜,難度較大;同時,系統(tǒng)組裝階段的影響因素多,對最終工藝質(zhì)量及效率要求高。因此可以借助仿真大模型和模擬分析大模型,模擬電池內(nèi)部的物理化學(xué)過程,預(yù)測電池性能結(jié)果。另外,還可高效篩選和優(yōu)化工藝參數(shù),并進(jìn)行模擬評估,來優(yōu)化電池設(shè)計,提升系統(tǒng)的整體性能。
在測試驗證階段,對數(shù)據(jù)分析、BMS軟件系統(tǒng)開發(fā)要求高,而數(shù)據(jù)大模型可對電池工作狀態(tài)、壽命等進(jìn)行分析預(yù)測;編程大模型可自動生成軟件代碼,有效提高測試效率。
可以看出,大模型應(yīng)用在電池開發(fā)流程中的核心目的是提質(zhì)、增效和降本,大模型將推動電池智能開發(fā)加速落地。
4.大模型助力用戶運營服務(wù)生態(tài)創(chuàng)新
與傳統(tǒng)汽車相比,智能汽車在用戶服務(wù)上有著很大程度的拓展和升級,現(xiàn)在導(dǎo)入大模型可助力突破數(shù)據(jù)壁壘,為服務(wù)產(chǎn)業(yè)鏈賦能,帶動用車服務(wù)生態(tài)整體創(chuàng)新增長。
在服務(wù)資源生態(tài)方面,大模型是滿足用戶用車體驗的充分支撐:一是基于大模型開發(fā)的智能售后助手是故障預(yù)測、維修知識專家,可隨時提醒維修商和用戶注意車輛狀況;二是基于AI語音助手的智能客服,可與用戶全天候互動,打造高質(zhì)量服務(wù)體驗;三是大模型助力智慧出行服務(wù)生態(tài)打造,包括智能充/換電補能、汽車共享、路線選擇、一體化出行服務(wù)平臺等。
在應(yīng)用開發(fā)生態(tài)方面,即在開發(fā)者生態(tài)中,大模型是面向用車場景、實現(xiàn)多樣性和開放性的重要支撐。一是,大模型降低了軟件開發(fā)門檻,為開發(fā)者提供豐富、低編程能力要求的開發(fā)選擇,甚至根據(jù)需求自動生成可用的代碼,從而加速開發(fā)者生態(tài)發(fā)展;二是,大模型基于用戶數(shù)據(jù)驅(qū)動的OTA升級決策,可高效分析用戶在應(yīng)用端的使用數(shù)據(jù),判斷各項功能的優(yōu)劣勢,從而實現(xiàn)數(shù)據(jù)驅(qū)動的OTA精準(zhǔn)升級;三是大模型憑借其強大的數(shù)據(jù)標(biāo)注和處理能力,能夠更好地分析用戶偏好,為用戶提供符合其使用習(xí)慣或興趣愛好的個性化、差異化服務(wù)。
五、對車企布局大模型應(yīng)用落地的策略建議
1.車企布局大模型技術(shù)應(yīng)用的總體原則
蓋斯特咨詢認(rèn)為,基礎(chǔ)通用大模型的開發(fā)難度高、投入巨大,車企在這方面沒有足夠的基礎(chǔ),投入產(chǎn)出性價比低。所以車企布局大模型的總體原則是:將大模型與自身業(yè)務(wù)場景、數(shù)據(jù)有效融合,充分發(fā)揮出大模型的價值。
具體來說,車企應(yīng)具備大模型的思維理念,通過合作有效引入外部通用大模型能力,同時逐步培育自身的AI核心能力與基礎(chǔ)能力支撐,建立自身業(yè)務(wù)數(shù)據(jù)庫,不斷訓(xùn)練、迭代專屬的業(yè)務(wù)模型,探索生成式研發(fā)創(chuàng)新模式(詳見圖11)。即車企通過產(chǎn)業(yè)分工協(xié)作,將大模型的能力不斷深入在自身業(yè)務(wù)的應(yīng)用場景,最終構(gòu)建企業(yè)生成式研發(fā)模式,賦能產(chǎn)品顛覆性創(chuàng)新。
圖11 企業(yè)大模型應(yīng)用及創(chuàng)新體系
2.車企在大模型技術(shù)生態(tài)中的角色定位
在汽車行業(yè)大模型生態(tài)中,面對眾多的發(fā)展挑戰(zhàn),各方須以長遠(yuǎn)視角、用專業(yè)化分工模式推動大模型價值實現(xiàn)。其中,大模型開發(fā)企業(yè)應(yīng)重點開發(fā)汽車垂類場景模型,并與平臺開發(fā)方深度合作,基于模型原子能力開發(fā)服務(wù)應(yīng)用;芯片企業(yè)提供大算力SoC芯片,云服務(wù)商則提供云端算力資源。隨著汽車行業(yè)大模型生態(tài)的日趨成熟,將構(gòu)建出行業(yè)大模型平臺,支撐各類資源設(shè)施的共享。
圖12 汽車行業(yè)大模型產(chǎn)業(yè)生態(tài)圖
車企作為數(shù)據(jù)提供者,直接面向用戶,擁有場景數(shù)據(jù),至少應(yīng)掌握需求定義與功能應(yīng)用的能力。未來有實力的車企可參與不同細(xì)分領(lǐng)域大模型的聯(lián)合定義與開發(fā),與大模型開發(fā)企業(yè)形成伴生式合作關(guān)系,通過不斷積累的數(shù)據(jù)反哺場景模型迭代升級,共同打造更符合用戶與產(chǎn)品差異化定位的垂類場景模型。
3.車企布局大模型應(yīng)用的分階段策略
車企布局大模型的目的并非自研大模型的開發(fā)能力,而是如何通過自身能力積累,與內(nèi)外部資源合作,最終將大模型的潛力與新汽車發(fā)展充分融合。因此,車企必須瞄準(zhǔn)不同時期的落地目標(biāo),制定分階段的大模型布局規(guī)劃:
首先,近期策略是“能用起來”:車企應(yīng)以智能化產(chǎn)品為切入點,實現(xiàn)大模型功能的快速上車應(yīng)用,通過快速提升產(chǎn)品體驗,加深用戶感知度。
其次,中期策略是“用得更好”:車企不斷儲備積累相關(guān)軟件算法能力,在研發(fā)、營銷、售后、管理等環(huán)節(jié)引入大模型應(yīng)用,將大模型的能力由前臺不斷向中臺、后臺逐漸滲透,提升大模型應(yīng)用的廣度和深度。
最后,遠(yuǎn)期策略是“共同發(fā)展”:車企深度參與生態(tài)建設(shè),與各方充分協(xié)作,推動汽車行業(yè)大模型的整體發(fā)展。隨著技術(shù)應(yīng)用持續(xù)豐富,商業(yè)價值逐漸顯現(xiàn),大模型也將成為推動車企長期持續(xù)發(fā)展的重要手段。
4.當(dāng)前車企布局大模型的具體舉措
現(xiàn)在正處于大模型滲透入汽車行業(yè)的初期階段,車企應(yīng)通過與生態(tài)中其他主體的合作,快速打通智能化產(chǎn)品與大模型能力之間的連接通道,為大模型上車進(jìn)行能力布局。
第一,在軟件應(yīng)用層上,當(dāng)前車企對于模型及平臺至少掌握定義能力、選型能力,能夠根據(jù)自身功能需求與資源支撐,從大模型開發(fā)企業(yè)選擇合適的場景模型。同時在車端軟件應(yīng)用設(shè)置相應(yīng)的接口,與開發(fā)方提供的大模型服務(wù)接口對接。例如根據(jù)電子電氣架構(gòu)和智駕能力需求選擇合適的感知、決策或端到端算法方案,并在自身智駕系統(tǒng)中設(shè)置合適的接口來引入大模型能力。
未來隨著車企自身能力的積累,車企盡量掌握針對大模型的軟件適配性開發(fā)能力,包括車載OS、應(yīng)用軟件等,以最大化發(fā)揮大模型的賦能價值。例如根據(jù)大模型算法對OS中間件進(jìn)行有效調(diào)整,提升資源調(diào)配管理效率。
第二,高需求算力作為大模型落地的關(guān)鍵支撐,車企需要在云端和車端進(jìn)行合理的部署規(guī)劃。如前所述,智能汽車的算力部署原則為云端大算力+車端小算力的組合模式,因此當(dāng)前車企在云端算力部署可選擇互聯(lián)網(wǎng)科技企業(yè)的“公有云+私有云”服務(wù)方案,或建立專屬的超算中心,實現(xiàn)大規(guī)模的數(shù)據(jù)處理;車端則以現(xiàn)有大算力芯片和計算平臺為主。
未來以云端為主要算力部署的趨勢不會變,隨著模型迭代與數(shù)據(jù)量的增加,各端算力要求將逐漸增加,尤其是GPU(圖形處理器)及異構(gòu)計算能力,而針對大模型算法進(jìn)行開發(fā)的芯片方案將成車企的重要選擇。同時,對車云一體架構(gòu)的協(xié)同效率需求將提升,實時通訊能力也需要提高。另外車端數(shù)據(jù)訓(xùn)練和處理的標(biāo)準(zhǔn)需進(jìn)一步貼合云端。
由此可見,大模型應(yīng)用于汽車將進(jìn)一步放大企業(yè)對算力基礎(chǔ)設(shè)施的需求,車企在關(guān)注AI硬件資源的同時,需要提升配套軟件及整體架構(gòu)的能力支撐。
六、總結(jié)
綜上所述,大模型的本質(zhì)上是AI能力的躍遷,其將驅(qū)動社會各行業(yè)發(fā)生顛覆性變革。但是大模型在不同行業(yè)的應(yīng)用價值有所區(qū)別,汽車行業(yè)正是當(dāng)前及未來大模型應(yīng)用的重要載體。大模型將推動汽車多領(lǐng)域變革,擁有巨大的應(yīng)用價值與潛力,大模型將成為引領(lǐng)新汽車時代發(fā)展的重要驅(qū)動力之一。同時大模型在汽車行業(yè)應(yīng)用也面臨全方位、多維度的挑戰(zhàn),其中既有大模型自身的局限,也有汽車行業(yè)賦予其的獨特挑戰(zhàn)。但是大模型滲透入汽車行業(yè)勢不可當(dāng)。蓋斯特咨詢預(yù)測,汽車行業(yè)大模型應(yīng)用將經(jīng)歷三個發(fā)展階段:產(chǎn)品體驗賦能、企業(yè)降本增效和社會效益創(chuàng)造。
當(dāng)前眾多企業(yè)紛紛布局大模型,均希望利用大模型賦能自身業(yè)務(wù),由此引發(fā)了新一輪的市場競爭浪潮。蓋斯特咨詢認(rèn)為,車企應(yīng)主動地、盡早地尋求改變,抓準(zhǔn)自身立足點,通過能力儲備與生態(tài)合作,充分發(fā)揮大模型的賦能價值。
重點建議總結(jié)有三點:一是,車企必須充分認(rèn)識到大模型上車應(yīng)用的價值,從產(chǎn)品體驗、技術(shù)研發(fā)創(chuàng)新、經(jīng)營管理等多維度進(jìn)行賦能,對其他企業(yè)形成綜合競爭力的優(yōu)勢;二是,車企的目標(biāo)不應(yīng)是自主開發(fā)大模型,而是大模型賦能價值的最大化。因此車企布局大模型策略要以產(chǎn)品體驗和用戶感知提升為龍頭或牽引力、以數(shù)據(jù)為驅(qū)動,通過大模型提升軟硬件的綜合能力,更好滿足新汽車時代下的用戶需求;三是,車企需要積極參與大模型生態(tài)建設(shè),與其他主體充分協(xié)同共創(chuàng),在合作中不斷積累和儲備軟件算法核心能力,持續(xù)提升大模型應(yīng)用廣度與深度。