【核心觀點】
智能副駕:以前開發(fā)智能座艙時,各種人機交互模式都是相互割裂的,相當(dāng)于有眼睛,有耳朵,卻沒有一個統(tǒng)一的大腦?,F(xiàn)在技術(shù)進步了,可以把這些功能全部放到大模型中訓(xùn)練,機器的識別水平能夠做到非常接近于人,真的可以稱之為智能副駕。
車端算力:對于手機產(chǎn)業(yè)來說,把算力放在云端無疑是比較好的選擇;但是對于汽車產(chǎn)業(yè)來說,車端必須要有一定的算力,因為汽車是移動的,而網(wǎng)絡(luò)信號不可能真正實現(xiàn)全方位、無死角的覆蓋。
高階自動駕駛:實現(xiàn)高階自動駕駛有兩條路線:一是直接奔向L4,即Robotaxi路線;二是循序漸進、逐步優(yōu)化。后者可能更容易實現(xiàn),我們還是要經(jīng)歷從輔助駕駛到高級輔助駕駛、最后到高階自動駕駛的漸進過程,逐步實現(xiàn)各種功能的開放。
落地場景:在現(xiàn)階段最重要的工作是找準(zhǔn)合適的場景,然后把落地工作做到位。自動泊車是應(yīng)該優(yōu)先落地的第一場景,而自動跟車是第二場景,這兩個場景都值得企業(yè)全力投入,把產(chǎn)品體驗和成本做到極致,這樣消費者一定會買單的。
“去地圖”不可行:地圖是確定位置和進行導(dǎo)航的基礎(chǔ)。汽車離不開地圖,所以嚴(yán)格意義上的“去地圖”根本沒有可行性。
先驗傳感器:高精地圖可以動態(tài)、實時地更新車輛前方的狀況,所以可將其看作是智能汽車的一種傳感器——先驗傳感器,這對于高級輔助駕駛或者高階自動駕駛都非常重要。
地圖實時更新:目前地圖生產(chǎn)的各個環(huán)節(jié)及整個鏈條已經(jīng)取得了巨大的進步。地圖生產(chǎn)最大進步就是現(xiàn)在數(shù)據(jù)源比以前實現(xiàn)了數(shù)量級上的跨越,而且還在不斷增多,每一輛使用導(dǎo)航功能的汽車都在為地圖生產(chǎn)做出貢獻。第二個進步是數(shù)據(jù)識別工具鏈的全面升級,實現(xiàn)了地圖局部更新,并且能夠及時發(fā)布。
【對話實錄】
大模型有望讓機器智能真正接近于人
趙福全:下面具體談?wù)勂囍悄芑?,這實際上是一個綜合性的大話題。在通過V2X(車聯(lián)網(wǎng))實現(xiàn)汽車與諸多要素互聯(lián)的基礎(chǔ)上,車企的重點工作主要有兩項,一是智能座艙,二是自動駕駛。
在我看來,首先要做好的是智能座艙,因為智能座艙可以讓消費者充分感受到車輛的個性化,這一點在業(yè)界已經(jīng)形成了共識。而對智能座艙來說,人機交互是最重要的。近年來智能座艙特別是人機交互的相關(guān)技術(shù)進步得很快,例如當(dāng)前多種模式相互融合的多模態(tài)交互日益成為發(fā)展方向。
智能座艙應(yīng)該也是四維圖新的重要業(yè)務(wù)領(lǐng)域之一吧?畢竟現(xiàn)在圍繞著地圖的人機交互已經(jīng)成為智能座艙中必不可少的一部分了。不知道程總怎么看智能座艙?您覺得智能座艙后續(xù)將如何發(fā)展?其競爭的關(guān)鍵點在哪里?
程鵬:您說得很對,智能座艙與四維圖新的業(yè)務(wù)有非常緊密的關(guān)聯(lián)。這里面的邏輯是這樣的:地圖告訴用戶,汽車在哪里,這是確定A點位置的問題;導(dǎo)航告訴用戶,汽車怎樣開到目的地,這是從A點移動到B點的問題;而路況監(jiān)測通過車聯(lián)網(wǎng)告訴用戶,從A移動到B點的過程中會發(fā)生什么,如需要多長時間?路上有沒有事故?這是如何安全、快速、便捷地從A點移動到B點的問題,也是我們正在研究并希望能夠更好解決的問題。
結(jié)果我們發(fā)現(xiàn),解決這個問題是極其復(fù)雜的。大家都有體會,大中城市特別是一線城市的交通擁堵是很嚴(yán)重的。有數(shù)據(jù)顯示,北京通勤者人均每天要在汽車上耗費1小時40分鐘。而一天不過24小時,除去睡眠等時間,這差不多相當(dāng)于人們可支配時間的10%了。我們常說,時間就是生命,這意味著我們有10%的生命都消耗在了行車的過程中。所以,四維圖新決定去做自動駕駛,致力于逐步把人從駕駛中解放出來。這樣一來,人在車上的自由時間就會越來越多。所以,四維圖新也要做好智能座艙,讓用戶在車上有更好的體驗。這就是我們從地圖出發(fā)進行業(yè)務(wù)拓展的內(nèi)在邏輯。
應(yīng)該說,我們做地圖已經(jīng)二十年了,深深地感到這是一項艱苦的工作。因為地圖需要不斷更新,而且用戶可能永遠(yuǎn)都不會百分百滿意。只要有一個地方發(fā)生了變化,地圖卻沒有及時體現(xiàn)出來,用戶就會不滿,就會認(rèn)為地圖質(zhì)量不好。可見,做地圖是很有挑戰(zhàn)性的。而四維圖新二十年來堅持不懈,就是要應(yīng)對這種挑戰(zhàn),把這項有價值的工作一直做下去。
以地圖為基礎(chǔ),我們開展智能座艙相關(guān)業(yè)務(wù)也已經(jīng)有十多年了。記得我一開始就提出了一個目標(biāo),讓用戶進入到車內(nèi)就不再用手機了。然而這是一個很難達成的目標(biāo),甚至可以說我們很長時間都看不到希望。因為與手機不同,人與車之間最方便的交互方式就是語音。而語音交互技術(shù)是很難的,包括機器對人類自然語言的理解、不同音區(qū)的識別、環(huán)境噪聲的處理以及語音引擎的能力等,都不簡單。很多時候我們訓(xùn)練了好多次,機器才勉強能聽懂一點點。這就導(dǎo)致語音交互的準(zhǔn)確率到了一定程度之后,就很難再提高了。我們的測試表明,語音交互的準(zhǔn)確率要達到95%以上是非常困難的,而這樣的準(zhǔn)確率對汽車用戶來說還不夠。
好在不斷有新技術(shù)涌現(xiàn)出來,尤其是GPT(生成式預(yù)訓(xùn)練模型),即所謂大模型投入應(yīng)用后,我覺得終于看到了希望。借助于GPT,我們有望實現(xiàn)讓人們進入到車內(nèi)就完全不用手機了。最近我們從GPT-3入手,找專業(yè)的團隊合作開展了研究?,F(xiàn)在我可以有把握地說,在GPT-3.5和GPT-4這種規(guī)模級別的大模型的訓(xùn)練下,用戶已經(jīng)感覺不出和他對話的是機器了。
同時,人機交互不只有語音,您剛才也講到了多模態(tài)。有了大模型之后,我們還可以把多模態(tài)的交互方式放在一起訓(xùn)練,從而真正實現(xiàn)語音交互與其他交互方式的有機融合。比如攝像頭可用于識別人的表情、動作,甚至能準(zhǔn)確判斷駕駛員有沒有喝酒;又如毫米波雷達可用于監(jiān)測人的心跳、呼吸;再如座椅靠背的傳感器可以感知人的體溫。這些信息與用戶聲音傳遞出的語氣、心情等信息結(jié)合起來,就可以更全面、精準(zhǔn)地把握用戶狀態(tài),優(yōu)化用戶體驗。
以前開發(fā)智能座艙時,上述這些交互模式都是相互割裂的。語音交互歸屬語音系統(tǒng),攝像頭歸屬乘客監(jiān)測系統(tǒng),諸如此類,所有功能都是獨立開發(fā)的。相當(dāng)于有眼睛,有耳朵,卻沒有一個統(tǒng)一的大腦?,F(xiàn)在我們把這些功能全都放到大模型中訓(xùn)練,結(jié)果發(fā)現(xiàn)機器的識別水平能夠做到非常接近于人,真的可以稱之為智能副駕了。舉個例子,駕駛F1賽車需要極快的反應(yīng)速度,很需要輔助支持;但車內(nèi)只有一個座位,不可能配備人類副駕。而智能副駕或者說機器導(dǎo)航員可以適時告訴駕駛員,前面多少米需要左轉(zhuǎn)或右轉(zhuǎn)等信息,從而提供很大的幫助。現(xiàn)在已經(jīng)有一些大模型能夠做到這種程度了,四維圖新也做出了樣品,預(yù)計再過一段時間就能推向市場。
趙福全:這樣說來,不只是地圖領(lǐng)域,程總也是為人機交互領(lǐng)域做出了重大貢獻的企業(yè)領(lǐng)軍人。正是因為有很多像四維圖新這樣的企業(yè)共同努力,我們才得以看到擁有更高人機交互能力的智能座艙由量變到質(zhì)變的發(fā)展前景。那么據(jù)您所知,大模型真正走向市場應(yīng)用還有哪些障礙呢?
程鵬:我認(rèn)為,障礙主要在大模型的輕量化和網(wǎng)絡(luò)的延遲上。眾所周知,大模型對算力的要求非常高,所以GPU(圖形處理器)等功能都集中在云端。未來我們希望能把大模型適當(dāng)輕量化,至少可以把部分功能放在車端,以實時應(yīng)對相關(guān)的狀況。當(dāng)然,即便大模型實現(xiàn)了輕量化,將其部分功能放到車端,也會對車端的算力提出不小的挑戰(zhàn)。此外,還有網(wǎng)絡(luò)的問題。使用大模型時必然會有大量數(shù)據(jù)在車端和云端之間傳輸。而汽車與手機完全不同:手機通常是在網(wǎng)絡(luò)信號穩(wěn)定的建筑物內(nèi)靜止使用,出現(xiàn)信息延遲的可能性較小,并且偶有延遲也沒什么關(guān)系;汽車則是在網(wǎng)絡(luò)信息不太穩(wěn)定的室外移動使用,其波及范圍更廣、場景變化更多,在行駛過程中難免遇到信息延遲,并且一旦延遲就可能導(dǎo)致安全事故。這對于大模型在汽車產(chǎn)品上的應(yīng)用,確實是一個比較突出的挑戰(zhàn)。
趙福全:在您看來,與當(dāng)前算力主要放在車端的車載交互系統(tǒng)相比,在性能上更勝一籌的大模型,大致什么時間能夠量產(chǎn)?現(xiàn)在大模型還不能量產(chǎn)的原因主要是技術(shù)問題,還是成本問題?又或者是兩類問題兼而有之?
程鵬:最近我們已經(jīng)把樣品拿給客戶看過了,這個客戶是一家致力于打造高端產(chǎn)品的車企,對智能化有很高的要求。而這家車企看了我們的樣品后,應(yīng)該說是非常震撼。這款樣品估計兩三年后就可以量產(chǎn),現(xiàn)在軟件本身已經(jīng)沒什么問題了,主要問題還是性價比。我覺得,要提高這類產(chǎn)品的性價比,通信基礎(chǔ)設(shè)施的建設(shè)以及計算芯片的進步也很關(guān)鍵。
趙福全:您認(rèn)為最終在汽車產(chǎn)品上量產(chǎn)應(yīng)用的人機交互大模型,其主要算力應(yīng)該是放在車端,還是云端呢?
程鵬:這個問題我是這樣看的:對于手機產(chǎn)業(yè)來說,把算力放在云端無疑是比較好的選擇;但是對于汽車產(chǎn)業(yè)來說,車端必須要有一定的算力,因為汽車是移動的,而網(wǎng)絡(luò)信號不可能真正實現(xiàn)全方位、無死角的覆蓋。我們做地圖時需要在各種區(qū)域、各個時段測試網(wǎng)絡(luò)信號的強弱,還要專門研究網(wǎng)絡(luò)如何優(yōu)化,所以對全國各個基站的覆蓋范圍和強度都很了解。我認(rèn)為,要確保大模型在每一個地點都能正常使用,且體驗足夠好,完全依靠云端算力實在太難了,還是要在車端部署相當(dāng)程度的算力才行。
趙福全:您在這方面有豐富的實戰(zhàn)經(jīng)驗,非常了解網(wǎng)絡(luò)系統(tǒng)的實際情況,結(jié)合汽車具有移動性的特點,您判斷大模型的算力是不能全都放在云端的。那后續(xù)會不會是這樣的發(fā)展過程:現(xiàn)在車載芯片是以計算芯片為主;未來車端的算力將逐步轉(zhuǎn)移到云端,所以車載芯片將以通信芯片為主,同時車端仍適當(dāng)保留一部分算力。不過這似乎是一個理想化的過程,而且這種轉(zhuǎn)變恐怕需要很長的時間。這是不是因為我們對未來網(wǎng)絡(luò)和云的發(fā)展?jié)撃芄烙嫷糜行┍^了呢?不少從業(yè)者還是期待把車端的諸多業(yè)務(wù)放到云端來完成,再基于通信手段來實現(xiàn)對車輛的遠(yuǎn)程控制。您對此怎么看?
程鵬:我覺得這種轉(zhuǎn)變不大可能。我們還是以手機來做對比,現(xiàn)在手機的通信能力無疑越來越強了,那它的算力是越來越強了,還是越來越弱了?顯然也越來越強了。同樣的,汽車不僅是連接的節(jié)點,也是智能的終端,未來車端的算力肯定也會越來越強。而且一旦汽車具備了更強的算力,肯定會涌現(xiàn)出與之匹配的很多新需求。正如您剛才講到的,未來汽車將是一個母生態(tài),有著孕育和承載更多新產(chǎn)品、新應(yīng)用、新服務(wù)的能力,而算力正是這種能力的重要組成部分。當(dāng)汽車沒有足夠的算力時,大家自然不會去研究相應(yīng)的產(chǎn)品、應(yīng)用和服務(wù);可是當(dāng)汽車具備了更強的算力后,就會有人去思考,我能用這個算力來做些什么,于是就會產(chǎn)生一系列的新產(chǎn)品、新應(yīng)用和新服務(wù)。
趙福全:我認(rèn)為,未來汽車將是一個移動的智能空間,尤其是當(dāng)車輛逐步實現(xiàn)了自動駕駛、把人從駕駛中解放出來之后,汽車的空間屬性將進一步放大。屆時汽車既是生活空間,又是工作空間,還是娛樂空間,將真正實現(xiàn)三合一。甚至有人半開玩笑地講,將來只需要買一輛汽車,就等于擁有了一個可移動的家,各種事情都可以在車上完成。我覺得這并非天方夜譚。事實上,現(xiàn)在英國、荷蘭等國家就有人住在船上,這些船還有通訊地址,可以正常收發(fā)郵件。在這樣的前景下,智能座艙的重要性無疑會愈發(fā)突顯,我們完全可以暢想更多的應(yīng)用場景。
剛才程總和大家分享了很多非常重要的觀點。您闡釋了自己對于地圖、自動駕駛以及智能座艙內(nèi)在邏輯關(guān)系的系統(tǒng)認(rèn)知。您談到,首先要告訴用戶“你在哪里”,即所在的位置;然后要告訴用戶“你怎樣去那里”,即兩點之間的路徑;最后要告訴用戶“你去那里的過程會怎樣”,即在兩點之間移動時會遇到的情況,如途中是否堵車等等,以此來確定如何更安全、更快速、更便捷地移動。對于這三個問題,地圖無疑都是基礎(chǔ)性的支撐,決定著我們能在多大程度上優(yōu)化車輛的移動過程。而您也談到了,要做好地圖是非常困難的。
為了更好地解決上述第三個問題,我們一方面要努力做好自動駕駛,另一方面也要努力做好智能座艙。對后者來說,人機交互最為關(guān)鍵。因為人的需求總要通過某種方式傳遞給機器,同時機器必須準(zhǔn)確理解相應(yīng)的需求并做出回應(yīng),這樣才能確保智能座艙的功能及其體驗。但是此前各種不同的人機交互方式都是相互割裂、獨立開發(fā)的,而且最主要的語音交互方式在準(zhǔn)確率上還不盡如人意,這就導(dǎo)致用戶的體驗始終不夠好。歸根結(jié)底,這是因為機器仍然做不到接近于人,不能像人那樣綜合、準(zhǔn)確、快速地處理和利用各種信息。
不過程總興奮地談到,GPT大模型讓我們看到了希望。我注意到,您沒有講ChatGPT,即面向聊天的大模型。因為GPT本身并不限于文字,可以是語音,也可以是圖像,例如人的表情或手勢,還可以是各種方式的組合。有了這樣的綜合處理能力,機器將非常接近于人。當(dāng)大模型在車上應(yīng)用時,就可以通過車內(nèi)人員的語言、表情、手勢以及身心狀態(tài)等各方面的信息,做出綜合的判斷和行動。不過,大模型應(yīng)用于汽車產(chǎn)品還面臨一系列挑戰(zhàn)。特別是如您談到的,汽車與手機不同,必須最大限度地確保安全,因此對數(shù)據(jù)傳輸?shù)乃俣群头€(wěn)定性都有更高的要求。但我毫不懷疑,這場革命性的改變終將實現(xiàn)。而您談到,四維圖新基于大模型的產(chǎn)品在兩三年后就會量產(chǎn),這非常讓人期待。
說到底,大模型需要很高的算力,其性價比的提高還有賴于通信能力的升級和計算芯片的進步。展望未來,我認(rèn)為,智能汽車作為可移動的數(shù)據(jù)節(jié)點和智能終端,必須具備很強的通信能力;同時在滿足必要需求的前提下,車端應(yīng)盡可能少部署算力,而將更多的算力放到云端;并以強大的通信基礎(chǔ)設(shè)施和車輛通信能力,充分保障大量數(shù)據(jù)在車端和云端之間的順暢流通。唯有如此,汽車才能以更低的成本實現(xiàn)更多的功能和更好的體驗,進而實現(xiàn)所謂智能時代的科技平權(quán)。這才是智能座艙的最高境界,也是很多人都希望把算力轉(zhuǎn)移到云端的根本原因。
發(fā)展自動駕駛需要企業(yè)保持戰(zhàn)略定力,落地重點場景
趙福全:我想剛才這番交流,一定讓大家對智能座艙有了更多的理解,也有了更多的期待。那么自動駕駛呢?有了GPT的賦能,自動駕駛在規(guī)劃行車路線和操控車輛時,會不會也有根本性的改變?我們都知道,自動駕駛需要感知能力、決策能力以及執(zhí)行能力,那GPT能不能把感知、決策與執(zhí)行系統(tǒng)打通呢?
事實上對于自動駕駛,當(dāng)前業(yè)內(nèi)也有不少質(zhì)疑的聲音。曾經(jīng)自動駕駛的熱度極高,很多自動駕駛初創(chuàng)公司的估值都非常驚人,然而今天的狀況可以說冷清了許多。具體來看,一是L2+已逐漸成為產(chǎn)品標(biāo)配,而車企正面臨著性價比方面的嚴(yán)峻挑戰(zhàn);二是大家發(fā)現(xiàn)量產(chǎn)L3的困難超出預(yù)期,之前可以歸咎于法規(guī)限制,但是現(xiàn)在法規(guī)逐步松動了,如何平衡好技術(shù)投入和體驗升級的問題卻并沒有得到真正的解決;三是大家普遍認(rèn)為過去對于L4量產(chǎn)時間的估計太過樂觀,一些車企甚至因此中斷了對L4的投入。
不知道程總怎樣看待自動駕駛技術(shù)產(chǎn)業(yè)化發(fā)展的現(xiàn)狀?對于不同級別的自動駕駛技術(shù),四維圖新的開發(fā)策略是怎樣的?
程鵬:前面談到,四維圖新的業(yè)務(wù)早就已經(jīng)從地圖拓展到了智能座艙和自動駕駛,甚至可以說,我們現(xiàn)在是以自動駕駛為龍頭來拉動其他相關(guān)產(chǎn)品的研發(fā)。從2015年開始,我們做自動駕駛也已有八年了。在這期間,我從來沒有悲觀過,也沒有過分樂觀過。我覺得,對于自動駕駛我們應(yīng)該管理好自己的期待值。那些過分樂觀的人就是期待值太高了;反過來,過分悲觀的人期待值又太低了。我記得,早在2015、2016年的時候,就有樂觀的人認(rèn)為,到2021年就能實現(xiàn)L4。而時間到了2022、2023年,還有悲觀的人認(rèn)為,L4永遠(yuǎn)都實現(xiàn)不了。不過如果我們認(rèn)真審視這些年來自動駕駛技術(shù)的發(fā)展歷程,可能就不會太悲觀,也不會太樂觀,更不會受資本市場一時冷熱的影響了。
今天我仍然堅信,L4一定能夠?qū)崿F(xiàn),即人可以徹底脫手,不需要再握著方向盤。也就是說,汽車完全不需要人來控制的時代最終必將到來,只不過是時間早晚的問題罷了。當(dāng)然,前進的過程注定充滿挑戰(zhàn)。尤其是因為汽車產(chǎn)業(yè)有其特殊性:其他產(chǎn)業(yè)的試錯成本相對較低;但汽車產(chǎn)品對安全性的要求非常高,事關(guān)汽車安全的試錯成本極其高昂。因此,任何新增的功能都不能給用戶帶來行車安全上的隱患,否則無論多么智能都沒有意義。事實上,智能汽車的目的就是給用戶提供更好的生活,這顯然必須以確保功能安全為前提。正因如此,所有開發(fā)自動駕駛的公司,即便技術(shù)和資金實力再強,也必須步步為營、循序漸進。
而這些年我也確實看到了,自動駕駛技術(shù)正在一點一點不斷進步,包括我們自己的產(chǎn)品也在不斷提升。所以不管外界怎么說,四維圖新肯定會繼續(xù)努力。其實現(xiàn)在已經(jīng)有越來越多的消費者接受了某些自動駕駛功能,例如輔助泊車。說到底,自動駕駛的最終落地,不在于企業(yè)自認(rèn)為技術(shù)有多先進,而在于用戶愿不愿意為之買單。只要我們把L4的相關(guān)功能及場景都逐一做到位,讓用戶的接受度越來越高,那L4完全落地的時刻自然就會到來。
在我看來,自動泊車是L4最容易實現(xiàn)的第一場景。所謂L4的自動泊車,就是在抵達目的地以后,人可以下車,由車輛自動尋找停車位并泊好;等到再次用車時,車輛從停車位自動駛出來接人。這個場景中車內(nèi)無人,所以即使出現(xiàn)一些狀況,危害也不大。同時這個場景對時間也不太敏感,車輛可以低速泊入或駛出停車位,在技術(shù)上相對容易。更重要的是,這個場景是用戶經(jīng)常遇到的,可以切實為用戶帶來便利。所以,用戶通常愿意也敢于嘗試。事實上,高階自動駕駛的某個場景究竟能否落地,很大程度上就取決于用戶敢不敢嘗試。相較于用戶坐在車內(nèi)且車速較快的其他場景,自動泊車場景無疑具有先天優(yōu)勢。
自動跟車,也就是自適應(yīng)巡航,應(yīng)該是第二場景。當(dāng)前,這個功能的使用也很普遍?;旧暇邆銵2或L2+功能的車輛,用戶都會用到這個功能。因為遇到交通擁堵的時候,駕駛者需要頻繁踩踏板,是很累的,這時候使用自動跟車功能就輕松多了。而且無論是在城區(qū)內(nèi),還是在高速公路上,現(xiàn)在自動跟車功能都做得比較到位了。車輛可以自動跟著前車行駛,并保持安全的車距。
總體來看,實現(xiàn)高階自動駕駛有兩條路線:一是直接奔向L4,即Robotaxi路線;二是循序漸進、逐步優(yōu)化。我本人一直是第二條路線的堅定支持者。我覺得,我們還是要經(jīng)歷從輔助駕駛到高級輔助駕駛、最后到高階自動駕駛的漸進過程,逐步實現(xiàn)各種功能的開放。所以,雖然四維圖新現(xiàn)在也有開發(fā)L4的一個小團隊,但我們近期的目標(biāo)并不是量產(chǎn);我們?nèi)ν七M量產(chǎn)的一直是L2+高級輔助駕駛的產(chǎn)品,現(xiàn)在這款產(chǎn)品已經(jīng)裝車量產(chǎn)了,而且在市場上賣得很不錯。
趙福全:程總講得非常好。關(guān)于高階自動駕駛?cè)绾伟l(fā)展的問題,實際上是不好回答的。特別是近期業(yè)界一直有一種很強的聲音,不看好高階自動駕駛。不少原本致力于L4的企業(yè)紛紛轉(zhuǎn)向L2+,大家當(dāng)然知道L2+不是真正的自動駕駛,但這也是當(dāng)前情況下企業(yè)為了盡早推出產(chǎn)品、回收資金的一種“無奈”量產(chǎn),或者說是很多自動駕駛初創(chuàng)公司為了生存下去不得不采取的一種折衷辦法。
而程總表示,自己從來沒有悲觀過,也沒有過分樂觀過。作為進入汽車智能化領(lǐng)域二十年的一名老兵,您并不是因為長時間的磨礪而變得遲鈍了,而是深刻理解了技術(shù)創(chuàng)新的基本規(guī)律。任何前景美妙的新生事物,一開始總是不乏一批狂熱的參與者。然而企業(yè)管理者不能狂熱,因為經(jīng)營企業(yè)需要冷靜。程總就是這樣冷靜的參與者,您既堅信自動駕駛是未來汽車產(chǎn)業(yè)的大勢所趨,又對推進自動駕駛的長期性和復(fù)雜性有足夠的認(rèn)識。所以,既不會盲目樂觀地超前發(fā)展,也不會因為資本熱度的降低或者某些企業(yè)的失敗而放棄投入。
剛才程總談到,四維圖新原本是一家地圖供應(yīng)商,而現(xiàn)在是以自動駕駛為龍頭拉動整個公司的各項業(yè)務(wù)。這意味著四維圖新在地圖、人機交互、芯片以及數(shù)據(jù)等業(yè)務(wù)上的創(chuàng)新發(fā)展,都是圍繞著自動駕駛來展開的。這充分說明了,您對自動駕駛長期前景的高度重視和堅定信心,將其視為汽車產(chǎn)業(yè)發(fā)展的必由之路。另一方面,您認(rèn)為企業(yè)必須一步一個腳印地穩(wěn)步推進自動駕駛。畢竟企業(yè)既要考慮未來的發(fā)展,更要考慮眼前的生存。所以,四維圖新決定先從L2+入手,現(xiàn)階段重點做好L2+產(chǎn)品的量產(chǎn);同時,四維圖新很早就成立了L4的研發(fā)團隊,以提前做好前瞻儲備。
實際上,高階自動駕駛本來也不會一蹴而就,不可能一夜之間就出現(xiàn)了完美的全天候自動駕駛產(chǎn)品。所以,發(fā)展自動駕駛一定是一個循序漸進的過程。只不過有些企業(yè)是從L2、L2+做起,逐步積累地邁向L4乃至L5;而另一些企業(yè)則直接瞄準(zhǔn)了L4。但在研發(fā)L4的過程中,企業(yè)也需要“沿途下蛋”,將某些功能逐一落地,這既是為了驗證已有的創(chuàng)新成果,也是為了獲得一定的回報,以保障后續(xù)的投入。從這個意義上講,我倒覺得這兩種路線其實殊途同歸,在現(xiàn)階段最重要的工作都是找準(zhǔn)合適的場景,然后把落地工作做到位。對此,程總給出了很重要的觀點——自動泊車是應(yīng)該優(yōu)先落地的第一場景,而自動跟車是第二場景,這兩個場景都值得企業(yè)全力投入,把產(chǎn)品體驗和成本做到極致,這樣消費者一定會買單的。至于說實現(xiàn)的是L2+、還是L4的功能,或者說是由高到低、還是由低到高來實現(xiàn)的,都無關(guān)緊要。
由此出發(fā),我認(rèn)為,那些認(rèn)為高階自動駕駛遙遙無期甚至不可能實現(xiàn)的悲觀者無疑是錯誤的。事實上,現(xiàn)在的悲觀者中,可能有不少人正是此前的過度樂觀者,因為戰(zhàn)略誤判而投入過多、過早,以至于沒有賺到錢,甚至陷入了企業(yè)經(jīng)營危機。這顯然是自身判斷的失誤,而非產(chǎn)業(yè)大勢的變化。
在此我還想特別強調(diào),企業(yè)家和投資者是有本質(zhì)區(qū)別的。資本追逐熱點,追求短線和賺快錢并沒有錯;但企業(yè)家必須有定力,應(yīng)該追求長線、持續(xù)的發(fā)展模式和盈利能力,對于認(rèn)準(zhǔn)的方向,切不可隨波逐流,更不可朝令夕改。所以企業(yè)在引入資本時,也要考慮投資者是不是有一定的戰(zhàn)略遠(yuǎn)見,或者會不會影響自己的戰(zhàn)略自主權(quán),以免被純粹的資本考量所裹挾,導(dǎo)致急功近利,危及企業(yè)的長遠(yuǎn)發(fā)展。
“去地圖”沒有可行性,自動駕駛需要地圖賦能
趙福全:程總,談到自動駕駛,一個不可回避的話題就是高精地圖。應(yīng)該說長期以來大家普遍認(rèn)為,解決了高精地圖的問題,自動駕駛的很多難題就都迎刃而解了。不過現(xiàn)在看來,高精地圖的問題也不好解決,無論是成本,還是更新速度等方面,都有挑戰(zhàn)。尤其像中國這樣地大物博的國家,保持地圖的快速更新是很困難的。此外,地圖不是隨便就可以采集和使用的,因為任何國家都會有很多敏感的地理信息,所以地圖供應(yīng)商不得不面對相關(guān)法律法規(guī)的限制。這并不是中國特色,全球各國都是如此。
時至今日,一方面,車企感覺高精地圖的性價比還不夠好,同時受到的限制也比較多;另一方面,市場對自動駕駛產(chǎn)品的需求又非常強烈。所以,就產(chǎn)生了所謂“輕地圖”甚至“去地圖”的技術(shù)方案,對此業(yè)界也有很多爭論。那么,四維圖新作為一家資深的地圖供應(yīng)商,是如何理解自動駕駛與地圖的關(guān)系的?您覺得高精地圖怎樣才能做到高性價比和快速迭代,以滿足市場需求?
程鵬:我認(rèn)為,“無地圖”或者“去地圖”都不太可能發(fā)生。第一,現(xiàn)在一些車企提出的“去地圖”,本質(zhì)上只是在車端不安裝高精地圖而已,但在云端進行全局規(guī)劃和車道引導(dǎo)時還是要用到地圖。如果車企完全不用地圖,那就無法知道自己的車輛在哪里,也無法知道要去哪里,更無法知道途中應(yīng)該怎樣走、是否需要切換路線等等。所以,地圖和汽車天生就是一對。正如前面我講到的,地圖解決汽車當(dāng)前在哪里、目的地在哪里的問題;導(dǎo)航解決汽車以什么路線從當(dāng)前位置移動到目的地的問題;而自動駕駛解決汽車如何更安全、快速和便捷地從當(dāng)前位置移動到目的地的問題。顯然,地圖是解決這三個問題的基礎(chǔ)。因此,汽車永遠(yuǎn)也不可能沒有地圖,或者說汽車是肯定要使用地圖的。
第二,也有一些車企提出的“去地圖”方案,是依賴強大的實時建圖能力,而且這種實時生成高精地圖的能力確實在不斷增強。前面也提到了大模型,有了規(guī)模更大的數(shù)據(jù)以及能力更強的算法,實時建圖的能力當(dāng)然會提升。不過需要注意的是,肯定還會有一些信息是汽車上的傳感器無法實時采集到的,比如一公里以后的車道匯聚或者車流量變化情況。除非車企每天都派出無人機在天上跟隨車輛來采集這些信息,但這無疑是不可能的。
所以,我還是希望,想把自動駕駛產(chǎn)品真正做到位的同行們都能認(rèn)識到,地圖對于智能汽車是必不可少的一部分。當(dāng)然,地圖的用法可能會有所變化。一是從技術(shù)角度看,可以考慮把高精地圖從車端改為布置到云端,或者說在車端由完整的高精地圖改為輕量級的高精地圖;二是從系統(tǒng)角度看,可以把高精地圖看作智能汽車的一種傳感器,我將其稱為先驗傳感器,相當(dāng)于幫助車輛提前看到前方路況的傳感器,這對于高級輔助駕駛或者高階自動駕駛都是非常重要的。既然有這樣的傳感器,汽車為什么不使用呢?畢竟高精地圖可以動態(tài)、實時地更新車輛前方的狀況。而如果不用高精地圖,那就要用別的傳感器來采集這些信息,這將帶來高昂的成本。試想,使用三個激光雷達與使用高精地圖相比,哪個方案成本更高是顯而易見的。
趙福全:這還不只是哪種方案成本更高的問題,選擇激光雷達的方案,即使用上10個激光雷達,也測不到1公里以外的情況,更不可能掌握50公里以外的情況。在這方面,地圖所能發(fā)揮的作用是不可替代的。
程鵬:您說得太對了。何況從性價比的角度來看,使用高精地圖也是一個非常不錯的選擇。我覺得,任何一套系統(tǒng)在選擇構(gòu)成時,都不應(yīng)該只看某個組成部分的性價比,更應(yīng)該看系統(tǒng)整體的性價比。而在高級輔助駕駛或高階自動駕駛系統(tǒng)中,綜合考慮采購成本和服務(wù)費用等,高精地圖是性價比較高的選項。
前面我也提到了,做地圖不是一件容易的工作,不僅需要持續(xù)的投入,而且要做好非常難。但是我們不能因為地圖難做就不做了,或者就不用了。就像自動駕駛、芯片等等,也都很難做,可大家還在持續(xù)努力。當(dāng)然,根據(jù)產(chǎn)業(yè)發(fā)展的情況,有時候可能需要適當(dāng)調(diào)整節(jié)奏,包括重新評估投入的資源、使用的方式和量產(chǎn)的計劃等。不過我認(rèn)為,努力做好、用好地圖的決心不應(yīng)該有絲毫的動搖。
更進一步來說,長期來看,我判斷汽車終究是要使用高精地圖的。盡管現(xiàn)在車輛的實時建圖能力不斷增強,然而至多也只能是在車輛可感知的兩三百米范圍內(nèi)發(fā)揮作用,無法從根本上解決自動駕駛的功能安全問題。在自動駕駛領(lǐng)域有一個專業(yè)術(shù)語叫Corner Case,即所謂邊緣案例。通常這些邊緣案例發(fā)生的概率很低,但卻正是人工智能不“擅長”處理的。如果沒有高精地圖,智能汽車將很難決策應(yīng)該如何做出合理的響應(yīng)。
舉個例子,當(dāng)汽車在行駛中遇到突發(fā)狀況已經(jīng)難以避免碰撞時,是選擇追尾前車,還是選擇撞向路邊的護欄?在這種極端的情況下,智能汽車應(yīng)該選擇危害最小、損失最少的撞擊方案。此時,實時掌握護欄是什么形狀的、又是什么材料的,就變得至關(guān)重要。而包含道路系統(tǒng)幾何特征和復(fù)雜屬性等各種信息的高精地圖可以為此提供有力支撐,從而顯著增強邊緣案例下汽車的功能安全。
總之,我覺得對于自動駕駛技術(shù)方案的選擇,我們還是應(yīng)該從全面確保行車安全的前提出發(fā),從能否切實支撐自動駕駛產(chǎn)品量產(chǎn)的角度考慮。
趙福全:程總不僅是地圖公司的企業(yè)家,也是地圖領(lǐng)域的技術(shù)專家。您剛才這番話非常重要,從企業(yè)和技術(shù)的雙重維度,為大家闡明了地圖的重要作用,特別是強調(diào)了我們應(yīng)該與時俱進地客觀看待高精地圖的價值。
第一,對于當(dāng)前業(yè)界出現(xiàn)的“去地圖”的聲音,有些只是自媒體的標(biāo)題黨文章,也有些是發(fā)聲者帶有自身的某種商業(yè)目的,當(dāng)然還有些確實是出于個人的不同理解,但這部分人通常也并不完全否定地圖的作用。總體而言,我感覺“去地圖”的聲音被不合理地放大了。
第二,正如程總所言,汽車是離不開地圖的,所以嚴(yán)格意義上的“去地圖”根本沒有可行性。地圖可以告訴我們所在地以及目的地的位置,也可以為我們指示從所在地到目的地的路線。也就是說,地圖是確定位置和進行導(dǎo)航的基礎(chǔ)。當(dāng)然,我們?nèi)粘J褂玫膶?dǎo)航地圖與自動駕駛系統(tǒng)使用的高精地圖有很大的差別。高精地圖不只精度要達到厘米級,而且還要對諸如車道線、護欄等道路情況進行精準(zhǔn)的幾何標(biāo)注。而程總認(rèn)為,這些信息對于確保自動駕駛汽車的功能安全至關(guān)重要,因此高精地圖和導(dǎo)航地圖一樣,對汽車來說是不可或缺的。
第三,自動駕駛系統(tǒng)希望高精地圖在全域范圍內(nèi)做到高精度,同時做到實時更新。這個目標(biāo)太過理想化了,很可能永遠(yuǎn)都無法完全實現(xiàn)。但這并不意味我們不能逐漸接近這個理想目標(biāo),事實上,今天的高精地圖已經(jīng)取得了顯著進步?,F(xiàn)在一些企業(yè)提出的所謂“去地圖”方案,其實并不是拋開了高精地圖,而是出于成本壓力,只使用現(xiàn)有的高精地圖,不再強求全域覆蓋和實時更新罷了。如果真的完全不用高精地圖,那就得靠車端的其他傳感器來補足相關(guān)的信息,這樣自動駕駛系統(tǒng)的成本恐怕只會更高,而且還可能導(dǎo)致車輛定位等功能的下降。
所以,正如程總指出的,“去地圖”這個說法具有一定的誤導(dǎo)性?,F(xiàn)在很多車企正使用著地圖供應(yīng)商經(jīng)過多年努力完善后的高精地圖,盡管現(xiàn)有的地圖還不是理想狀態(tài),但相比之前已經(jīng)進步了太多。在這樣的基礎(chǔ)上談“去地圖”,我倒覺得這其實是對高精地圖持續(xù)進步的一種肯定。
另外,站在當(dāng)前的時間點上,隨著車端各種傳感器的能力、數(shù)據(jù)處理的能力以及信息傳輸?shù)哪芰Υ蠓嵘嚻蟠_實可以考慮另辟蹊徑,通過實時建圖的方式來替代高精地圖。特別是對于目前日益成為標(biāo)配、越來越考驗性價比的L2+高級輔助駕駛來說,這未嘗不是一種可選的方案。然而未來的高階自動駕駛,恐怕還是不能脫離高精地圖。因為唯有高精地圖才能提供整個區(qū)域內(nèi)交通狀況及道路設(shè)施等的精準(zhǔn)信息,從而讓汽車在一系列危險的邊緣案例場景下,能夠以相對較低的成本來確保足夠的功能安全。我認(rèn)為,程總的這個觀點很重要。
地圖生產(chǎn)的各個環(huán)節(jié)、整個鏈條都取得了巨大進步
趙福全:接下來我們探討一下地圖的制作。我們知道,原來地圖供應(yīng)商都是依靠地圖采集車,就是那種頂著多種傳感設(shè)備的車輛,到處采集地圖數(shù)據(jù)的;而現(xiàn)在地圖采集方式已經(jīng)發(fā)生了很大的改變。利用今天這個機會,請您談一談地圖的生產(chǎn)技術(shù)和模式都有哪些進步?目前還有哪些局限性?比如當(dāng)前所謂的眾源方式,是不是每輛車都能成為地圖信息的提供者?但如果某輛車提供的數(shù)據(jù)存在問題,又該怎么辦呢?
程鵬:在過去的二十年中,四維圖新做出了不少中國第一,包括中國第一張導(dǎo)航地圖、中國第一張實時路況地圖、中國第一顆國產(chǎn)化車規(guī)級的量產(chǎn)MCU(微控制器)芯片等等。我也有幸成為了親歷者。應(yīng)該說,這一路走過來,我們確實遇到過很多艱難的技術(shù)挑戰(zhàn)。
就拿地圖來說,我們最早的一版地圖就是幾個人開著一輛車,帶著一張交通圖、一個GPS軌跡記錄儀、一臺照相機,然后走街串巷,拍下一條條道路、一個個路口的照片,最后做成地圖的。這就是二十年前地圖的生產(chǎn)方式。顯然,那個時候是做不到快速更新道路情況變化的。
而現(xiàn)在我們能夠做到,中國幾百萬公里的道路,任何一個地方發(fā)生變化,我們當(dāng)天就能掌握信息,當(dāng)天就能更新到地圖上。這是怎樣實現(xiàn)的呢?說起來,做地圖本身是一個非常復(fù)雜的系統(tǒng)工程,而這個系統(tǒng)工程包含兩個關(guān)鍵點:一是增加數(shù)據(jù)源的數(shù)量,即從盡可能多的源頭獲取地圖數(shù)據(jù)信息。二是快速分辨信息的有效性,即以某種工具盡可能快地識別海量數(shù)據(jù)中哪些是有效信息、哪些是無效信息。這樣才能獲取足夠的信息,并將其中的有效信息快速提煉出來,然后轉(zhuǎn)變成地圖,及時發(fā)布給用戶。而以這兩個關(guān)鍵點為核心,地圖生產(chǎn)的各個環(huán)節(jié)、整個鏈條目前都已經(jīng)取得了巨大的進步。
第一個進步,我認(rèn)為也是最大的進步,就是現(xiàn)在的數(shù)據(jù)源比以前多得多,而且還在不斷增多。以前的數(shù)據(jù)源就是我們公司的100多輛地圖采集車,包括我在內(nèi),大家都得成天開著車到處采集數(shù)據(jù)。而現(xiàn)在每一輛使用導(dǎo)航功能的汽車都在為地圖生產(chǎn)做出貢獻。由于每天都有千萬量級的用戶在使用導(dǎo)航功能,所以,數(shù)據(jù)源的增加實現(xiàn)了數(shù)量級上的跨越。
第二個進步是數(shù)據(jù)識別工具鏈的全面升級。以前我們制作地圖時使用的是型號為880的服務(wù)器,將數(shù)據(jù)上傳之后,需要運行一個月才能處理完畢,導(dǎo)致地圖的實時性極差。這主要是因為傳統(tǒng)的拓?fù)潢P(guān)系是一個整體,要制作一張地圖就要構(gòu)建一個完整的數(shù)據(jù)庫,通常耗時一個月才能建好,因此地圖更新的周期非常漫長。而現(xiàn)在地圖編譯的整個工具鏈都已經(jīng)發(fā)生了變化,在新的拓?fù)潢P(guān)系下地圖可以瓦片式地構(gòu)建和迭代。也就是說,地圖可以一小塊一小塊地更新,并且在更新的同時就能及時發(fā)布。畢竟現(xiàn)在多數(shù)車輛都已實現(xiàn)了聯(lián)網(wǎng),所以,我們能夠?qū)⒏铝说牡貓D第一時間傳遞給用戶。