2024年12月,我與理想汽車CEO李想進行了一場對話。當(dāng)時,他們決定將車機助手“理想同學(xué)”推出手機版App,并于此前做了基座大模型,兩者相加約等于Kimi(人工智能助手)。
這意味著,人們認知中的新能源電動車企業(yè)宣告要進入與字節(jié)豆包、月之暗面Kimi、騰訊元寶、百度文心一言等的個人助手之戰(zhàn)。這場原本已然紅海的“基座大模型+個人超級助手”商戰(zhàn),如今競爭烈度再度升級。
在很多人看來,個人超級助手與智能駕駛是截然不同的兩件事—產(chǎn)品不同,底層架構(gòu)無法打通。但李想不這么認為,在他看來,OpenAI定義的第三階段(智能體)與自動駕駛定義的第四階段(自動駕駛)會在相近時間點交匯,并合并到統(tǒng)一架構(gòu)上。
各異的企業(yè)將匯入同一片賽場,因為“基座模型是人工智能時代的操作系統(tǒng)+編程語言”,“基座模型所構(gòu)建出的人工智能超級產(chǎn)品,會是新一代入口—它會在所有設(shè)備之上,在所有服務(wù)之上”。如今,這些企業(yè)都在爭奪“AGI(通用人工智能)L3和自動駕駛L4的門票”,這會是雙邊的“iPhone 4時刻”。
從全球范圍來看,關(guān)于人工智能的探討正從技術(shù)認知轉(zhuǎn)向產(chǎn)品構(gòu)想。對話中,這位非技術(shù)背景、被認為在產(chǎn)品上頗具天賦的創(chuàng)始人,復(fù)原了這兩年他關(guān)于人工智能完整的技術(shù)與產(chǎn)品觀。以下是與李想的對話內(nèi)容(為方便閱讀,作者做了一些文本優(yōu)化),略有刪減。
第一節(jié) 談人工智能
1.“我絕對不止做一棵樹”
張小珺:當(dāng)別人都在做純電時,你在做增程;現(xiàn)在很多人開始轉(zhuǎn)增程,你怎么又不想造車,而要去做人工智能企業(yè)了?
李想:造車肯定是要造的,大家經(jīng)常講:電動化是上半場,智能化是下半場。我認為智能化講的不是傳統(tǒng)的軟件智能,而是真正的人工智能。這是造車往下延續(xù)的必經(jīng)之路,汽車將從工業(yè)時代的交通工具,進化為人工智能時代的空間機器人。
張小珺:你第一次對內(nèi)說“2030年要做一個全球領(lǐng)先的人工智能企業(yè)”是在2023年1月,當(dāng)時ChatGPT僅誕生2個月,這是跟風(fēng)之舉嗎?
李想:不是跟風(fēng)。2022年9月,我們已經(jīng)確定要把人工智能包含自動駕駛作為重要的戰(zhàn)略方向,這是未來競爭的關(guān)鍵。
2023年初戰(zhàn)略發(fā)布時,我們做了根本性調(diào)整—把人工智能從隱藏戰(zhàn)略轉(zhuǎn)變?yōu)殚_放的戰(zhàn)略,這樣才能吸引足夠多的人才。OpenAI發(fā)揮了非常大的作用,打開了一個全新的人工智能時代。所以,我們對人工智能的所有設(shè)想、所有期盼不用再藏著了,應(yīng)該拿出來正面講。
張小珺:你對AI感興趣可以追溯到什么時候?
李想:追溯到這一次創(chuàng)業(yè)開始。我意識到了一件很重要的事:如何用全新技術(shù)改變物理世界發(fā)生的一切。
我們做汽車之家,在線上我們成了全球最大的汽車網(wǎng)站。但是,汽車之家有很多遺憾,比如汽車電商類業(yè)務(wù)一直沒有成功。我們想改造汽車產(chǎn)業(yè)物理鏈路,涵蓋一輛車的制造、倉儲、庫存、物流到體驗環(huán)節(jié)。但最后我們發(fā)現(xiàn):除了在線上多花一份錢,并沒有對物理世界產(chǎn)生有效改造。所以,我做理想汽車很重要的一點是,必須借助最新技術(shù)對物理世界進行改造。
張小珺:你是想做一家人工智能企業(yè),還是想通過人工智能賦能電動車?
李想:汽車是物理世界人工智能最大的應(yīng)用。如果看清楚這一點,我們應(yīng)該是一家人工智能企業(yè)。團隊總問我,我們的LOGO后邊寫“理想”還是“理想汽車”?我們用“理想汽車”來表述,是為了方便跟外界溝通和宣傳,但LOGO從來沒把“汽車”加上去。
張小珺:但你也可以說,你要做的是一個人工智能技術(shù)驅(qū)動的電動車企業(yè),或一個擁有人工智能技術(shù)的自動駕駛企業(yè),為什么一定要是人工智能企業(yè)?本質(zhì)區(qū)別是什么?
李想:其實,做汽車之家有我一生中最大的遺憾。汽車之家是我第二次創(chuàng)業(yè)。
第一次創(chuàng)業(yè)時,我創(chuàng)辦的泡泡網(wǎng)趕上了PC互聯(lián)網(wǎng)時代,那時我還不懂什么是創(chuàng)業(yè),剛高中畢業(yè)就開始做這個網(wǎng)站,錯失了很多好的機會。
但做汽車之家,我非??粗衅囘@一新興行業(yè)。我們早期做過分析,當(dāng)時中國一年只能賣200萬~300萬輛車,到如今一年賣接近3 000萬輛車。同時,汽車之家發(fā)展成功一個很重要的因素是,我們率先做了移動互聯(lián)網(wǎng)的應(yīng)用和業(yè)務(wù)。我們做了幾乎全世界最早的Wap網(wǎng)站,Windows Mobile版、iOS版和安卓版,抓住了移動互聯(lián)網(wǎng)窗口期。很長一段時間里,你觀察身邊的朋友尤其是男性朋友,看車、買車都離不開汽車之家。
然而,2013年汽車之家IPO,2015年我決定離開汽車之家時,有一個非常大的遺憾。其實早在2009年,汽車網(wǎng)站的競爭就結(jié)束了,后面幾年我們過得挺輕松的。我還有很多的能量,團隊也還有很多的能量,但我們在移動互聯(lián)網(wǎng)時代選了一個非常垂直的領(lǐng)域,雖然你做得很好,但某種程度你可能為了一棵樹,錯過了一整片森林—這是我最大的遺憾。
所以,選擇第三次創(chuàng)業(yè)很重要的一點是:我要選擇一片森林,要做這片森林里最大的。
無論多么難,無論需要經(jīng)歷什么樣的困難,我絕對不止做一棵樹了。
張小珺:你是覺得把它叫人工智能企業(yè),是一個更大的故事、更大的夢想?
李想:不是更大的故事,如果你知道我們到底在做什么,你就會相信這一點。我們一年上百億元研發(fā)投入,有接近一半都投給了人工智能。我們是全世界第一個做基座模型(的車企);端到端架構(gòu)和VLM(視覺語言模型),從最開始的論文到技術(shù)研究,再到最后的研發(fā)和產(chǎn)品交付,也是全世界最早做出來的。
我們不僅在做智能駕駛,還有理想同學(xué)、智能商業(yè)和智能工業(yè)。
只是人工智能如果還是原來的規(guī)則算法、知識圖譜,大家覺得沒什么希望。雖然大家相信人工智能,但技術(shù)是錯配的,它用了并不是真正符合人工智能的方式。但這都是有意義的進展,就像我們可能吃到第8個包子就飽了,但前面每個包子都有價值。正是由于一層一層地遞進,才出現(xiàn)了今天人工智能相對繁榮的景象。
張小珺:你從創(chuàng)辦理想的第一天就想好要做一家AI公司,你確定當(dāng)時是這么想的嗎?剛創(chuàng)業(yè)就覺得人工智能時代要來了?
李想:我覺得是一種感覺,我們最開始也
沒有把它當(dāng)成傳統(tǒng)汽車來做。為什么理想ONE只有一個車型?是因為我把它本身看成是一個數(shù)據(jù)和軟件的集成。
張小珺:喬布斯說“如果硬件是產(chǎn)品的大腦和肌肉,軟件就是靈魂”,你表達的也是這個意思嗎?
李想:當(dāng)然。我最開始創(chuàng)業(yè)時,投資人經(jīng)常問我一個特別有意思的話題:憑什么是你?為什么你能做出來?那時我們還沒有產(chǎn)品出來。
我當(dāng)時講了一個觀點,我說:我會比傳統(tǒng)汽車企業(yè)更懂怎么做互聯(lián)網(wǎng)和大型軟件,我會比互聯(lián)網(wǎng)和大型軟件公司更了解怎么制造一輛車。
張小珺:有人去年問了一些理想員工:你相信理想是一家人工智能企業(yè)嗎?他們都說不相信。既然不能讓員工相信,又怎么讓更多的人相信?
李想:當(dāng)技術(shù)變更時,不相信是很正常的。
我們做增程的時候,如果你去問我們的員工,這輛車的成功率有多少?銷量有多少?當(dāng)時我們員工填的最多的是:一個月能賣1 500輛。很多員工認為一個月只能賣幾百輛,因為大家并沒有體驗過新技術(shù),沒有看到這個技術(shù)所帶來的價值。
這可能是創(chuàng)業(yè)者的不同:你會相信那些看著不是那么明白、不是那么清晰的事。
張小珺:所以,AI對理想意味著什么?
李想:意味著未來的全部。
2.“大家再不承認,我也不知道該怎么形容了”
張小珺:你第一次用ChatGPT是什么時候?感受是怎樣的?
李想:它發(fā)布時我們就去用了,最大的感覺是人工智能應(yīng)該有的樣子就是這樣。我認為OpenAI是一家非常了不起的公司,它了不起的程度甚至超越了當(dāng)年谷歌之于互聯(lián)網(wǎng)時代的了不起的程度。
張小珺:為什么這么說?OpenAI未來會長成什么樣?會超越谷歌嗎?
李想:我覺得基本是確定的。
我看一家公司不會單獨從技術(shù)看。第一,我會看這家公司對行業(yè)標(biāo)準(zhǔn)的定義,這是最重要的,谷歌當(dāng)年在搜索上定義了很多行業(yè)標(biāo)準(zhǔn);第二,看它的研究工作做得怎么樣;第三,看它的技術(shù)研發(fā)工作做得怎么樣;第四,看產(chǎn)品化;第五,看商業(yè)化能力,商業(yè)化能力要分階段,今天它一定要獲取多少收入其實沒那么重要。
從這五個維度綜合來看,它是一家遙遙領(lǐng)先的人工智能企業(yè)。
張小珺:在你看來,OpenAI一定會成為下一個入口嗎?
李想:就拿數(shù)據(jù)來看,OpenAI在這些人工智能聊天產(chǎn)品里,基本占了全球市場80%的份額。最新數(shù)據(jù),OpenAI1個月有36億訪問量,相差最近的Gemini訪問量應(yīng)該是2億~3億。這個如果大家再不承認,我也不知道該怎么形容了。
張小珺:如果讓你做OpenAI的CEO,你會比Sam Altman(薩姆·奧爾特曼)做得更好嗎?
李想:不會。我覺得Sam Altman做得非常成功。
張小珺:如果你是OpenAI的CEO,你現(xiàn)在會做什么?
李想:最大的一個挑戰(zhàn)是,今天還處在OpenAI定義的AGI L1階段:聊天機器人;L2階段是他們近期在推廣宣傳的推理者階段;大家相信,2025年最重要的是跑在頭部的企業(yè)能某種程度實現(xiàn)L3階段:Agents(智能體)。
張小珺:是OpenAI定義的L1階段?
李想:對。L2階段(推理者)針對的不是普通用戶,OpenAI的Pro版本賣到了200美元,核心用戶要么是企業(yè)客戶,要么是專業(yè)用戶。
到L3 Agents階段,才是真正的“iPhone 4時刻”,普通老百姓都能用了。而且它能獨立、持續(xù)地完成任務(wù),不用靠密集提示詞的方式。這時的產(chǎn)品應(yīng)該是個什么交互方式,這是所有頭部企業(yè)都應(yīng)該認真思考的。
張小珺:Agents會在三年內(nèi)實現(xiàn)嗎?
李想:中國具備足夠能力的Agents,我認為在三年之內(nèi)應(yīng)該會實現(xiàn)。
3.基座模型是操作系統(tǒng)+語言
張小珺:我們來談?wù)勀銈兊膬煽預(yù)I產(chǎn)品,一個是理想同學(xué),它是一個個人助手;一個是智能汽車。
理想同學(xué)以前是一個車機的個人助手,但它現(xiàn)在要“走”出車門,進入手機變成一個App,未來還會上更多終端。這意味著,你們作為一家電動車企業(yè)要進入通用個人助手這場紅海戰(zhàn)役了,要去跟豆包、Kimi、ChatGPT競爭了,是這樣嗎?
李想:如果我們是一家純硬件公司,符合你說的定義。但蘋果不是一家只賣Mac的公司,正因如此才有了后面的可能性,這個可能性不是iPhone出來后發(fā)生的,而是在Mac變成透明殼那一刻就發(fā)生的;華為不只是一家運營商企業(yè),后面的一切是它從運營商發(fā)展到相對穩(wěn)定階段開始產(chǎn)生的;小米也不只是一家手機企業(yè),它有IoT(物聯(lián)網(wǎng)),有自己的生態(tài),甚至有汽車。
今天這些企業(yè),不能單純以一個硬件來定義它到底是一家什么企業(yè)。這個硬件是它的支柱業(yè)務(wù),是起點。今天每一家企業(yè),都應(yīng)該是一家人工智能企業(yè)。
我們之所以做硬件,是為了更好地控制硬件體系以及提升性能。但大型軟件不一樣,不是所有人都能做操作系統(tǒng),不是所有人都能做大型云服務(wù),這是更大的挑戰(zhàn)。
回到人工智能也一樣,今天你能看到幾百家電動車企業(yè),是因為中國有非常完善的供應(yīng)鏈,但這幾百家企業(yè)未來有哪些企業(yè)能做基座模型?
張小珺:你認為,基座模型是一道分水嶺?
李想:當(dāng)然。我們一直在做基座模型,無論多么難,我們的態(tài)度都非常堅定。
我認為,基座模型是人工智能時代的操作系統(tǒng)+編程語言,這樣你就知道它有多重要了。
基座模型所構(gòu)建的人工智能超級產(chǎn)品,會是新一代入口—它會在所有設(shè)備之上,在所有服務(wù)之上。
張小珺:理想同學(xué)+Mind GPT(理想自研大模型)約等于Kimi,可以這么理解嗎?
李想:可以這么形容。
張小珺:理想同學(xué)從車機進入手機,這是一個戰(zhàn)略級決定還是你們只是想試試看?
李想:沒那么復(fù)雜。從長期來看,一個有效的大模型產(chǎn)品,尤其是在掌握基座技術(shù)的前提下,會凌駕于所有設(shè)備和服務(wù)之上,這是我相信的一點,否則它就不是人工智能。未來發(fā)展到智能體,它將能自主調(diào)用所有設(shè)備、服務(wù)。
從當(dāng)下來看,我們很多的用戶和孩子,一上來接觸的人工智能就是“理想同學(xué)”。自然地,我為什么不把這個東西也同樣放到他們?nèi)粘J褂玫脑O(shè)備上?很多用戶的孩子在使用完車內(nèi)的“理想同學(xué)”后,拿著手機也會喊它,這就是真實需求。
我們可不可以先讓100多萬用戶及其家庭(約300萬~500萬人),在車、手機、電腦上,甚至以后還可能出現(xiàn)在眼鏡上,用上一個非常好的、體驗一致的人工智能產(chǎn)品?這是必須要做的。
張小珺:理想同學(xué)會存在用戶數(shù)據(jù)收集、用戶隱私問題嗎?
李想:不會。我們并不需要這些東西,比如預(yù)訓(xùn)練更多是從公開數(shù)據(jù)集收集數(shù)據(jù)。如果未來要讓用戶使用得更好,會建立記憶系統(tǒng),但記憶系統(tǒng)會把用戶的記憶轉(zhuǎn)成token。它既不是比特,也不是傳統(tǒng)文字或聲音記載,大家完全不用擔(dān)心。
大家今天擔(dān)心人工智能的隱私問題,還是因為對人工智能技術(shù)本身不夠了解。
4.L4就是智能體
張小珺:在我腦子里,理想同學(xué)作為個人助手和汽車的智能駕駛是兩件事—這是兩個產(chǎn)品,支持它們的是兩種技術(shù)架構(gòu)。為什么我感覺在你腦子里,它們是一件事?
李想:由于這兩個領(lǐng)域同時都在做,讓我們看到了一個更有意思、讓我們更堅定去做的機會。
今天我們做的理想同學(xué)和自動駕駛,按行業(yè)標(biāo)準(zhǔn)來看是分割開的,還處于早期階段:我們在做的Mind GPT(理想自研大模型),大家稱其為LLM(大語言模型),其實它叫語言智能;我們在做的自動駕駛,李飛飛定義其為空間智能,我們內(nèi)部叫行為智能。
只有你真正深入這個領(lǐng)域大規(guī)模做,才知道這兩個有一天一定會連接在一起—如果一個人只有語言智能,他足夠聰明,但不能行動;如果一個人只有行為智能或空間智能,其能力水平相當(dāng)于基礎(chǔ)工種(局限在機械作業(yè)層面)。
我們認為,基座模型到一定時刻一定會變成VLA。因為語言模型也要看三維世界,也要通過語言、認知理解三維世界,三維世界不只有圖片。
自動駕駛也是一樣,它要真正變得更強走向L4,就要有極強的認知能力。
所以,我對團隊的一個要求是:至少在中國范圍內(nèi),未來幾年必須保證大語言模型的基座模型做到行業(yè)前三。你需要什么樣的訓(xùn)練算力,我們愿意投資。要真正跟頭部企業(yè)去競爭,把能力構(gòu)建起來,而不只是在汽車行業(yè)里比一比。
張小珺:智能駕駛能怎么幫助大語言模型?
李想:智能駕駛所獲得的數(shù)據(jù)可以為語言模型或下一步基座模型,構(gòu)建三維向量空間的能力。
舉個例子,我們在VLM的使用中也會遇到一些問題。今天的VLM是從大語言模型基礎(chǔ)上做出來的,雖然做VLM基座模型也會“喂”幾億甚至幾十億張圖片,但這些圖片是二維的。在三維向量空間里,比如自動駕駛,它可以通過畫面看到:哪里是公交車道,公交車道提示是什么,什么是潮汐車道,甚至能認出交警以及這個交警在干什么,但它并不知道具體位置。
這是因為端到端的基座和VLM基座是兩個不同的基座,它倆只能互動,不能通過端到端確定位置。這也是我們看到:最終,它應(yīng)該像人類一樣,一套大腦系統(tǒng)既能處理語言,也能處理圖像,且在處理圖像時,人具備三維向量空間的能力,能調(diào)用自己的行動。
接下來也能看到我們的一些論文—如何用三維向量空間,包括用高斯球方式,給語言模型打造三維向量空間的能力。
張小珺:它最終會合并統(tǒng)一到Mind GPT基座模型上?
李想:到時候是不是叫Mind GPT還不一定,但我們肯定會往語言模型放三維向量token,現(xiàn)在已經(jīng)開始嘗試做預(yù)訓(xùn)練。
5.終級產(chǎn)品想象是“硅基家人”
張小珺:很多人說你是超級產(chǎn)品經(jīng)理,能不能從產(chǎn)品的角度講一講,隨著人工智能的能力從L1到L5(按照OpenAI定義標(biāo)準(zhǔn))演進,你對產(chǎn)品是如何構(gòu)想的?今天我們看到的還是一個非?;A(chǔ)的對話App,以后呢?
李想:產(chǎn)品是把用戶需求和你背后所有能力進行結(jié)合。好的產(chǎn)品經(jīng)理,要對需求了解得足夠清楚,且對自身能力足夠了解—這兩個交集越大,產(chǎn)品價值越高;交集越小,產(chǎn)品價值越低,或者浪費越多,內(nèi)耗就越多。
關(guān)于AGI的最終實現(xiàn),我通常將其劃分為三個階段:
第一階段叫“增強我的能力”。增強我的能力意味著它是我的一個輔助,但最終決策權(quán)在我這。比如,我可以使用理想同學(xué)生成一篇文章,但文章不會直接發(fā)布,還需要進行文字整理。包括L3級智能駕駛,我們叫“有監(jiān)督的智能駕駛”,還需要人在車上監(jiān)督并對此負責(zé)。反映的核心是,這一階段能力還不夠。
張小珺:所以在這個階段負責(zé)任的是人。
李想:對。如果你能特別好地使用人工智能,它確實能讓我們的工作和生活變得更方便、更高效。隨著它能力的提升,隨著人類對它信任的加深,到第二個階段,就是智能體所描述的階段。
第二階段叫“成為我的助手”。給它發(fā)任務(wù),甚至連續(xù)發(fā)任務(wù),它可以獨立完成,并對結(jié)果承擔(dān)責(zé)任。
比如,我可以對一輛L4級自動駕駛車發(fā)出指令:你去幫我接孩子。我不需要坐在車上,它就可以到學(xué)校幫我接孩子,并進行面部識別,打開車門讓孩子上車,然后再完成下一個任務(wù),如送孩子學(xué)游泳等。它也可以幫我做上周工作總結(jié),并發(fā)給我所有下一層管理者。這屬于第二個階段。
在這個階段比較好的是,它會形成大規(guī)模應(yīng)用,是真正的“iPhone 4”階段。而汽車企業(yè)只有實現(xiàn)了L4(按自動駕駛行業(yè)標(biāo)準(zhǔn)),才是真正的“iPhone 4”階段,今天還不是。
第三階段是我想的終極階段,因為我們要“創(chuàng)造移動的家,創(chuàng)造幸福的家”,我在內(nèi)部叫它“硅基家人”。
我不需要再給它任何指示,也不需要分配任務(wù),它就是家庭成員,甚至是家庭中重要的組織者。它不但了解我,還了解我的孩子,了解我身邊的朋友,甚至比我還了解他們。它記錄下的是事實,而我很多時候記錄的是一種感覺和一些被壓縮的記憶。這時它會主動干很多事,可以自主幫我把家管理好。
很重要的一點是,我的記憶會因它得以延續(xù),可能我的肉體不存在了,但我的記憶會變成它的一部分。我的后代想了解我很容易,和它聊天就像和我聊天一樣,沒有區(qū)別。
張小珺:那你也沒有隱私了。
李想:我是它的一部分了。如果按照OpenAI的定義,AGI本身是組織者,它不止有能力,還有智慧—它會是人類優(yōu)質(zhì)智慧的匯集,而不只是人類知識和能力的匯集。
張小珺:在產(chǎn)品形態(tài)上,“硅基家人”是你腦海中構(gòu)想的最終產(chǎn)品嗎?
李想:對。讓我最興奮的是,我和我們團隊能在有生之年實現(xiàn)第三階段,我希望是通過我們的手來實現(xiàn)。即使最終由于各種遺憾我們未能實現(xiàn),也希望看到有頂尖企業(yè)在我們有生之年實現(xiàn)這個階段。
6.人工智能表達的是能力,不是功能
張小珺:這類(對話類)產(chǎn)品已經(jīng)高度同質(zhì)化,你們的優(yōu)勢是什么?
李想:今天還不能講同質(zhì)化,真正面向消費者大規(guī)模普及的關(guān)鍵節(jié)點,是在智能體實現(xiàn)的階段。今天大家都還有機會。
就理想汽車而言,分三個維度講:
1.相比一般創(chuàng)業(yè)公司,我們有100萬家庭用戶的基礎(chǔ),有啟動量。
2.在大語言模型產(chǎn)品和基座方面,我們是跟隨者,但跟隨要有目標(biāo):從十名開外怎么先進入前五,從前五怎么進入前三。這也是我們后邊要設(shè)定目標(biāo),以及和最好、最優(yōu)秀的選手進行對比的有效工作方式,并按照這樣的目標(biāo)有效投入。
3.在空間方面,包括端到端,今天大家聽到各種各樣做機器人、具身智能的公司講“系統(tǒng)一”“系統(tǒng)二”,大家可以回頭看一看這些論文,最早是我們自動駕駛研究團隊做的。所以,在空間智能或行為智能方面,我們對自己的要求是必須保持第一。
張小珺:你剛才提到產(chǎn)品就是要技術(shù)能力匹配產(chǎn)品需求,你今天是對產(chǎn)品需求認知更深,還是對技術(shù)能力認知更深?
李想:我覺得(與過去)不太一樣了。大模型到來以前的階段,我們通過編程甚至規(guī)則算法做硬件—本質(zhì)上我們提供的是具備“體驗”的“功能”。
所以,這時候企業(yè)競爭的核心是,你提供什么樣的“功能”,以及這個“功能”帶來的“體驗”,再加上“品牌”。無論是互聯(lián)網(wǎng)產(chǎn)品、硬件產(chǎn)品,還是智能硬件產(chǎn)品,既提供軟件功能,又提供硬件功能——這是這個時代的競爭特點。
“功能”比較好理解,其最主要的獲取方式來自“體驗”。無論是通過購買產(chǎn)品,還是供應(yīng)商展示,或者自己研發(fā),都可以通過體驗判斷功能價值。只要你愿意做,獲得功能和體驗沒那么難。
愿意做“小白鼠”很重要??赡芎芏嗳瞬恢?,我是中國第一批雪佛蘭Volt(通用汽車推出的增程式電動車)車主。那時40多萬元買了一輛車,大家會覺得我是“小白鼠”。但做“小白鼠”有一個好處是,能獲得優(yōu)先選擇權(quán)。我會比沒體驗過Volt的人,更了解增程到底是什么樣,以及那些做得不成功的增程,為什么不成功。你只有體驗,才能獲得這樣的一個認知。所以我說這是“功能的時代”。
但到人工智能時代就不一樣了,人工智能時代是“能力的時代”。
所以,頭部人工智能企業(yè)必須堅持搞研究。研究并不僅限于技術(shù)本身,還需要探索比如它跟人類記憶的關(guān)系,這樣才能對技術(shù)發(fā)展方向進行有效判斷。必須搞研究,然后搞技術(shù)研發(fā),最后產(chǎn)品化,前兩個步驟如果做不好就直接產(chǎn)品化肯定不行。
有點像楊植麟(月之暗面創(chuàng)始人兼CEO)講的那句話:“屎上雕花”。
張小珺:所以,AI時代企業(yè)競爭的維度變了?
李想:對,變了。
張小珺:不可能一家公司不做技術(shù)研究,只做產(chǎn)品?
李想:當(dāng)然取決于你想成為什么樣的AI公司。如果你想做AI細分領(lǐng)域的小應(yīng)用,沒問題;但如果你想做AI助手,想做基座模型,想做L4級自動駕駛,你必須得做技術(shù)研究工作。
張小珺:你怎么看楊植麟所說的“模型即應(yīng)用”?也就是說,好的產(chǎn)品是在模型能力提升過程中“沿途下蛋”。你認可他的這種產(chǎn)品觀嗎?
李想:認可。大家最開始認為OpenAI只是做聊天工具,所以我們可以做搜索。但如今OpenAI也在做搜索,也會進入一個個細分領(lǐng)域。過去我們關(guān)注的是“功能”,現(xiàn)在比拼的是“能力”。能力有了,任何能力所能解決的問題都能實現(xiàn)。
第二節(jié) 談智能駕駛
1.三年推出把方向盤摘掉的產(chǎn)品
張小珺:剛才聊的是理想同學(xué),接下來我們聊一聊你們的另一個產(chǎn)品:智能駕駛。你現(xiàn)在開車會用到輔助駕駛的百分比是多少?
李想:大概80%吧。
張小珺:什么時候可以100%使用自動駕駛?
李想:我自己的目標(biāo)是3年。3年我們就能推出把方向盤摘掉的產(chǎn)品。
張小珺:什么時候能看到理想第一個為自動駕駛L4定義的車?現(xiàn)在已經(jīng)在定義了嗎?
李想:給我3年時間吧。它需要技術(shù)和產(chǎn)品到位,需要環(huán)境和政策到位,也需要消費者對人工智能信任到位。
張小珺:既然你認為AI這么重要,在創(chuàng)業(yè)之初就已經(jīng)決定要做,為什么你們開始智駕是同行里最晚的?
李想:我作為連續(xù)創(chuàng)業(yè)者,最大的優(yōu)勢是了解企業(yè)的發(fā)展節(jié)奏:當(dāng)沒有資金,企業(yè)發(fā)展從0到1,需要先解決什么問題;當(dāng)有了收入,從1到10又需要做什么。這是我跟新進入的創(chuàng)業(yè)者一個根本性的不同。
理想汽車早期融資能力弱,在這種情況下,第一步是想著如何把產(chǎn)品做好。隨著我們獲得市場認可,2020年和2021年分別在美國和香港成功IPO,有了更多的資金。2020年初,我們就開始做技術(shù)的平臺化,比如智能駕駛平臺,也開始做整車域控制器XCU。我們在研發(fā)上有了很大的進步,不再需要過去傳統(tǒng)的供應(yīng)商,我們自己成為幾個關(guān)鍵零部件、車內(nèi)控制器的一級供應(yīng)商。再往后,我們做模型,做電機的碳化硅。
它是一個創(chuàng)業(yè)公司往上成長的歷程。
2.我們相比特斯拉又不缺胳膊少腿
張小珺:在自動駕駛上,你們做了兩個相對激進的決策:第一是用只有一個模型的端到端,其他中國車企可能還在用兩個模型;第二是你們是第一個取消角毫米波雷達的中國車企,走以純視覺為主的技術(shù)路線。這兩個決策當(dāng)時是怎么做的?是你拍的板嗎?
李想:我經(jīng)常跟團隊說:我們相比特斯拉又不缺胳膊少腿,為什么它能做的你做不到?
我們?yōu)槭裁催€保留前面的毫米波雷達以及激光雷達?毫米波雷達、激光雷達和做端到端關(guān)系不大,因為端到端基于純視覺方案。很多人不理解為什么要保留,是不是因為技術(shù)不好?不是,是為了安全。
當(dāng)前的攝像頭在深夜沒有光線的情況下,看到的距離僅約100米,但激光雷達在任何沒有光線的情況下可以看到200米。這就幫助我們實現(xiàn)了130公里時速下的AEB(自動緊急制動系統(tǒng))性能。我們做的是面向家庭的車,每個人的生命安全都至關(guān)重要。
這也是我們繼續(xù)保留激光雷達的根本原因所在,后面的車型也會持續(xù)保留——激光雷達相當(dāng)于“安全帶”,幫車主避免重大事故。
激光雷達和視覺的配合,在安全上有兩個作用:一方面,減少重大傷亡事故的發(fā)生;另一方面,提升其他交通參與者(如使用滑板車、平衡車者,或道路醉酒人員)的安全,更好的傳感器能夠提升安全性。
張小珺:剛才說到那兩個你相對激進的決定,為什么其他中國車企沒有馬上這么做?
李想:這可能跟我們有一些比較好的外腦有關(guān),比如王興、陸奇博士,他們給我們帶來了很多啟發(fā)。
比 如,用 規(guī) 則 算 法、靠 解 決 極 端 情 況(corner case)的方法能不能解決自動駕駛?解決不了。它不一定能真正解決問題,但能提供一些新視角。我說服郎博(理想汽車智能駕駛研發(fā)副總裁郎咸朋)的關(guān)鍵一點是:你們常常解決了一個極端情況,又出現(xiàn)三個新問題—因為你們只是基于特定場景去解決這個極端情況,一旦場景變化,又會出現(xiàn)新的極端情況。如此,你們永遠都在解決極端情況,解決不完。
在一次戰(zhàn)略會議上,陸奇博士告訴我們:
你們應(yīng)該思考一下人是怎么工作的。這對我們幫助很大。重要的是解決你的能力問題,而不是解決極端情況。端到端最后體現(xiàn)的是整體能力,而不是去解決功能、解決極端情況。
張小珺:在你看來,端到端是自動駕駛的終極解決方案嗎?
李想:端到端只能實現(xiàn)L3級別,肯定達不到L4。
張小珺:L4需要VLA(視覺語言動作模型)?
李想:對,L4必須采用VLA。端到端結(jié)合VLM可以實現(xiàn)L3—比如做到500~1 000公里一次接管,讓你駕駛相對輕松。但要達到L4,現(xiàn)有的泛化能力還遠遠不夠。
3.L4實現(xiàn),買車的人會更多
張小珺:你們會像馬斯克一樣做Robotaxi(無人駕駛出租車)嗎?
李想:我不想做。我們的使命是“創(chuàng)造移動的家,創(chuàng)造幸福的家”。“移動的家”最終是實現(xiàn)L4級自動駕駛,而“幸福的家”的終極形態(tài)是“硅基家人”。
張小珺:會不會Robotaxi到來以后,就沒人開車了?
李想:今天租房比買房便宜得多,但很多人仍然選擇買房。我們?yōu)槭裁匆I房、構(gòu)建家庭?因為我們需要高質(zhì)量的陪伴,我們需要為家人創(chuàng)造穩(wěn)定、安全、舒適的環(huán)境。車也一樣—實現(xiàn)L4級自動駕駛后,家庭用車的使用成本更低。我相信,屆時愿意擁有一輛車的人會更多。
可 能 5 年 、1 0 年 后 大 家 再 來 看,到 底Robotaxi是主流,還是更多人擁有了一輛自動駕駛的車—它不僅使用率高,還能為家人、朋友使用。我相信,當(dāng)一個移動空間能夠提供更高的使用效率、更優(yōu)質(zhì)的體驗,我更愿意選擇擁有它。
張小珺:你怎么看待特斯拉和Waymo(谷歌母公司Alphabet旗下的自動駕駛汽車公司)的路線之爭?做L4的派系(如Waymo)會說,你們L2級輔助駕駛做得越好,就離L4級自動駕駛越遠。
李想:L2級自動駕駛主要依賴規(guī)則算法,也有通過規(guī)則算法直接做L4的,但僅限特定場景;L3的實現(xiàn)則來自端到端架構(gòu)。事實上,很多過去做L4的公司也一定在做端到端,在端到端的基礎(chǔ)上再做一些迭代創(chuàng)新。但我相信,要實現(xiàn)真正具備廣泛性、通用性而不是特定區(qū)域的L4,VLA是必然選擇。
我相信,Waymo、特斯拉最終也會采用VLA。所有想實現(xiàn)L4級自動駕駛的企業(yè),可能都會選擇VLA,或者比VLA更好的方式。這就像如今大家(AI公司)都在使用Transformer和大語言模型一樣。
第三節(jié) 談汽車之戰(zhàn)
1.今天做的所有事,是為了拿L4的門票
張小珺:純電這場仗,接下來準(zhǔn)備怎么打?
李想:其實沒什么絕招。關(guān)鍵在于,在這個價格區(qū)間內(nèi),在用戶最在意的一些價值上,你是不是做到了天花板?這是一場綜合實力之戰(zhàn),是從技術(shù)到產(chǎn)品,再到商業(yè)化的一個完整作戰(zhàn)體系。
張小珺:電動車這場仗什么時候能分出勝負手?現(xiàn)在中國汽車行業(yè)仍然非常“卷”。
李想:電動化和智能化是兩場仗。電動化相當(dāng)于沒有資源的企業(yè)的一張門票。
電動車最終將通過L4分出真正的勝負。我們今天在做的所有事都是為了拿到L4的門票,因為實現(xiàn)L4所需要花的錢、所需要擁有的能力、所需要的數(shù)據(jù)量是今天不具備的。今天大家要靠這個去拿L4的門票。
張小珺:拿到L4門票的先決條件是什么?
李想:第一,有足夠多的車跑在路上—500萬輛以上。
第二,要有掌握VLA基座模型的能力。
第三,要有足夠多的資金,招募最頂尖的人才,擁有足夠的算力。
張小珺:當(dāng)都滿足了這些條件,且做到足夠卓越,能做出一家像蘋果這樣的公司嗎?
李想:一定會的。
張小珺:所以,你認為這場仗什么時候能打贏?
李想:并不存在打贏不打贏。汽車企業(yè)發(fā)展這么多年,與傳統(tǒng)汽車廠的競爭結(jié)束了,又出現(xiàn)了很多外來者。最開始大家看到,新勢力、特斯拉跟傳統(tǒng)汽車競爭,后來華為進來了,再后來小米也進來了。大家會發(fā)現(xiàn)這個競爭發(fā)生了新的變化—這就是世界的精彩和豐富之處。
張小珺:為什么蘋果現(xiàn)階段放棄造車?
李想:有兩個挑戰(zhàn):
第一個挑戰(zhàn)是,如果做汽車,蘋果組織模式必須發(fā)生變化,因為汽車比手機更復(fù)雜。但是,由于蘋果公司過去的治理模式已經(jīng)很完善了,這時候要產(chǎn)生變化,如果沒有特別明確、清晰的愿景,或強大的吸引力,很難說服蘋果內(nèi)部的人改變現(xiàn)有的組織和工作方式。
當(dāng)蘋果決定放棄造車時,特斯拉市值為幾千億美元,而蘋果已突破兩萬億美元。這種情況下,公司內(nèi)部難免質(zhì)疑:作為一家市值兩萬億美元的公司,為何要去效仿一個市值幾千億美元,且估值被高估的公司。這對于蘋果這樣成功的公司而言,是巨大的挑戰(zhàn)。
第二個挑戰(zhàn)是,人工智能的發(fā)展也讓蘋果陷入了戰(zhàn)略遲疑。蘋果的核心價值觀里,對隱私格外在意。在傳統(tǒng)AI階段,基于規(guī)則算法和知識圖譜的技術(shù)可能涉及隱私數(shù)據(jù);但進入大模型階段,數(shù)據(jù)被轉(zhuǎn)化為token化的信息單元,不僅隱私問題被解決了,相反它還提供了隱私保護最好的方式。
這些頂尖企業(yè)匯聚了一幫優(yōu)秀人才,當(dāng)他們理解并擁抱AI時,其進步速度可能比大家想象的要快得多。
2.2030年,我們有概率做一輛超級跑車
張小珺:你為什么買法拉利?它既不AI,又不自動駕駛。
李想:體驗對我來說很重要,體驗就像是我做預(yù)訓(xùn)練的一部分。
今天大家之所以看到L9是面向家庭最好的六座產(chǎn)品,很重要的一點是:我長期是寶馬X7、奔馳GLS和特斯拉Model X的用戶,這些體驗不可替代。
買法拉利的一個重要原因是,我身邊很多朋友包括股東,都對理想汽車提出了下一階段的挑戰(zhàn):品牌如何實現(xiàn)升級?在品牌層面,我向很多人請教、學(xué)習(xí)。汽車行業(yè)里的優(yōu)秀品牌,我個人最欣賞的一個是寶馬,一個就是法拉利。
法拉利我還沒有體驗過,只有親身體驗,才能轉(zhuǎn)化為自身真正的認知和能力。
張小珺:300萬元用來買訓(xùn)練大模型用的卡不好嗎?
李想:這不沖突。做好產(chǎn)品功能和用戶體驗,提升技術(shù)能力和訓(xùn)練水平,打造更好的品牌,為用戶提供更優(yōu)質(zhì)的陪伴和情緒價值,這些都不沖突。
張小珺:“理想同學(xué)”會上法拉利嗎?
李想:如果是在買法拉利之前,我會說“永遠不會”;但買了以后,這個想法有了可能性。我能想象當(dāng)實現(xiàn)了L4級自動駕駛,大家會把車做成方盒子造型。到那時,市場上各種各樣的方盒子車型出現(xiàn),里面有非常好的空間。
那誰來滿足駕駛樂趣?如果擁有一輛想自動駕駛就自動駕駛、想自己開就自己開的車,同時具備頂尖的人工智能—這樣的產(chǎn)品為什么不可以?科幻電影里早就有這樣的場景。
我今天的一個想法是,可能到2030年,我們甚至有50%的概率會做一輛非常有趣的超級跑車,不過它一定是人工智能的。
張小珺:在你看來,法拉利這樣的車企應(yīng)該擁抱AI嗎?
李想:可能跟很多人想象的不一樣,法拉利在CarPlay(蘋果公司發(fā)布的車載系統(tǒng))的應(yīng)用上做得非常好,包括CarPlay里面的交互和連接關(guān)系,甚至比許多普通企業(yè)做得要好。
但歐洲奢侈品品牌,最重要的還是延續(xù)稀有和設(shè)計,這個價值是它獨有的。哪怕到了下一個時代,法拉利也還是應(yīng)該變成一個更好的法拉利,而不是變成一家科技企業(yè)。不過科技企業(yè)里可能會出現(xiàn)一些有意思的車型。
第四節(jié) 消失的李想
只要所有的中國企業(yè)不放棄
張小珺:你的一個00后員工想問你,在當(dāng)前復(fù)雜的地緣政治環(huán)境下,怎么成為一家全球領(lǐng)先的人工智能企業(yè)?
李想:作為創(chuàng)業(yè)者,很重要一點是看不同階段。今天哪怕我們做汽車不涉及人工智能,也沒辦法講我們會成為全球領(lǐng)先的汽車企業(yè)。
我們得先在中國市場做到第一,然后下一步在受美國限制以外的市場能不能做成第一?人工智能也一樣。
我給團隊提出的要求是,明年的目標(biāo)是在中國的空間智能領(lǐng)域能不能做到第一?在大語言模型方面以及它所提供的服務(wù)方面能不能進入行業(yè)前三?團隊據(jù)此制定目標(biāo)、構(gòu)建能力以及確定組織和投資,這是最重要的,節(jié)奏非常重要。
再往后我們看到的機會是,如何把語言模型和空間合成更大的VLA模型—去解決到AGI第三階段的Agent,以及到L4級自動駕駛階段應(yīng)具備的能力問題。站在今天還要看,我們做什么樣的研究,匹配什么樣的組織,怎么提前去準(zhǔn)備一些投資。
它是一個成長的過程,不是直達的過程。
張小珺:如果要變成一家人工智能企業(yè),理想汽車未來還會叫理想汽車嗎?
李想:理想是一家人工智能企業(yè),我們要做的不是汽車的智能化,而是人工智能的汽車化,并推動人工智能普惠到每一個家庭。我們通過人工智能將物理世界和數(shù)字世界進行融合,讓有限的空間實現(xiàn)無限的延伸。
張小珺:中國企業(yè)能成為全球領(lǐng)先的AI企業(yè)嗎?
李想:只要所有的中國企業(yè)不放棄,一切皆有可能。
1990年代之前,最好的處理器都是日本企業(yè)推出的,后來美國企業(yè)獲得了領(lǐng)先。過去,我們認為全世界最好的汽車是德國人制造的,但今天,中國企業(yè)和特斯拉提供了全世界最好的智能汽車。人工智能方面也一樣,只要我們不放棄,所有的人每天努力,把所有的心思和精力用在去改變這些能力上面,去投入,結(jié)果一定會變得非常好。
張小珺:如果理想沒有成功地成為全球領(lǐng)先的人工智能企業(yè),會是因為什么?
李想:一定是剛才講的幾個綜合能力我們有缺失,包含研究能力、技術(shù)研發(fā)能力、產(chǎn)品和商業(yè)能力,也包含我們自身的造血能力,這是綜合體現(xiàn)。這是一個非常大的挑戰(zhàn)。
我會全力以赴,確保我們有能力成為全球領(lǐng)先的人工智能企業(yè),做好每一個環(huán)節(jié)。但如果在我有生之年沒辦法實現(xiàn),或者我們因為犯了巨大錯誤沒法實現(xiàn),我也非常樂于看到其他中國頂尖企業(yè)能夠在人工智能方面做得非常好,實現(xiàn)人工智能的第五個階段。
我愿意看到這樣的事發(fā)生,也愿意為這樣的企業(yè)而鼓掌。
評論
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最愛