亚洲中文无码mv在线观看_日本中文字幕视频在线看_亚洲无码 一区二区三区_国产精品一区无码麻豆

趙福全對(duì)話安筱鵬(2/5):專業(yè)模型必須基于大模型構(gòu)建
2024-10-24 關(guān)鍵詞:大模型構(gòu)建 點(diǎn)擊量:65

【核心觀點(diǎn)】

AI賦能:當(dāng)前AI大模型正在產(chǎn)品力和生產(chǎn)力兩個(gè)方向上并行發(fā)力,盡管總體上還處于探索階段,但是已經(jīng)讓我們看到了各種各樣的可能性。

代替腦力:過(guò)去的機(jī)器人、數(shù)控機(jī)床、工業(yè)軟件等技術(shù),更多地是提高了體力勞動(dòng)者的效率;而本輪AI大模型帶來(lái)的這場(chǎng)決策革命,可以為設(shè)計(jì)、開(kāi)發(fā)、工藝以及管理等人員提供支撐,從而提高了腦力勞動(dòng)者的工作效率。

AI母機(jī):人工智能可以類比于傳統(tǒng)制造業(yè)中的工業(yè)母機(jī),而被稱為AI母機(jī)。

專業(yè)模型與基礎(chǔ)模型:如果說(shuō)基礎(chǔ)模型的能力是1,那么行業(yè)垂直模型或者說(shuō)專業(yè)模型就是1后面的0。

大模型市場(chǎng):中國(guó)并沒(méi)有“百模大戰(zhàn)”,甚至沒(méi)有“十模大戰(zhàn)”,不少所謂的大模型并不是真正的大模型。當(dāng)前中國(guó)真正在大語(yǔ)言模型主賽道上的企業(yè)可能只有五六家或者稍多一點(diǎn),這是符合產(chǎn)業(yè)發(fā)展和市場(chǎng)競(jìng)爭(zhēng)規(guī)律的。

專業(yè)模型開(kāi)發(fā):當(dāng)前專業(yè)類模型與大模型相結(jié)合有四種方式,每個(gè)行業(yè)及企業(yè)在面對(duì)特定問(wèn)題時(shí),都可以選擇其中一種方式來(lái)構(gòu)建所需的專業(yè)模型。

多模態(tài)融合:雖然大模型最初主要就是大語(yǔ)言模型,但是目前早已拓展到語(yǔ)音、圖像和動(dòng)作等更多模態(tài)了,甚至已經(jīng)有大模型能夠集成處理不同模態(tài)的信息,并產(chǎn)生相應(yīng)的數(shù)據(jù)訓(xùn)練模型。

互動(dòng)生態(tài):未來(lái)人們使用大模型時(shí)會(huì)形成一個(gè)供給側(cè)與需求側(cè)互動(dòng)的生態(tài)。事實(shí)上,大模型的應(yīng)用一定是一個(gè)多主體聯(lián)動(dòng)的過(guò)程。


【對(duì)話實(shí)錄】


人工智能既可以賦能產(chǎn)品力,更可以賦能創(chuàng)造力


趙福全:安博士剛才講了人工智能對(duì)產(chǎn)品的賦能,可以使其更加強(qiáng)大,從而更好地滿足消費(fèi)者的需求。那么對(duì)于社會(huì)和產(chǎn)業(yè)來(lái)說(shuō),人工智能又將如何賦能呢?前面說(shuō)到,未來(lái)數(shù)字化及人工智能將會(huì)改變生產(chǎn)要素、生產(chǎn)力和生產(chǎn)關(guān)系,我覺(jué)得這實(shí)際上是在對(duì)創(chuàng)造力進(jìn)行賦能。不知道您是怎樣看的?

安筱鵬:趙院長(zhǎng)的觀察非常敏銳,這其中確實(shí)有創(chuàng)造力的提升。這段時(shí)間我們公司內(nèi)部也在討論,人工智能對(duì)于社會(huì)和產(chǎn)業(yè)到底有什么價(jià)值?將會(huì)帶來(lái)怎樣的變化?對(duì)此,我有三個(gè)判斷:第一,一切硬件都會(huì)被AI驅(qū)動(dòng);第二,一切軟件都會(huì)被AI重構(gòu);第三,一切數(shù)據(jù)都會(huì)被AI激活。

我用了“一切”這個(gè)詞,聽(tīng)起來(lái)似乎有點(diǎn)絕對(duì),但我認(rèn)為未來(lái)的趨勢(shì)就是如此。所謂一切硬件,既包括手機(jī)、汽車、工程機(jī)械,也包括攝像頭、屏幕等等,未來(lái)所有這些硬件都會(huì)被AI驅(qū)動(dòng)。例如,在一場(chǎng)有數(shù)百人參加的論壇上安裝幾個(gè)攝像頭,就可以知道現(xiàn)場(chǎng)誰(shuí)聽(tīng)得最認(rèn)真,誰(shuí)總在看手機(jī),甚至還可以知道幾位演講人中誰(shuí)最受歡迎。分析攝像頭采集到的數(shù)據(jù),我們就能得到上述答案。這在今天就已具備實(shí)現(xiàn)的條件了。

事實(shí)上,對(duì)于AI驅(qū)動(dòng)硬件的未來(lái)演進(jìn),我們完全可以有更多的暢想。舉個(gè)例子,今后眼鏡可能也會(huì)裝上攝像頭,并與AI聯(lián)動(dòng),從而發(fā)揮各種作用。比如有的人血糖比較高,眼鏡可以記錄他每天攝入的所有食物,進(jìn)行分析并給出報(bào)告,告訴他今天哪些營(yíng)養(yǎng)偏多、哪些營(yíng)養(yǎng)偏少,同時(shí)給出第二天的飲食建議。

也就是說(shuō),未來(lái)大大小小的各種硬件都會(huì)被AI驅(qū)動(dòng)起來(lái),從而形成新的多種能力;與此同時(shí),一切軟件都會(huì)被AI重構(gòu),從而更好地調(diào)用各種硬件;一切數(shù)據(jù)都會(huì)被AI激活,從而被充分地利用起來(lái)。最終三者共同創(chuàng)造出新的更大的產(chǎn)業(yè)和社會(huì)價(jià)值。

具體來(lái)說(shuō),AI將在兩個(gè)方面發(fā)揮重要作用:一方面是產(chǎn)品本身,AI相當(dāng)于為產(chǎn)品安裝了聰明的“大腦”,當(dāng)這個(gè)“大腦”加載到產(chǎn)品的硬件上,就會(huì)使其實(shí)現(xiàn)智能化升級(jí),這就是產(chǎn)品力;另一方面,AI還將融入到產(chǎn)品設(shè)計(jì)開(kāi)發(fā)、生產(chǎn)制造、供應(yīng)鏈、銷售服務(wù)等各個(gè)環(huán)節(jié),實(shí)現(xiàn)提質(zhì)增效降本,這就是生產(chǎn)力。當(dāng)前AI正在產(chǎn)品力和生產(chǎn)力兩個(gè)方向上并行發(fā)力,盡管總體上還處于探索階段,但是已經(jīng)讓我們看到了各種各樣的可能性。

就生產(chǎn)力而言,大家目前最關(guān)注的是,人工智能究竟能在企業(yè)經(jīng)營(yíng)管理上發(fā)揮什么作用?前面講到,數(shù)字化的本質(zhì)就是通過(guò)數(shù)據(jù)的自動(dòng)流動(dòng),來(lái)化解復(fù)雜系統(tǒng)的不確定性,這其中包含了決策革命。這場(chǎng)決策革命之所以之前不會(huì)發(fā)生,是因?yàn)檫^(guò)去在技術(shù)手段上面臨很多局限。比如軟件編寫(xiě),過(guò)去只能依靠人工來(lái)完成,如果想讓機(jī)器人抓取和加工一個(gè)零部件,要由人來(lái)編寫(xiě)相應(yīng)的工藝軟件,形成一個(gè)代碼堆,而且不同的代碼堆垛還在不斷發(fā)生變化,這就需要大量有經(jīng)驗(yàn)的工程師耗費(fèi)很長(zhǎng)時(shí)間來(lái)編寫(xiě)和維護(hù)軟件。而當(dāng)AI大模型進(jìn)入到產(chǎn)品設(shè)計(jì)和生產(chǎn)等環(huán)節(jié)之后,人工編寫(xiě)軟件的工作就被極度壓縮了,同時(shí)整個(gè)工作流程也被壓縮了。再如汽車設(shè)計(jì),不只是造型設(shè)計(jì),也包括芯片等復(fù)雜部件的設(shè)計(jì),隨著AI大模型的涌入,都會(huì)大幅提高工作效率。

所以,我用一句話來(lái)概括:AI大模型是數(shù)據(jù)要素創(chuàng)造價(jià)值的最短路徑。應(yīng)該說(shuō),此前的各種數(shù)字化技術(shù)仍然在演進(jìn)中,也仍然在發(fā)揮作用;不過(guò)AI大模型這個(gè)新的技術(shù)手段出現(xiàn)之后,將帶來(lái)很多新的革命性變革,從而助力企業(yè)實(shí)現(xiàn)更低成本、更高效率的運(yùn)行。

換一個(gè)角度來(lái)看,過(guò)去的機(jī)器人、數(shù)控機(jī)床、工業(yè)軟件等技術(shù),更多地是提高了體力勞動(dòng)者的效率;而本輪人工智能大模型帶來(lái)的這場(chǎng)決策革命,可以為設(shè)計(jì)、開(kāi)發(fā)、工藝以及管理等人員提供支撐,從而提高了腦力勞動(dòng)者的工作效率,這也是其重要的價(jià)值所在。

趙福全:剛才安博士的回答非常重要?,F(xiàn)在很多人對(duì)人工智能普遍都有一種直觀的理解,就是人工智能技術(shù)可以為產(chǎn)品賦能,這樣同樣的硬件就能比原來(lái)表現(xiàn)得更好或者能力更強(qiáng)。從產(chǎn)品的效果上看,這種理解當(dāng)然沒(méi)有錯(cuò),就像剛剛談到的,人工智能可以顯著地提升產(chǎn)品力。

過(guò)去產(chǎn)品力主要來(lái)自硬件,汽車產(chǎn)品也是以硬件為主導(dǎo)的。汽車企業(yè)要想獲得更強(qiáng)的產(chǎn)品力,就必須持續(xù)進(jìn)行車型改款乃至開(kāi)發(fā)新車型。本質(zhì)上,就是通過(guò)更新硬件來(lái)提升產(chǎn)品力。但是硬件有較高的成本,且其發(fā)展到一定程度之后就越來(lái)越趨于同質(zhì)化了,從而導(dǎo)致產(chǎn)品力受限。而今后產(chǎn)品力將主要來(lái)自軟件,汽車產(chǎn)品也將以軟件為主導(dǎo),此時(shí)情況就完全不同了。尤其是在人工智能的賦能下,軟件的作用將得到充分發(fā)揮,可以有效調(diào)用標(biāo)準(zhǔn)化的各種硬件形成差異化的功能,從而為消費(fèi)者提供滿足其個(gè)性化需求的智能產(chǎn)品。本質(zhì)上,這是通過(guò)更新軟件來(lái)提升產(chǎn)品力的。

不過(guò)一方面,人工智能對(duì)于產(chǎn)品的賦能并不是沒(méi)有代價(jià)的,我們必須開(kāi)發(fā)算法、提高算力、采集數(shù)據(jù),這樣才能使產(chǎn)品硬件上的相同投入獲得更大的產(chǎn)出。另一方面,還有一點(diǎn)更重要,卻往往被忽視了,即人工智能不僅可以賦能產(chǎn)品本身,還可以賦能產(chǎn)品的創(chuàng)造力,也就是剛才安博士講到的生產(chǎn)力。我認(rèn)為,這方面的影響和價(jià)值其實(shí)更大。如果說(shuō)產(chǎn)品是“雞蛋”,那么創(chuàng)造產(chǎn)品的體系就是“母雞”,而人工智能既能讓“雞蛋”變得更好,更能讓“母雞”變得更好。顯然,賦能后者的意義更加深遠(yuǎn)。未來(lái)在人工智能的驅(qū)動(dòng)下,產(chǎn)品創(chuàng)造體系將發(fā)生全方位的根本性改變,包括企業(yè)的組織架構(gòu)、商業(yè)模式,即內(nèi)外部資源優(yōu)化配置的能力,也包括各個(gè)部門(mén)及員工參與產(chǎn)品創(chuàng)造的能力,都將完全不同。由此,“母雞”就能以更優(yōu)的質(zhì)量、更快的速度和更低的成本“孵化”(生產(chǎn))出更多、更好的“雞蛋”。從這個(gè)意義上講,人工智能也可以類比于傳統(tǒng)制造業(yè)中的工業(yè)母機(jī),而被稱為AI母機(jī)。

正是因?yàn)槿斯ぶ悄芸梢酝瑫r(shí)為產(chǎn)品力和創(chuàng)造力賦能,而且這兩方面又相互促進(jìn)、共同作用,所以它將驅(qū)動(dòng)人類社會(huì)的生產(chǎn)、生活方式發(fā)生質(zhì)變,進(jìn)入到一個(gè)全新的使用人工智能來(lái)創(chuàng)造智能產(chǎn)品的智能新時(shí)代。


基于大模型的專業(yè)模型將實(shí)現(xiàn)能力的質(zhì)變躍升


趙福全:這就帶來(lái)了另一個(gè)問(wèn)題。您剛才說(shuō)到,人工智能大模型有望實(shí)現(xiàn)AGI,是一次革命性的突破,而且將會(huì)波及各行各業(yè)。不過(guò)現(xiàn)在對(duì)于大模型的普及應(yīng)用,各方也有一些爭(zhēng)議。核心在于大模型和專業(yè)模型到底是什么關(guān)系?借此機(jī)會(huì),請(qǐng)您為大家澄清一下相關(guān)概念。

安筱鵬:我先講一件事,大約在六年前我曾經(jīng)到美國(guó)調(diào)研工業(yè)互聯(lián)網(wǎng)和智能制造。那次我們?nèi)チ撕芏喙?,其中有一家公司叫約翰迪爾,這是全球最大的工程機(jī)械、農(nóng)用機(jī)械公司,有著近兩百年的歷史。這家公司給我留下了非常深刻的印象:第一,這是我所見(jiàn)過(guò)的最豪華的公司總部,前面有幾百畝的玉米地,玉米地后邊是原始森林;第二,他們并沒(méi)有談工程機(jī)械制造的數(shù)字化,而是講了很多人工智能在工程機(jī)械、農(nóng)用機(jī)械產(chǎn)品中的應(yīng)用,比如農(nóng)用機(jī)械在噴灑除草劑時(shí),怎樣智能化地自動(dòng)區(qū)分苗和草,這實(shí)際上是智能識(shí)別技術(shù)。由此可見(jiàn),各個(gè)行業(yè)專業(yè)化的垂直模型早在多年前就已經(jīng)在應(yīng)用了,而美國(guó)在這個(gè)領(lǐng)域有明顯的優(yōu)勢(shì)。

那么,在大模型到來(lái)的今天,我們?cè)僬劥怪蹦P汀I(yè)模型的時(shí)候,和之前類似約翰迪爾公司使用的模型是不是一回事?或者說(shuō),二者之間有沒(méi)有什么區(qū)別呢?目前,相關(guān)概念確實(shí)有些模糊。

我覺(jué)得,清晰的表達(dá)應(yīng)該是:之前類似約翰迪爾公司使用的模型,其基礎(chǔ)都是ANI弱人工智能模型,這種模型只能完成一個(gè)特定的任務(wù)。ANI模型雖然早在好多年前就已經(jīng)有了,但因?yàn)槌杀尽①|(zhì)量、效果等方面都有局限,不可能掀起一輪產(chǎn)業(yè)革命,所以并沒(méi)有引起太多關(guān)注,影響力有限。

而今天的大模型是AGI通用人工智能模型,或者也可稱之為AI基礎(chǔ)模型。這與ANI模型有著本質(zhì)區(qū)別,是完全不同的兩個(gè)物種。在AI基礎(chǔ)模型之上,可以用法律、醫(yī)療、教育、汽車等各行各業(yè)的數(shù)據(jù),通過(guò)各種各樣的技術(shù)手段,比如SFT(監(jiān)督微調(diào))、RAG(檢索增強(qiáng)生成)等方式,進(jìn)行整合和訓(xùn)練,從而得到解決特定行業(yè)問(wèn)題的更高效、更精準(zhǔn)、更科學(xué)、更有價(jià)值的垂直模型。也就是說(shuō),今天的垂直模型與基礎(chǔ)模型之間存在聯(lián)動(dòng)關(guān)系,前者一定是建立在后者基礎(chǔ)上的。正是因?yàn)橛辛嘶A(chǔ)模型,垂直模型的能力,包括解決問(wèn)題的復(fù)雜性、廣泛性以及低成本、高效率等,才實(shí)現(xiàn)了由量變到質(zhì)變的躍升。

那么,如何評(píng)價(jià)垂直模型和基礎(chǔ)模型的作用呢?我認(rèn)為,如果說(shuō)基礎(chǔ)模型的能力是1,那么行業(yè)垂直模型或者說(shuō)專業(yè)模型就是1后面的0。這個(gè)描述可能不是那么準(zhǔn)確,但有利于大家理解。我想強(qiáng)調(diào)的是,基礎(chǔ)模型非常重要:基于功能不強(qiáng)、性能較弱的基礎(chǔ)模型,無(wú)論怎樣調(diào)試和優(yōu)化,最終訓(xùn)練出來(lái)的垂直模型也不會(huì)有很強(qiáng)的能力,能夠解決的問(wèn)題將極其有限;只有基礎(chǔ)模型非常強(qiáng)大,再加上相關(guān)行業(yè)的專業(yè)經(jīng)驗(yàn)、技術(shù)訣竅(Know-How)和優(yōu)質(zhì)數(shù)據(jù)等,才能驅(qū)動(dòng)垂直模型的能力實(shí)現(xiàn)飛躍式的提升。

趙福全:安博士談到,今天大家所講的垂直模型實(shí)際上與6年前的垂直模型完全不是一回事,雖然都是專業(yè)類模型,但早已經(jīng)既換湯又換藥,只是沒(méi)有換名而已。因?yàn)橐郧爸挥蠥NI模型,而現(xiàn)在有了大模型或者說(shuō)AGI模型作為基礎(chǔ)模型為其提供支撐。所以,今天的垂直模型是基于基礎(chǔ)模型并與基礎(chǔ)模型相互打通、彼此聯(lián)動(dòng)的新型專業(yè)類模型,其能力有了本質(zhì)性的躍升。

那么,基于大模型構(gòu)建的新型專業(yè)類模型,其理念和方法等,與ANI時(shí)代相比有哪些改變呢?

安筱鵬:這里面涉及到很多改變,我覺(jué)得其中最重要的一點(diǎn)是,今天大模型能給各類企業(yè)帶來(lái)怎樣的變革還是未知的。這可不像買(mǎi)一個(gè)杯子就是用來(lái)喝水,或是購(gòu)置一臺(tái)設(shè)備就是用來(lái)完成某項(xiàng)工作那樣簡(jiǎn)單。此時(shí)此刻,大模型究竟會(huì)在各行各業(yè)中如何應(yīng)用,還不是一件確定的事情。

具體來(lái)說(shuō),這種不確定性是指大模型在產(chǎn)品研發(fā)、生產(chǎn)、供應(yīng)鏈、銷售、服務(wù)等的每一個(gè)環(huán)節(jié)都有發(fā)揮作用的可能性,不過(guò)這些可能性未必都會(huì)指向一個(gè)確定的結(jié)果。所以,我們必須在認(rèn)知和理念層面上推動(dòng)AI應(yīng)用的方法論進(jìn)行一次全面的革新。其核心在于,不管是一家汽車公司,還是一家律師事務(wù)所,各行各業(yè)都要認(rèn)知到,自己與大模型之間是一種共創(chuàng)的合作關(guān)系,而不是一種簡(jiǎn)單的買(mǎi)賣(mài)關(guān)系。

趙福全:就是說(shuō),并不是把大模型買(mǎi)過(guò)來(lái)直接使用就可以了。專業(yè)類模型與大模型之間是一種共創(chuàng)關(guān)系:一方面,專業(yè)類模型要以強(qiáng)大的大模型為基礎(chǔ),這樣才能提升自身的能力;另一方面,專業(yè)類模型相當(dāng)于是大模型之下的子模型,其不斷擴(kuò)展和進(jìn)步又會(huì)支撐大模型的持續(xù)發(fā)展。試想,如果一個(gè)大模型能夠支撐幾十個(gè)專業(yè)類模型,在各行各業(yè)發(fā)揮重要作用,那其能力和價(jià)值自然也就更大了。


產(chǎn)業(yè)特點(diǎn)和市場(chǎng)規(guī)律決定大模型行業(yè)終將收斂


趙福全:展望未來(lái),大模型將如何演進(jìn)呢?這個(gè)行業(yè)的競(jìng)爭(zhēng)格局將會(huì)是什么樣的?請(qǐng)您和大家分享一下。

安筱鵬:我們今天講大模型,主要是指大語(yǔ)言模型。當(dāng)然,除了大語(yǔ)言模型之外,還有圖像理解和生成的大模型,以及其他的一些大模型,即所謂多模態(tài)的大模型。

目前這個(gè)方向的基本情況是:第一,大模型技術(shù)仍在快速迭代和演進(jìn)中,有多種不同的技術(shù)路線都在發(fā)展。第二,本輪人工智能大模型中最重要的一個(gè)分支,或者說(shuō)主賽道、主戰(zhàn)場(chǎng),即大語(yǔ)言模型,也在快速發(fā)展中。比如GPT就有GPT3.5、GPT4、GPT5的不斷演進(jìn)。而且大語(yǔ)言模型正在把文本、聲音、圖片和視頻等多種模態(tài)加載進(jìn)來(lái),像近期發(fā)布的GPT-4o,就可以實(shí)時(shí)處理文本、音頻和圖像。

未來(lái)大模型產(chǎn)品會(huì)呈現(xiàn)出怎樣的產(chǎn)業(yè)形態(tài)和競(jìng)爭(zhēng)格局呢?先看美國(guó)。美國(guó)基礎(chǔ)性的大語(yǔ)言模型已經(jīng)極度收斂了,根據(jù)我的觀察,現(xiàn)在美國(guó)的大語(yǔ)言模型大概就是“3+1+1”的格局,即主要有5個(gè)大模型。其中,核心的“3”分別來(lái)自微軟OpenAI聯(lián)盟、谷歌、Anthropic公司,這三家提供的都是閉源導(dǎo)向的大語(yǔ)言模型;中間的“1”來(lái)自Meta,就是Facebook的母公司,它發(fā)布的是開(kāi)源導(dǎo)向的大語(yǔ)言模型;最后一個(gè)“1”來(lái)自埃隆·馬斯克的xAI,這家公司剛剛成立一年多,目前估值已高達(dá)約200億美元。以上5家公司基本上主導(dǎo)了美國(guó)的基礎(chǔ)大語(yǔ)言模型產(chǎn)業(yè)。

可能有人會(huì)問(wèn),為什么美國(guó)的大語(yǔ)言模型主要就是這5家、而不是50家公司來(lái)參與競(jìng)爭(zhēng)呢?原因在于大模型的開(kāi)發(fā)和訓(xùn)練代價(jià)高昂,是資本、人才、數(shù)據(jù)和算力等都高度密集的行業(yè)。這和全球只有空客、波音和中國(guó)商飛這三家大型民用飛機(jī)制造商的道理類似,因?yàn)殚_(kāi)發(fā)一款大型民用飛機(jī)可能需要10年時(shí)間和100億-200億資金,而且要銷售至少一兩千架飛機(jī)才能收回研發(fā)成本。也就是說(shuō),產(chǎn)業(yè)特點(diǎn)和市場(chǎng)規(guī)律決定了大型民用飛機(jī)市場(chǎng)上最多只能容納兩三家企業(yè)。這個(gè)規(guī)律同樣適用于大模型行業(yè),所以隨著大語(yǔ)言模型的不斷演進(jìn),就逐漸形成了這樣一種收斂的競(jìng)爭(zhēng)格局。當(dāng)然,也有人認(rèn)為目前的人工智能技術(shù)路線會(huì)遇到天花板,屆時(shí)競(jìng)爭(zhēng)格局還會(huì)生變,不過(guò)至少現(xiàn)在我們尚未看到。

趙福全:安博士,那中國(guó)的情況會(huì)怎樣呢?現(xiàn)在有個(gè)說(shuō)法,叫做“百模大戰(zhàn)”,中國(guó)真的有那么多大模型嗎?為什么和美國(guó)相比,我們大模型的數(shù)量會(huì)如此之多?您認(rèn)為,最終中國(guó)會(huì)有多少個(gè)大模型?

安筱鵬:我個(gè)人判斷,國(guó)內(nèi)大模型行業(yè)未來(lái)可能會(huì)與美國(guó)差不多,只有少數(shù)幾家企業(yè)能留在這個(gè)賽道上。今天很多人都在講“百模大戰(zhàn)”,但其實(shí)中國(guó)并沒(méi)有“百模大戰(zhàn)”,甚至沒(méi)有“十模大戰(zhàn)”,不少所謂的大模型并不是真正的大模型。在我看來(lái),當(dāng)前中國(guó)真正在大語(yǔ)言模型主賽道上的企業(yè)可能只有五六家或者稍多一點(diǎn),這是符合產(chǎn)業(yè)發(fā)展和市場(chǎng)競(jìng)爭(zhēng)規(guī)律的。


基于大模型構(gòu)建行業(yè)專業(yè)模型有多種不同方式


趙福全:下面一個(gè)問(wèn)題,大模型和專業(yè)類模型之間的共性連接體現(xiàn)在哪里?或者說(shuō),大模型是如何支撐及驅(qū)動(dòng)專業(yè)類模型進(jìn)步的?專業(yè)類模型又是怎樣補(bǔ)充及拉動(dòng)大模型發(fā)展的?您覺(jué)得在專業(yè)類模型的開(kāi)發(fā)過(guò)程中,應(yīng)該如何在思路、方法和手段上與大模型有效地結(jié)合呢?

安筱鵬:首先,專業(yè)類模型的開(kāi)發(fā)有兩種類型:一種是使用開(kāi)源大模型,即基于開(kāi)源的大模型,結(jié)合本行業(yè)的知識(shí)、經(jīng)驗(yàn)、方法以及核心技術(shù)等,開(kāi)發(fā)出相應(yīng)的專業(yè)類模型,部署在公有云或者私有云上?,F(xiàn)在有很多開(kāi)源模型都可供使用。另一種是為解決某個(gè)行業(yè)的特定問(wèn)題,在基礎(chǔ)大模型之上開(kāi)發(fā)專業(yè)類模型。具體可以是法律、醫(yī)療、教育、汽車等的任何一個(gè)行業(yè)。

后一種類型的具體實(shí)現(xiàn)路徑又有四種:

一是SFT即監(jiān)督微調(diào)方式。就是基于一個(gè)基礎(chǔ)大模型,用特定行業(yè)的專業(yè)術(shù)語(yǔ)進(jìn)行微調(diào)。通過(guò)該行業(yè)的大量數(shù)據(jù)訓(xùn)練之后,就可以得到某個(gè)領(lǐng)域的專業(yè)模型。比如,律師事務(wù)所可以訓(xùn)練律師行業(yè)的專業(yè)模型,包括刑法、婚姻法、知識(shí)產(chǎn)權(quán)法等各個(gè)細(xì)分領(lǐng)域。這種SFT方式對(duì)成本和人才的要求較高,訓(xùn)練周期也比較長(zhǎng)。

二是RAG即檢索增強(qiáng)生成方式。這種方式不需要專門(mén)訓(xùn)練模型,只要把某個(gè)行業(yè)現(xiàn)有的知識(shí)、經(jīng)驗(yàn)以及結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)等做成外掛系統(tǒng),然后通過(guò)檢索增強(qiáng)技術(shù),使其與大模型結(jié)合起來(lái),就可應(yīng)用于專業(yè)領(lǐng)域。例如生成一份醫(yī)療報(bào)告、一份法律文本或者一個(gè)汽車外形等等。這相當(dāng)于把專業(yè)知識(shí)與基礎(chǔ)大模型進(jìn)行了整合。

三是Promote Engineering即提示詞工程方式。通過(guò)設(shè)定合適的提示詞,來(lái)提高大模型解決特定行業(yè)問(wèn)題的能力。這種方式比較簡(jiǎn)單,同時(shí)效果相當(dāng)不錯(cuò)。也就是說(shuō),提示詞工程是一種成本投入較低、產(chǎn)出效果較好的大模型應(yīng)用方式。

四是Agent即智能體方式。這種方式相對(duì)比較復(fù)雜,需要開(kāi)發(fā)面向特定行業(yè)的智能體。以汽車產(chǎn)業(yè)為例,如果把大模型比喻為發(fā)動(dòng)機(jī),那么還要給發(fā)動(dòng)機(jī)配上底盤(pán)、車身、輪胎等等,在安裝調(diào)試好之后,汽車才能行駛起來(lái)。同樣的,只有大模型解決不了專業(yè)問(wèn)題,也要給它配上周邊系統(tǒng),如感知系統(tǒng)、記憶系統(tǒng)、執(zhí)行系統(tǒng)等,并經(jīng)過(guò)調(diào)試后,才能使其具備解決特定問(wèn)題的能力。所有這些要素及資源整合在一起,形成的能夠解決某個(gè)特定問(wèn)題的整體,就是一個(gè)智能體。目前,這種方式的相關(guān)技術(shù)還在迭代和演進(jìn)中。

以上就是當(dāng)前專業(yè)類模型與大模型相結(jié)合的四種方式,每個(gè)行業(yè)及企業(yè)在面對(duì)特定問(wèn)題時(shí),都可以選擇其中一種方式來(lái)構(gòu)建所需的專業(yè)模型。當(dāng)然,基礎(chǔ)大模型的能力還在演進(jìn)中,基于大模型構(gòu)建專業(yè)類模型的技術(shù)也在演進(jìn)中,未來(lái)二者的結(jié)合可能還會(huì)有新的變化。


大模型已由大語(yǔ)言模型向多模態(tài)融合大模型演進(jìn)


趙福全:安博士講得非常透徹。目前關(guān)于大模型,業(yè)界還有一個(gè)問(wèn)題存在爭(zhēng)議,就是有些專家認(rèn)為“大模型”這個(gè)名稱不太準(zhǔn)確,可能會(huì)造成誤導(dǎo),實(shí)際上應(yīng)該稱為L(zhǎng)LM即大語(yǔ)言模型。畢竟名稱可以傳遞很多重要信息。比如現(xiàn)在電動(dòng)汽車不再有傳統(tǒng)發(fā)動(dòng)機(jī)了,可依然被稱為“汽車”,在某種意義上也是在強(qiáng)調(diào)其交通工具的屬性并沒(méi)有改變。對(duì)此,您是怎么看的?

安筱鵬:我是這樣理解的:大模型的“大”,主要是指模型的參數(shù)多,且“參數(shù)越多,效果越好”,這是一個(gè)普適規(guī)律?;谶@一規(guī)律構(gòu)建的模型最初就是針對(duì)語(yǔ)言的,即大語(yǔ)言模型。不過(guò)除了語(yǔ)言之外,對(duì)于圖像的識(shí)別和理解也是一樣的,比如提供一張照片,模型就能識(shí)別出上面顯示的是什么地方,或者為其配上一段說(shuō)明文字;其他諸如音頻、視頻等的處理,也完全適用于上述規(guī)律,都可以構(gòu)建相應(yīng)的大模型,這就是所謂的不同模態(tài)。當(dāng)然,此前最重要的大模型還是大語(yǔ)言模型。

而現(xiàn)在大模型的發(fā)展方向之一就是把各種模態(tài)進(jìn)行集成,尤其是OpenAI公司今年剛剛發(fā)布的GPT-4o,已經(jīng)整體集成了這幾種模態(tài)。為什么說(shuō)是整體集成呢?我們不妨對(duì)比一下此前的大模型,比如GPT4,可以與人進(jìn)行語(yǔ)音對(duì)話。不過(guò)在其內(nèi)部每輪對(duì)話都是通過(guò)三個(gè)模型協(xié)作來(lái)完成的:你問(wèn)一個(gè)問(wèn)題,大模型先用a模型把你的語(yǔ)音轉(zhuǎn)換成文字,并傳遞到b模型;然后b模型針對(duì)你的問(wèn)題給出文字形式的答案,并傳遞到c模型;最后c模型再把文字轉(zhuǎn)換成語(yǔ)音,反饋給你。所以,盡管對(duì)你而言,就是用語(yǔ)音問(wèn)了大模型一個(gè)問(wèn)題,然后得到了它的語(yǔ)音回答,但其實(shí)這背后是經(jīng)過(guò)了轉(zhuǎn)換的,而在轉(zhuǎn)換過(guò)程中就難免會(huì)產(chǎn)生時(shí)延、偏差等問(wèn)題。與此同時(shí),你在說(shuō)話時(shí)可能還打了手勢(shì)、做了表情,而這些信息都被屏蔽掉了,大模型僅僅采集了語(yǔ)音信息。

而現(xiàn)在的GPT-4o,可以同時(shí)采集你的聲音、手勢(shì)、動(dòng)作和表情,然后把這些信息集成起來(lái)作為輸入,這樣其能力自然就更全面、也更強(qiáng)大。此外,它的輸出主要是語(yǔ)音,但也可以有表情,顯示出喜怒哀樂(lè)等情緒,這意味著其輸出也是多模態(tài)的。顯然,這是一個(gè)非常重要的變化。

趙福全:關(guān)于大模型和專業(yè)類模型的話題,是所有產(chǎn)業(yè)的模型應(yīng)用者以及潛在應(yīng)用者,也包括AI大模型的推動(dòng)者,都非常關(guān)注且必須面對(duì)的問(wèn)題。而這其中涉及到的一些重要概念,大家的理解可能還不太一樣。剛才通過(guò)與安博士的交流,我們澄清了概念、理清了邏輯。特別是安博士的分享既專業(yè)嚴(yán)謹(jǐn),又淺顯易懂,更融入了自己在這方面的獨(dú)到理解和深刻感悟,相信大家肯定都很有收獲。下面,我簡(jiǎn)單做個(gè)小結(jié)。

實(shí)際上,專業(yè)類模型并不是新生事物。早在ANI弱人工智能時(shí)代,很多行業(yè)就已經(jīng)有專業(yè)類模型了,可以解決特定領(lǐng)域的某個(gè)問(wèn)題。這種專業(yè)類模型的效果通常都還不錯(cuò),問(wèn)題在于只能解決特定的問(wèn)題,無(wú)法向其他領(lǐng)域拓展,因此有明顯的局限性。另外,這種專業(yè)模型后續(xù)不斷升級(jí)的工作量也很大,其投入產(chǎn)出比是比較低的。

當(dāng)大模型出現(xiàn)之后,我們開(kāi)始進(jìn)入AGI強(qiáng)人工智能時(shí)代。大模型在數(shù)據(jù)、算法、算力等方方面面的能力都有了革命性的提升,可以作為普適的、通用的AI基礎(chǔ)模型,像基礎(chǔ)設(shè)施一樣發(fā)揮作用。基于AI基礎(chǔ)模型,各行各業(yè)的專業(yè)人士可以開(kāi)發(fā)各自的專業(yè)模型,或者說(shuō)垂直模型,從而將大模型應(yīng)用到各個(gè)專業(yè)領(lǐng)域。但是此專業(yè)模型非彼專業(yè)模型,因?yàn)槠浠A(chǔ)不再是ANI模型了。新的專業(yè)類模型一定是基于AGI大模型的,是使用了大模型這一基礎(chǔ)設(shè)施的。這個(gè)差別非常大,就好比同樣是汽車,但跑在高速公路上和跑在鄉(xiāng)間小路上,速度是完全不同的。在此情況下,如果企業(yè)沒(méi)有基于大模型來(lái)做專業(yè)模型,那就和以前沒(méi)有區(qū)別,雖然也可以做出來(lái),但模型的能力及潛力都會(huì)非常有限;而如果企業(yè)以大模型為基礎(chǔ)來(lái)做專業(yè)模型,其模型效果以及拓展性就會(huì)有質(zhì)的提升。這就是我作為一個(gè)IT業(yè)外人士的理解。

可見(jiàn),大模型是專業(yè)類模型的基礎(chǔ)。而更多的專業(yè)類模型基于大模型開(kāi)發(fā),又可以讓大模型發(fā)揮更大的作用。這一點(diǎn)至關(guān)重要,因?yàn)槿绻挥写竽P投鴽](méi)有專業(yè)類模型,大模型在整個(gè)經(jīng)濟(jì)社會(huì)中的影響和價(jià)值也會(huì)大打折扣。就像百度董事長(zhǎng)李彥宏總最近強(qiáng)調(diào)的,沒(méi)有應(yīng)用模型的基礎(chǔ)大模型,無(wú)論是開(kāi)源還是閉源的,都一文不值。所以,希望各個(gè)行業(yè)、眾多領(lǐng)域的專業(yè)模型能夠百花齊放。為此,做專業(yè)模型的人要擁抱大模型,而做大模型的人也要擁抱專業(yè)模型,雙方相向而行、共同奔赴理想的目標(biāo)。

在這個(gè)過(guò)程中,我們必須清楚,大模型并不是誰(shuí)都能做的。因?yàn)殚_(kāi)發(fā)大模型需要規(guī)模超乎想象的算力、數(shù)據(jù)、人才和資本等資源,而且不是一次性的投入,后續(xù)還要不斷迭代、優(yōu)化才能確保持續(xù)引領(lǐng),這遠(yuǎn)非一般企業(yè)所能承受。所以,真正有能力做大模型的企業(yè)數(shù)量將非常有限,而其他企業(yè)更應(yīng)該把資源用于專業(yè)類模型的開(kāi)發(fā)。正因如此,最終大模型的數(shù)量不會(huì)很多,事實(shí)上也不需要很多。這就像高速公路不需要到處都有,且一定是在政府主導(dǎo)下由大企業(yè)來(lái)建設(shè)的;相比之下,鄉(xiāng)間小路由村里集資就可以建了。

至于到底應(yīng)該叫大語(yǔ)言模型還是大模型,如果從人工智能進(jìn)入AGI階段的高度來(lái)看,叫大模型應(yīng)該要比大語(yǔ)言模型更有普適性,也更有指引意義。另一方面,雖然大模型最初主要就是大語(yǔ)言模型,但是目前早已拓展到語(yǔ)音、圖像和動(dòng)作等更多模態(tài)了,甚至已經(jīng)有大模型能夠集成處理不同模態(tài)的信息,并產(chǎn)生相應(yīng)的數(shù)據(jù)訓(xùn)練模型了。所以,簡(jiǎn)單地叫“大語(yǔ)言模型”可能會(huì)有一定的局限性。當(dāng)然,無(wú)論是開(kāi)展實(shí)際工作的專家,還是從事相關(guān)研究的學(xué)者,都更應(yīng)該注重大模型的發(fā)展及應(yīng)用,而沒(méi)必要過(guò)分關(guān)注其稱謂。


多主體協(xié)同的產(chǎn)業(yè)生態(tài)將支撐大模型得到更好應(yīng)用


安筱鵬:我再補(bǔ)充一點(diǎn),就是未來(lái)人們使用大模型時(shí)會(huì)形成一個(gè)供給側(cè)與需求側(cè)互動(dòng)的生態(tài)。事實(shí)上,大模型的應(yīng)用一定是一個(gè)多主體聯(lián)動(dòng)的過(guò)程,其中只有一部分情況是大模型直接提供服務(wù),即所謂API(應(yīng)用程序編程接口)方式,而更多、更復(fù)雜的業(yè)務(wù)場(chǎng)景涉及到多個(gè)利益主體、多條技術(shù)路線的不斷協(xié)同和反復(fù)互動(dòng),要靠各方有效協(xié)作來(lái)為客戶提供服務(wù),這就構(gòu)成了生態(tài)。如果以足球比賽類比,大模型企業(yè)就像是守門(mén)員,通常無(wú)法一腳直接把球踢到對(duì)方的球門(mén)里,而是要與球隊(duì)的后衛(wèi)、中場(chǎng)、前鋒等一起配合來(lái)取得進(jìn)球。

趙福全:安博士強(qiáng)調(diào)的這一點(diǎn)非常重要。我之前曾經(jīng)多次講過(guò),在萬(wàn)物互聯(lián)的時(shí)代,各類不同主體將有效協(xié)同、相互賦能,共同驅(qū)動(dòng)整個(gè)人類社會(huì)邁入超級(jí)智能時(shí)代。屆時(shí)每一個(gè)人造物都將是互聯(lián)的,且由人工智能賦能,從而構(gòu)成了智能化的大環(huán)境,可以使其中的每一個(gè)人造物都把智能化的能力發(fā)揮到極致。所謂車路協(xié)同也是同樣的道理,即智能的車必須跑在智能的路上,而智能的路也只有當(dāng)智能的車行駛時(shí)才能體現(xiàn)出其智能的價(jià)值。由此,道路、車輛、車內(nèi)外的人員以及網(wǎng)絡(luò)、云端等所有智能的主體,將互聯(lián)而成一個(gè)超級(jí)智能的大生態(tài)。參與其中的各類主體相互協(xié)同,把各自的力量都融合到一起,最終實(shí)現(xiàn)1+1+1遠(yuǎn)大于3的效果。

安筱鵬:是的,各類企業(yè)都有自己的優(yōu)勢(shì)。到了人工智能大模型廣泛應(yīng)用的時(shí)代,生態(tài)系統(tǒng)本身就是企業(yè)競(jìng)爭(zhēng)與合作的一種必然形態(tài)?,F(xiàn)在中國(guó)和美國(guó)都有很多開(kāi)源社區(qū),比如阿里的開(kāi)源社區(qū)叫做魔搭社區(qū)?,F(xiàn)在可能有很多人對(duì)這種生態(tài)還沒(méi)什么認(rèn)知,實(shí)際上其作用是巨大的。我經(jīng)常舉一個(gè)例子,要攀登珠穆朗瑪峰,從地面一直爬到山頂?shù)碾y度非常大,但如果從海拔5200米的珠峰大本營(yíng)出發(fā),爬到山頂就容易多了。

同樣的道理,包括開(kāi)源的軟件、大模型、社區(qū)等在內(nèi)的生態(tài),就像一架直升機(jī),可以先把你從地面運(yùn)到珠峰大本營(yíng),然后你再爬完剩下的3000多米,這自然可以幫你節(jié)省很多體力或者說(shuō)資源。實(shí)際上如果沒(méi)有生態(tài)這架直升機(jī),你可能永遠(yuǎn)都無(wú)法登頂。目前美國(guó)在AI領(lǐng)域就有很多這樣的“直升機(jī)”,可以把企業(yè)直接運(yùn)到“珠峰大本營(yíng)”,這就大大降低了AI應(yīng)用的門(mén)檻。中國(guó)在這方面也需要加緊努力,因?yàn)閷?duì)于一個(gè)國(guó)家或地區(qū)的大模型普及應(yīng)用來(lái)說(shuō),繁榮的產(chǎn)業(yè)生態(tài)至關(guān)重要。

首頁(yè) 電話 聯(lián)系
會(huì)員登錄
還未注冊(cè)?點(diǎn)擊立即注冊(cè)
注冊(cè)
已有賬號(hào)?返回登錄