“To B or not to B?這是 AI 大模型的「哈姆雷特之問」。”
跨入2023年,大模型興起、諸多公司「跑步進(jìn)場(chǎng)」的頭幾個(gè)月,大模型一邊倒向 C 端類 ChatGPT 的研發(fā),對(duì)成本、效率更敏感的企業(yè)客戶似乎不在關(guān)注焦點(diǎn)。
然而近兩個(gè)月,情況發(fā)生了變化?;卺t(yī)療、金融、教育等垂直行業(yè)的大模型開始出現(xiàn)。而已經(jīng)發(fā)布通用大模型的公司,也在針對(duì)行業(yè)推出模型服務(wù)。
(資料圖片僅供參考)
這將給大模型的市場(chǎng)發(fā)展帶來什么變化?
01MaaS的疑問
隨著「大模型是AI時(shí)代的基礎(chǔ)設(shè)施」的提法深入人心,MaaS(Model as a Service,模型即服務(wù))的概念逐漸廣為人知。簡(jiǎn)單來說,用戶可以直接在云端調(diào)用、開發(fā)與部署模型,而無需投資構(gòu)建和維護(hù)自己的模型所需的基礎(chǔ)設(shè)施、硬件和專業(yè)知識(shí)。
但從「用家」的角度來看,這一模式還有疑問。
現(xiàn)任某知名智能家居品牌 CTO 的陳平告訴雷峰網(wǎng),他們的智能產(chǎn)品銷往全球各地,對(duì)大模型有突出需求,就是想用大模型來提升多國(guó)語言識(shí)別與處理的能力。以前的語音識(shí)別做不到「一模通用」,而是要根據(jù)不同的國(guó)家設(shè)計(jì)不同的方案,但 ChatGPT 出來后,他們調(diào)用 API 調(diào)試,發(fā)現(xiàn)大模型能有效地解決這個(gè)問題。
在海外,該品牌與亞馬遜進(jìn)行合作。他們的產(chǎn)品本身就需要通過亞馬遜的平臺(tái)在海外銷售,亞馬遜自己做的 Echo 音箱也賣到海外很多個(gè)國(guó)家,驗(yàn)證了亞馬遜語音識(shí)別技術(shù)的成熟度。盡管亞馬遜的效率成本比較高,但能夠較好地滿足他們的需求。
但在國(guó)內(nèi),他們還不知道該用哪一家的模型:目前國(guó)內(nèi)已發(fā)布的大模型數(shù)量太多,如果他們要將所有的模型都驗(yàn)證一遍、一一對(duì)比模型的效果,那么所消耗的人力成本會(huì)非常大。
國(guó)內(nèi)模型能力的「賣方」可分為兩類:一類是BAT等大廠和大模型初創(chuàng)公司(如智譜、MiniMax)為主;此外還有大模型的「中間商」,主要是基于大模型開發(fā)應(yīng)用型服務(wù)的創(chuàng)始團(tuán)隊(duì),包括底層算力與框架的提供者,甚至還包括提供大模型微調(diào)的第三方公司。
陳平的想法,反映了部分B端大客戶的需求,他們希望有一個(gè)專屬于自身行業(yè)的大模型,這正好介于兩類賣方所提供的產(chǎn)品與服務(wù)之間。
一位大廠工程師在與雷峰網(wǎng)的交談中,將市場(chǎng)需求分為金字塔的底層、中層與上層:
底層是通用大模型,如 ChatGPT。據(jù)不完全統(tǒng)計(jì),過去三個(gè)月里,國(guó)內(nèi)發(fā)布了超過 70 個(gè) To C 通用大模型產(chǎn)品,如百度的文心一言、阿里的通義千問、科大訊飛的星火等等。
中層是行業(yè)大模型,如彭博發(fā)布的金融大模型 Bloomberg GPT,這類大模型或是與底層想做大模型基礎(chǔ)設(shè)施的通用大模型廠商合作定制,或直接調(diào)用 API 接口,或大廠云廠商自研。
上層是一系列應(yīng)用型服務(wù),基于通用大模型或行業(yè)大模型開發(fā) AI 工具,如構(gòu)建一個(gè)專注于論文解讀(含翻譯、摘要總結(jié)、生成等等)的學(xué)術(shù)平臺(tái)。
從數(shù)據(jù)安全的角度看,陳平更青睞與大廠合作,因?yàn)榈谌焦倦m然懂得訓(xùn)練大模型,但不懂智能家居的知識(shí),他們依然要提供大量的數(shù)據(jù)給對(duì)方訓(xùn)練,而數(shù)據(jù)提供過去后,他們一是無法保障模型的能力得到延展,二是無法避免第三方公司將這些數(shù)據(jù)與對(duì)應(yīng)的模型賣給陳平所在品牌的競(jìng)爭(zhēng)對(duì)手。
當(dāng)理論落地現(xiàn)實(shí),陳平的困境也是許多 B 端企業(yè)的共同難題。
02重回焦點(diǎn)
過去三個(gè)月,國(guó)內(nèi)大模型產(chǎn)品設(shè)計(jì)一味追隨 ChatGPT,將問題的定義交給用戶自由發(fā)揮(俗稱「AI 召喚師」),造成了嚴(yán)重的同質(zhì)化,大模型的應(yīng)用局限于文本生成、代碼生成等通識(shí)屬性強(qiáng)的場(chǎng)景上,滿足用戶社交、娛樂或創(chuàng)作的需求。
更接近生產(chǎn),對(duì)于成本效率要求更高的產(chǎn)業(yè)市場(chǎng),并未被過多提及。
今年 5 月份,陳平曾經(jīng)嘗試聯(lián)系一家大廠的大模型團(tuán)隊(duì),希望探討大模型落地方案,得到的回復(fù)是優(yōu)先級(jí)不在智能家居行業(yè)。
但眼下,大廠和創(chuàng)業(yè)公司們正在將眼光重新聚焦于產(chǎn)業(yè)。
之前,國(guó)內(nèi)類 ChatGPT 的大模型產(chǎn)品都無一例外地側(cè)重「對(duì)話交互型」,而非「知識(shí)增強(qiáng)型」,大多數(shù) C 端用戶與 AI 的對(duì)話內(nèi)容趨向于「Chat」(閑聊)而非「GPT」(生成/創(chuàng)造)。但另一方面,C 端用戶的付費(fèi)意愿低,To C 的通用大模型產(chǎn)品短期內(nèi)無法復(fù)制 ChatGPT 的成功模式,在同質(zhì)化產(chǎn)品的圍攻下被迫加入資源競(jìng)賽的燒錢游戲?;剡^頭看,To B 客戶付費(fèi)意愿高。隨著市場(chǎng)回歸理性,大模型選擇 To B 幾乎成為行業(yè)內(nèi)心照不宣的一個(gè)范式。
有報(bào)告指出,B端的Mass服務(wù)需要針對(duì)行業(yè)領(lǐng)域和業(yè)務(wù)場(chǎng)景進(jìn)行大量工程工作,但B/G端客戶付費(fèi)能力更強(qiáng),未來盈利空間以及成長(zhǎng)空間廣闊。
但To B客戶的需求也更「強(qiáng)勢(shì)」,一不小心走歪,很可能回到上一代 AI 模型定制化的老路。
例如,市面上已經(jīng)出現(xiàn)了一些專門提供模型精調(diào)服務(wù)的第三方公司。
雷峰網(wǎng)了解到,這類第三方公司采用一次性開發(fā)+訂閱的收費(fèi)模式,如初始研發(fā)費(fèi)用 100 萬、再加上終身授權(quán)許可的設(shè)備費(fèi)用(8塊錢一個(gè)),幫助 B 端客戶根據(jù)需求訓(xùn)練出滿足它們行業(yè)需求的大模型,然后在客戶的平臺(tái)上進(jìn)行私有化部署。因?yàn)樵谑忻嫔蠒簳r(shí)找不到合適的標(biāo)化產(chǎn)品,這類公司受到了沒有自主研發(fā)團(tuán)隊(duì)、同時(shí)又渴求大模型能力的B 端企業(yè)客戶(區(qū)別于大 B)的青睞。
03兩個(gè)盲區(qū)
雷峰網(wǎng)也關(guān)注到,越來越多大模型的研發(fā)團(tuán)隊(duì)準(zhǔn)備彎道超車,繞過激烈的C端市場(chǎng),專注研究面向行業(yè)的大模型,如王小川建立的百川智能就剛剛推出了一個(gè)參數(shù)規(guī)模 7B的開源商用模型。
騰訊也計(jì)劃在 6 月 19 日發(fā)布行業(yè)大模型及商用訓(xùn)練平臺(tái)。在此前4月,騰訊發(fā)布了的面向大模型訓(xùn)練的新一代HCC高性能計(jì)算集群,整體性能比過去提升了3倍,并通過騰訊云MaaS面向企業(yè)輸出模型訓(xùn)練相關(guān)服務(wù)。
看起來,騰訊沒有急于推出聊天助手產(chǎn)品,而是選擇了通用大模型、行業(yè)大模型兩條腿走路,進(jìn)一步對(duì)外釋放行業(yè)大模型服務(wù)能力。在剛剛結(jié)束的中關(guān)村論壇上表示,李彥宏提出未來每一個(gè)行業(yè)都會(huì)有屬于自己的大模型。大模型會(huì)深度融合到實(shí)體經(jīng)濟(jì)當(dāng)中去,賦能千行百業(yè),助力中國(guó)經(jīng)濟(jì)開創(chuàng)下一個(gè)黃金30年。阿里公布的模型即服務(wù)三層架構(gòu)中,也涵蓋了企業(yè)專屬大模型。
可以看出,企業(yè)客戶對(duì)大模型落地很迫切,各類廠商與創(chuàng)業(yè)者也在追趕需求。
事實(shí)上,B 端企業(yè)客戶往往自帶場(chǎng)景與數(shù)據(jù),是大模型落地的*檢驗(yàn)場(chǎng)。那么,在大模型的落地上,企業(yè)客戶最關(guān)心什么?
據(jù)雷峰網(wǎng)調(diào)研,大模型在企業(yè)落地有兩個(gè)盲區(qū):一是數(shù)據(jù)安全,二是成本可控。
數(shù)據(jù)安全包含「數(shù)據(jù)隱私」與「專業(yè)知識(shí)」兩塊,行業(yè)人士認(rèn)為,ChatGPT 生成的答案應(yīng)該由相關(guān)領(lǐng)域的專業(yè)人士判斷。基于通用大模型,目前用戶并非將專業(yè)知識(shí)輸入模型后就能得到專業(yè)的結(jié)果。此外,陳平指出,應(yīng)用型的公司基本不愿意將自身微調(diào)的模型貢獻(xiàn)到公有版本里與其他人分享,所以企業(yè)還是傾向于訓(xùn)練自己的大模型。訓(xùn)練完后在本地進(jìn)行私有部署。
行業(yè)現(xiàn)有的通常做法是,提供一個(gè)通用大模型,然后開放給行業(yè)的客戶去微調(diào),再進(jìn)行私有化部署。可陳平的經(jīng)驗(yàn)是,以 Open AI 為例,雖然它們開放了 API,但API無法私有化部署,客戶無法在最新的模型版本上微調(diào);大模型的技術(shù)變化太快,對(duì)企業(yè)來說,跟上潮流的成本太高。
一家企業(yè)的CTO向雷鋒網(wǎng)表示,目前大模型在企業(yè)落地的成本分兩塊:一是模型前期微調(diào)與訓(xùn)練的成本,二是模型后期與業(yè)務(wù)結(jié)合的運(yùn)行成本。大模型的訓(xùn)練需要算力、數(shù)據(jù)與工程等幾塊體系的支持。「企業(yè)要考慮訓(xùn)練定制化模型的人力與時(shí)間成本,更傾向于選擇能同時(shí)提供兩種能力的廠商,將模型訓(xùn)練與運(yùn)行成本降到*?!?/p>
一個(gè)值得警惕的點(diǎn)是:目前看來,并非所有的場(chǎng)景都適合大模型落地。大模型剛火起來時(shí),一些行業(yè)與未及時(shí)推出大模型技術(shù)或產(chǎn)品的公司擔(dān)心自身業(yè)務(wù)被大模型改寫,觀望兩個(gè)月后,他們發(fā)現(xiàn)「自己想多了」。他們認(rèn)為,原因可能有兩塊:一是缺少提出好問題的 AI 產(chǎn)品經(jīng)理,二是大模型的技術(shù)屬性所限。找場(chǎng)景一直是技術(shù)公司的難題,同樣也是 ToB 的難題。大模型團(tuán)隊(duì)尋找合適的場(chǎng)景,也是深入 To B 服務(wù)的關(guān)鍵一步。
每個(gè)掌握大模型自研能力的公司都想做大模型時(shí)代的「基礎(chǔ)設(shè)施運(yùn)營(yíng)商」。三個(gè)月下來,行業(yè)目前只能確定,如果大模型真的是 AI 時(shí)代的智能運(yùn)營(yíng)商,如水電網(wǎng)等社會(huì)基礎(chǔ)設(shè)施,無論現(xiàn)有的行業(yè)玩家再多,最終也只有少數(shù)幾家能成功。
先發(fā)有先發(fā)制人的優(yōu)勢(shì),后發(fā)有后來居上的可能,大模型驅(qū)動(dòng)新生產(chǎn)力的游戲還在繼續(xù)。如果大模型真的代表一個(gè)新時(shí)代,行業(yè)集體多花點(diǎn)時(shí)間進(jìn)行深入思考也無可厚非,目前看來,繼續(xù)留在牌桌上就已經(jīng)是正確的一步。
【本文由投資界合作伙伴微信公眾號(hào):雷峰網(wǎng)授權(quán)發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)?!咳缬腥魏我蓡?,請(qǐng)聯(lián)系(editor@zero2ipo.com.cn)投資界處理。
標(biāo)簽: