技術是佐料,需求才是主菜。
文|大力正手 教育行業(yè)研究者
編者按:
本文系多知網約稿。當前,不完全統(tǒng)計國內有超過80個基礎大模型,對于大模型來說,參與開發(fā)的畢竟是少數(shù)企業(yè),中小企業(yè)更多的是使用者。但是,到現(xiàn)在真正應用大模型的商業(yè)化并不突出。本文作者從幾個角度來解釋大模型應用商業(yè)化進展緩慢的原因,并認為技術本質上是一種手段,而滿足用戶需求才是真正追求的目標。
自2022年底ChatGPT發(fā)布后,截止6月份,國內企業(yè)已經發(fā)布了約80個基礎大模型,打著AI旗號的產品更數(shù)不勝數(shù)。但實際上大模型的商業(yè)化一直存問題,可以說,并沒有幾家企業(yè)在大模型領域真正產生大額收入,其收入可能僅占估值的1/100,絕大部分都是靠著融資以及創(chuàng)始人自有資金將企業(yè)往前推進。文章將從幾個角度來解釋大模型應用的商業(yè)化進展緩慢的原因。
01
大模型還不足夠好,小概率但可能是大風險
當你問早期ChatGPT3.5“林黛玉為什么會倒拔垂楊柳”,他回答說“因為林黛玉悲傷過度,倒拔垂楊柳緩解悲傷情緒”;早期的文心一言更是會回答一些匪夷所思的答案。這就是模型幻覺——一本正經胡說八道。但當GPT-4出來后,再問他“林黛玉為什么會倒拔垂楊柳”,他會告訴你“林黛玉是紅樓夢的人物,倒拔垂楊柳是水滸傳的情節(jié),兩個不能放在一起”。更精準的回答,正是模型幻覺的減少,這也意味著大模型正在越來越好。
然而,盡管大規(guī)模模型的性能正在改善,但他們依舊存在缺陷。在商業(yè)應用中,我們必須從小概率風險的角度去考慮。盡管GPT-4的錯誤可能相對較小,但在某些關鍵領域,如航空和醫(yī)療,即使只有一次的錯誤,也可能帶來嚴重后果。因此,我們發(fā)現(xiàn)大模型最先被應用于容錯率較高的行業(yè),如聊天、游戲、社交等,因為在這些領域,偶爾的錯誤不會帶來嚴重的影響。另一種情況,大模型作為輔助決策的存在,如辦公場景中的會議摘要等,這也就意味著,在最終的產品或者內容觸達用戶之前,肯定有人的參與,來作為剔除小概率風險的保障。
02
大模型還不夠穩(wěn),宕機了企業(yè)惹不起
GPT-4是目前最先進的大型人工智能模型,其優(yōu)越的邏輯推理能力引領著業(yè)界的發(fā)展趨勢,國內的研發(fā)也在不斷向GPT-3.5靠近。然而,對于中國的C端用戶而言,OpenAI的賬戶使用門檻較高,需要海外的郵箱、手機號和銀行賬戶,這使得只有少部分人能夠獲取到優(yōu)質的GPT-4服務。對于國內的B端企業(yè)希望使用GPT,一方面受限于國內法規(guī)限制,一方面open ai不定期對亞太地區(qū)特別是中國大陸進行封號,使得B端企業(yè)很難獲得穩(wěn)定的api接口。雖然可以通過微軟云服務的方式接入,但也存在著一定的不確定性。
在商用領域,穩(wěn)定性是至關重要的。就像游戲體驗中,最讓人破防的的往往是突然的宕機,而這在ChatGPT這樣的世界級產品中也出現(xiàn)過多次。對于依賴GPT-3.5或4作為底層模型的企業(yè),用戶會對任何宕機行為產生抱怨,但他們不會關心問題的來源,只會感到服務的中斷并把憤怒發(fā)泄到企業(yè)。通常,企業(yè)會選擇備用模型以應對核心模型的突然問題,然而目前在商用層面特別是國內,還沒有能真正匹敵GPT-4的模型。這意味著,即使備用模型能保證穩(wěn)定性,其效果和用戶體驗卻可能大大低于以前,這是所有企業(yè)都不愿意看到的。
03
大模型還不夠便宜,模型之外還有成本
對于基礎大模型的開發(fā),這顯然不是所有企業(yè)都能參與其中的,其訓練成本極其高昂。對于大多數(shù)人來說,更多地是從使用者的角度與大模型打交道。盡管對于采用大模型的企業(yè)來說,API的價格已經大幅降低,比如2023年3月份ChatGPT API的價格比2022年底下滑了90%,而在2023年6月份,輸入端的價格再次降低了25%。即使如此,這種新型的計算方式相較于傳統(tǒng)的運算方式依然更加昂貴。據(jù)路透社報道,谷歌的母公司Alphabet的董事長John Hennessy表示,與大型語言模型進行交互的成本可能是進行標準關鍵詞搜索的10倍。所以,雖然大模型的使用成本已經在不斷下降,但其價格依然不菲。
另外,僅僅將大模型接入到特定的領域,可能并不能達到最佳的效果。因此,在接入API并將其投入商用之前,企業(yè)還需要在諸多方面付出額外的成本。這包括數(shù)據(jù)準備和預處理的成本、模型訓練和調優(yōu)的成本、部署和運維的成本、模型更新和迭代的成本,以及法規(guī)合規(guī)的成本。所有這些因素都使得應用大模型的總體成本依然很高。
以科大訊飛的學習機T20為例,由于其搭載了星火大模型,其價格比前一代的T10高出2000元。據(jù)業(yè)內人士透露,這額外的2000元其實并沒有覆蓋大模型的成本??紤]到市面上一臺普通的學習機,其硬件制造和版權購買的總成本也僅在1000-1500元左右,這就更加凸顯了大模型在商業(yè)應用中的高昂成本。
04
靠大模型創(chuàng)收,難,很難,特別難
商業(yè)得以運轉,核心是收益能否超越成本。目前的商業(yè)環(huán)境已經不再青睞通過燒錢搶占市場或者策略性虧損的策略,而是更傾向于自我造血的企業(yè)。然而大模型領域的企業(yè)自我造血能力均欠佳。
以目前的頭部大模型企業(yè)為例。OpenAI是目前最知名的AI大模型公司,雖然他們已經籌集了超過100億美元的資金,并且公司估值達到了290億美元,但是他們預計在2023年的收入只有2億美元。另一個例子是Hugging Face,作為全球最大的AI/ML社區(qū)和平臺,同時也是最重要的大模型基礎設施之一,他們的估值是20億美元,但growjo對其年收入預估僅0.3億美元。另一家獨角獸公司Adept AI,他們是AI助手(大模型應用)的開發(fā)者,雖然他們籌集了4.1億美元的資金,公司估值達到了10億美元,但growjo對其年收入預估只有0.04億美元,可以說幾乎還沒有商業(yè)化。
國內的各大模型公司,例如百度、阿里、騰訊、華為等,雖在大模型領域有所布局,但并未從中獲取實質性的豐厚收益。此外,大模型領域的中小型獨立企業(yè),其收入可能僅為公司估值的百分之一。尤其對于直面C端用戶的產品,大公司在沒有全面考慮的策略前,往往謹慎行事,不輕易推向市場。因此,像文心一言、通義千問、星火大模型等產品,都需要用戶申請才能使用,而非直接面向公眾。對于中小型公司,雖然它們能迅速推出產品,但由于資金等限制,產品往往處于冷啟動,推廣困難,因此大模型領域的小公司用戶數(shù)通常較少。
大模型的確是一項優(yōu)秀的技術,但它當前的價值更多地體現(xiàn)在"錦上添花",而不是"雪中送炭"。也就是說,大模型帶來的邊際價值,并未能滿足市場的剛需。從商業(yè)模式上看,大部分的產品都是以原產品的增值服務的方式提供,而非推出獨立產品。如多鄰國的涵蓋大模型AI能力的增值訂閱服務,售價30美元/月;Quizlet的增值服務AI導師Q-chat,訂閱費用為3.99美元/月。
大模型的上游企業(yè)收取中游企業(yè)的接入費,而中游企業(yè)則通過向下游用戶收費來提供基于大模型的產品。最終,是用戶的需求驅動了整個市場。但是,為什么用戶不愿意為大模型付費呢?
首先,AI領域的發(fā)展和普及需要時間。許多領域,包括專業(yè)領域如midjourney和GEN2,甚至包括熱門產品如ChatGPT,都還沒有得到廣泛的了解。其次,模型的成熟度對用戶的接受程度有重要影響。如果用戶接觸到的產品不夠成熟,他們可能無法充分體驗到大模型的能力,這可能直接降低他們對大模型的評價和付費意愿。最后,付費方式和費用也是影響用戶付費意愿的重要因素。如果付費方式復雜或費用過高,原有路徑依賴直接阻礙了用戶付費。
05
技術是佐料,需求才是主菜
教育信息化來說,一般情況下,購買方往往是學?;蚪逃?,而真正使用這些產品的卻是老師。只有深入了解教師在教學過程中面臨的實際問題,推出的信息化產品才能真正提升教學效率。過于追求大屏幕或快速反應等技術特性,往往只是企業(yè)自我陶醉。同理,此前線下培訓為何受歡迎?原因在于,面對面的教學效果通常更好,而且家長能把孩子交給老師,從而得到休息的時間。相較而言,盡管在線教育在某種程度上解決了學習問題,但家長仍需監(jiān)督孩子在家的學習,家長并沒有獲得整塊的休息時間。
識別用戶需求并不簡單,特別是在應用大模型技術的過程中??赡芘c大模型簽約的并非實際的用戶,或者用戶根本無法表達出自己的實際需求。例如,在使用大模型實現(xiàn)學生答疑的時候,可能會以為學生只關注學習相關的問題,但實際上,除了提問,許多學生更渴望的是交談的機會。有時候,學生說出的十句話中,可能有九句是想與老師閑聊,但如果問學生,學生說,“我就是想問問題”。
因此企業(yè)必須深入理解用戶,尋找用戶真正的痛點,而不是讓技術變成一種噱頭。技術本質上是一種手段,而滿足用戶需求才是真正追求的目標。
當然,大模型商用落實到實踐的時候,還有更多的問題。我們也將在之后的文章中,逐一展開。
相關閱讀:
普通教育從業(yè)者也能看得懂的GPT原理:知其厲害,知其所以厲害
長遠看GPT等大模型對教育的影響
(本文僅代表作者個人觀點,供讀者參考。)