①國內大模型的使用量確實在顯著地增長,并且中國的模型在海外確實越來越具有競爭力,這是兩個積極的變化。 ②當產品沒人用或者不賺錢的時候,肯定不能怪用戶,大部分只能怪自己技術、產品做得不夠好。“至少我們一直是在努力的。希望自己能變得更好,這是我們唯一可以做的事。”閆俊杰說。
編者按:
財聯社、科創板日報旗下《AI daily》今日正式推出“Insight?AI 鋒線”訪談。訪談聚焦國內外人工智能及大模型領域優秀企業、創業者、領軍學者、投資人等,帶來AI賦能千行百業的最新探索、實踐與思考。Insight?AI 鋒線,洞見,先鋒,一線!
《科創板日報》9月20日訊(記者 黃心怡)作為AI六小虎之一,MiniMax已完成了A+輪融資,最新一輪由阿里領投,金額為6億美元。公司估值已突破25億美元,背后投資方包括騰訊、紅杉中國、高瓴、IDG、米哈游等。
在MiniMax的公司內部,同事彼此之間只稱呼花名。而對于創始人閆俊杰,員工稱呼他為為IO(花名)。閆俊杰曾擔任過商湯副總裁、研究院副院長和智慧城市事業群CTO。2021年12月,在商湯上市前夕,閆俊杰離開商湯,創立了MiniMax。
近日,MiniMax發布首款AI高清視頻生成模型abab-video-1。閆俊杰在發布會后接受《科創板日報》等媒體在采訪中透露,采用新一代技術的abab7系列模型將于未來數周內正式發布,效果對標GPT-4o的模型。談及大模型商業化的難點,閆俊杰回應稱,這確實是行業考驗,只有通過這一考驗的企業才能成功。
“當產品沒人用的時候,或者當產品不賺錢的時候,肯定是不能怪用戶,大部分只能怪自己的技術做得不夠好,或者產品做得不夠好。這可以當成對一個行業的考驗。如果能夠通過考驗,就能夠跑出來。如果通不過確實(公司)應該關掉。”
▌競爭在所難免 要把自己可能做強的地方無限放大
隨著以GPT為代表的新一輪人工智能浪潮的興起,為通用人工智能(AGI)的實現創造了更多的想象空間。
閆俊杰認為,AGI并非高大上的東西,而是要能夠變成大家每個人生活中的一部分。
“比如大家看抖音或者看視頻號的時候,不會意識到這是基于推薦算法短視頻的內容分發平臺,大家就覺得抖音、微信已經變成大家生活中的一部分。AGI也是一樣,當AI變成如同手機這般,成為大家每天都在用的一部分的時候,AGI就實現了。當然這需要很長的時間,但我覺得可以一步一步地努力。”
對于短期五年內AI能帶來的改變,閆俊杰認為,5年后,在有AI幫助的情況下,每個人會大大提高智商的上限,做到比數百人會場里智商最高的人更高。“當然,在有AI的幫助下,人的智商上限能提升多少,這個事情是不太確定的。”
進入2024年,大模型競爭愈發激烈。面對大廠的迅猛夾擊,初創公司的生存空間被壓縮。
“競爭是難免的。“閆俊杰感嘆,“中國有些發展很好的行業,像電動車、手機、移動互聯網,都有好幾家公司進行了長期非常激烈的競爭,最終使得中國產品在全球領先。既然其他新興行業發展歷史是這樣的,大模型又有可能產生很大的社會價值,確實也就應該有很多的競爭。這是發展的客觀規律。”
閆俊杰認為,假如一家創業公司在激烈的競爭中打不贏,那么就應該被淘汰。
“當那些比你大好多倍的公司,都開始跟你競爭的時候,就會意識到有些東西是沒用的。因為那些東西大廠比你強百倍千倍。我們能做的就是,把有可能變強的事無限地放大(做強)。歸結起來有兩點,一是技術如何提升,二是如何跟用戶做更好的共創。這兩點都需要一些非常關鍵的判斷,需要靠非常長期的積累。”
▌多模態大模型 意味著底層基礎設施也需要升級
在過去幾個月,視頻生成大模型的賽場非常熱鬧。生數科技打造的視頻大模型Vidu上線;智譜AI正式發布視頻生成大模型“清影”;商湯發布首個面向C端用戶的可控人物視頻生成大模型Vimi;阿里達摩院推出一站式AI視頻創作平臺“尋光”;快手可靈AI正式上線網頁端,并開源名為LivePortrait的可控人像視頻生成框架……
近日MiniMax也發布了首款AI高清視頻生成模型。閆俊杰認為,多模態大模型是必由之路,因為多模態內容是人類交流溝通中的主要部分。
“現在我們每天看的大部分內容,都不是文字,而是一些動態的內容。打開小紅書是圖文,打開抖音都是視頻,甚至打開拼多多買東西,大部分時候也是圖片。對于人類社會,大模型的核心意義做更好的信息處理,大部分的信息體現在多模態的內容里,而不是在文字上,文字很多時候是其中最精華的那么一小部分。為了能有非常高的用戶覆蓋度,有非常高的使用深度,唯一的辦法輸出(多模態)的動態內容,而不只是輸出單純的基于文字的內容,這是一個非常核心的判斷。”
盡管多模態被普遍看好,但業界在探索中也感受到,相比文本模型,視頻生成模型的研發難度顯然更高。
對此,閆俊杰認為,視頻大部分的時候工作復雜度確實比做文本更難,因為視頻的文本天然很長。比如一個視頻涉及千萬的輸入和輸出,天然會很難處理。其次,視頻量很大。又比如5秒的視頻有幾兆,但是5秒看完的文字可能都不到1K,這是幾千倍的存儲差距。這其中的挑戰在于,之前基于文本建的底層基礎設施怎么來處理數據,怎么來清洗數據,怎么來標注,這意味著基礎設施也需要升級。
“此外,還需要更多的耐心。做文字有很多開源的東西,如果基于開源來做研發會更快,但視頻開源的東西沒那么多,需要重新來做,付出的耐心也更大。”
▌客觀來看,價格戰提高了模型的調用量
今年以來,不少大模型企業紛紛開啟價格戰,以換取AI大模型普及度。閆俊杰認為,客觀來看,價格戰確實提高了模型的調用量。
“當國內的模型搞起價格戰后,本來認為大模型很貴的大部分公司,開始發現大模型很便宜,可以放心地使用。最終驚人地發現有了大模型的價格戰之后,很多非常傳統的企業開始非常愿意使用大模型。他們覺得反正成本低,出錯了之后也不要緊,出錯了多調用一次就好了。客觀地來說,這非常大地提高了模型的調用量。”
在國內的模型激烈競爭的局面下,MiniMax正在向海外市場拓展。閆俊杰表示,“正是由于國內的模型這么激烈的競爭,推著大家必須往前趕,至少目前已可以達到在非英語國家的語種上,也能夠跟GPT不相上下的水平。競爭以及各種各樣的事既然不能避免,那就努力做到最好。我們看到樂觀的一面,國內大模型的使用量確實在顯著地增長,并且中國的模型在海外確實越來越具有競爭力,我覺得是兩個積極的變化。”
在具體的商業化模式,閆俊杰介紹,整個公司的商業化可分成兩個形式,一是面向B端的MiniMax開放平臺,二是產品內的廣告機制。
“MiniMax開放平臺現在已經有超過三萬家企業客戶和開發者,包括知名的互聯網公司、傳統的企業等等。用戶會使用我們的聲音跟視覺的能力,因為不是所有的公司都可以自己做,我們是很好的合作伙伴。二是MiniMax的產品里也有廣告機制,可以做商業化的變現。不過,在現階段,最重要的事還不是商業化,是真正地讓技術到達廣泛可用的程度。”
目前,國內已有智譜AI、百川智能、零一萬物、月之暗面、MiniMax、階躍星辰六家獨立大模型創業公司,被稱之為“AI六小虎”。金沙江創投主管合伙人朱嘯虎在接受媒體采訪時直言,大模型太貴了,靠商業化根本養不活自己。這幾家創業公司最好的結果就是賣給大廠。
談及投資人朱嘯虎的言論和大模型商業化的難點,閆俊杰回應稱,這確實是行業考驗,只有通過這一考驗的企業才能成功。
“當產品沒人用的時候,或者當產品不賺錢的時候,這時候肯定是不能怪用戶的。大部分時候只能怪自己的技術做得不夠好,或產品做得不夠好,反正我們是這么來看待這件事的。”
在閆俊杰看來,QQ在2000年也不知道該怎么賺錢,嘗試無數商業化變現的方案都失敗了,但是最終找到了移動增值業務、找到了游戲,都會經歷這樣的過程。“這可以當成對一個行業的考驗,如果能夠通過考驗,就能夠跑出來。如果通不過確實(公司)應該關掉。”
在整個訪談中,對于行業競爭與企業前景,閆俊杰始終顯得比較坦然。“肯定不能怪用戶,也不能怪生態,(許多事)只能怪自己做得不夠好,至少我們一直是在努力的。希望自己能變得更好,這是我們唯一可以做的事。”