阿里巴巴董事會主席蔡崇信週三在巴黎舉行的VivaTech科技大會上表示,中國充滿活力的消費互聯網環境,加上本地工程師之間激烈的競爭文化,正不斷推動中國在AI領域的創新。他透露,阿里巴巴是在DeepSeek發佈R1模型之後,才意識到自己在AI領域已經落後了,工程師們取消了假期,在春節假期期間繼續工作,奮起直追,才有了後來的Qwen系列模型的推出。蔡崇信說,阿里巴巴選擇將Qwen系列模型開源的原因之一,是爲了推動AI應用的普及,讓更多人都能使用AI,而這將有利於公司的雲計算業務。
媒體報道,DeepSeek今年1月推出的低成本、功能強大的人工智能模型震驚了全球科技行業後,$阿里巴巴 (BABA.US)$集團的工程師們取消了假期,在春節假期期間繼續工作,奮起直追,連夜加班趕進度。
$阿里巴巴-W (09988.HK)$董事會主席蔡崇信(Joe Tsai)週三在巴黎舉行的VivaTech科技大會上表示,中國充滿活力的消費互聯網環境,加上本地工程師之間激烈的競爭文化,正不斷推動中國在AI領域的創新。
他透露,阿里巴巴是在DeepSeek發佈R1模型之後,才意識到自己在AI領域已經落後了。他舉例說明了中國科技行業競爭的激烈程度:
「我們看了那篇論文,心想:『天啊,怎麼我們落後了?我們之前也在做這些事情啊,』結果就是,我們的工程主管決定說:『取消春節假期,所有人都留在公司,加班睡辦公室,我們要加速開發進度。』幾周之內,我們就推出了自己的版本,也就是Qwen系列模型。它非常具有競爭力」。
在那之後,阿里巴巴以極快的速度不斷推出新模型,全面轉向聚焦人工智能,特別是通用人工智能(AGI)。根據Hugging Face的排名,目前阿里巴巴的Qwen系列模型是全球最受歡迎的開源大型語言模型之一。公司還承諾在未來三年內投入超過3800億元人民幣(約合530億美元),用於建設包括數據中心在內的AI基礎設施。
蔡崇信還說,開源大型語言模型(LLMs)將帶動人工智能應用的激增,並推動雲計算需求的增長。目前,阿里巴巴正經歷「一個巨大考驗的時期」之後,進一步聚焦自身龐大業務帝國的重心。
他說,阿里巴巴選擇將Qwen系列模型開源的原因之一,是爲了推動AI應用的普及,讓更多人都能使用AI,而這將有利於公司的雲計算業務。
「我們從開源中獲得的好處在於,它會帶動對AI的需求,會產生更多的訓練需求,未來我們還會看到大量推理(inference)方面的需求。」
蔡崇信今年早些時候曾表示,阿里巴巴已與蘋果公司建立合作,爲iPhone提供AI技術。
儘管如此,阿里巴巴在AI領域的大規模投資回報目前仍不確定,該公司2024年第一季度的銷售額僅同比增長7%。
回顧自己在2023年年中重新出任阿里巴巴領導職位的經歷,蔡崇信坦言,當時阿里巴巴面臨多重挑戰,導致阿里經歷了「一個巨大的考驗時期」:「我當時看到的是一家有些迷失方向的公司。我覺得我們擴張得太快了。」
作爲與馬雲共同創辦阿里巴巴的創始成員之一,儘管蔡崇信近來開始更加坦率地談論公司所經歷的困難,但同時也表達了對未來發展的樂觀態度。上個月在澳門舉辦的一場科技大會上,他曾提到阿里巴巴經歷了一系列挫折,但也強調公司「正走在一條非常好的路上」。
編輯/Jeffy