DeepSeek 是什麼,它為什麼要顛覆人工智能領域?
中國初創公司 DeepSeek 推出了最新的人工智能模型,稱其成本僅為美國業界領先模型的一小部分,但性能卻與之不相上下,甚至更勝一籌。
該公司在上個月的一篇論文中寫道,DeepSeek-V3 的訓練只需要價值不到 600 萬美元的英偉達 H800 芯片的計算能力,這引起了全球人工智能圈的關注。
由DeepSeek-V3驅動的DeepSeek人工智能助手已超越 ,成為美國蘋果公司應用商店中評分最高的 免費應用。
這引發了人們對一些美國科技公司決定承諾數十億美元人工智能投資背後原因的懷疑,包括英偉達在內的幾家大型科技企業的股票 。
以下是有關這家撼動全球人工智能領域的公司的一些事實。
Deepseek 為何引起轟動?
2022 年末,OpenAI 的 ChatGPT 發布後,引起了中國科技公司 的爭相效仿,他們急於創建自己的人工智能聊天機器人。
但是,在搜索引擎巨頭百度 BIDU發布了中國第一個類似的ChatGPT之後,中國 ,人們普遍對中美企業在人工智能能力上的差距感到失望。
DeepSeek 模型的質量和成本效益顛覆了這種說法。這家中國初創公司表示,DeepSeek-V3 和 DeepSeek-R1 這兩個模型得到了矽谷高管和美國科技公司工程師的一致好評,它們與 OpenAI 和 Meta 最先進的模型不相上下。
它們的使用成本也更低。根據 DeepSeek 官方微信賬號上的一篇文章,上周發布的 DeepSeek-R1 的使用成本比 OpenAI o1 模型低 20 到 50 倍,具體取決於任務。
但也有人公開對 DeepSeek 的成功故事表示懷疑。
Scale AI首席執行官亞歷山大-王(Alexandr Wang)周四在接受CNBC採訪時說,DeepSeek擁有5萬塊英偉達H100芯片,但他沒有提供證據。DeepSeek 沒有立即回應就這一指控發表評論的請求。
伯恩斯坦(Bernstein)分析師周一在一份研究報告中強調,DeepSeek V3 模型的總訓練成本尚不清楚,但遠高於該初創公司所說的用於計算能力的 558 萬美元。分析師還表示,同樣備受贊譽的 R1 模型的培訓成本也未披露。
Deepseek 背後是誰?
根據中國公司記錄,DeepSeek 是一家總部位於杭州的初創公司,其控股股東是量化對沖基金 High-Flyer 的聯合創始人梁文峰。
梁文峰的基金于 2023 年 3 月在其官方微信賬號上宣布 "重新出發",超越交易,集中資源創建一個 "全新的獨立研究小組,探索 AGI 的本質"(人工通用智能)。DeepSeek 于當年晚些時候成立。
ChatGPT 製造商 OpenAI 將 AGI 定義為在最具經濟價值的任務中超越人類的自主系統。
目前還不清楚 High-Flyer 在 DeepSeek 上投入了多少資金。根據中國企業的記錄,高朋公司與 DeepSeek 在同一棟大樓里辦公,它還擁有用於訓練人工智能模型的芯片集群的相關專利。
2022 年 7 月,High-Flyer 的人工智能部門在其官方微信賬號上表示,它擁有並運營著一個由 10,000 個 A100 芯片組成的集群。
北京如何看待 Deepseek?
DeepSeek 的成功已經引起了中國政界高層的關注。據中國國家通訊社新華社報導,1月20日,也就是DeepSeek-R1向公眾發布的當天,創始人梁建章出席了由中國國務院總理李強主持的企業家和專家閉門座談會。
梁建章的出席可能表明,DeepSeek 的成功對中國政府克服華盛頓的出口管制、實現人工智能等戰略產業自給自足的政策目標具有重要意義。
百度首席執行官李彥宏也出席了去年的類似研討會。