《路透社》(Reuters)今日稍早報導,「DeepSeek」所開發的新AI系統是由「DeepSeek-V3」的模型所支持;其開發者聲稱,該模型「在開源模型中名列前茅,可與全球最先進的閉源AI模型競爭」,因此其受歡迎的程度在美國用戶中迅速飆升。
據報導,美國調研機構與流量分析工具「Sensor Tower」的數據顯示,自1月10日發布以來,「DeepSeek AI」助手在美國用戶內的受歡迎程度急劇上升;這樣的里程碑凸顯了「DeepSeek」如何在矽谷巨頭間留下了深刻的印象,更顛覆人們對美國在AI領域佔據主導地位的普遍看法;還有華盛頓當局對先進晶片出口中國管制的有效性。
報導指出,從「ChatGPT」到「DeepSeek」的AI模型,都仰賴高性能的晶片進行訓練;然而美國前任總統拜登的政府從2021年以來,就不斷擴大對中國出口晶片的禁令,旨在阻止中國的公司訓練AI 模型的能力。
不過,「DeepSeek」的研究人員在上個月所發表的一篇論文中寫道,「『DeepSeek-V3』使用輝達(Nvidia)的H800晶片進行訓練,耗資不到600萬美元(約1.96億新台幣)」。
報導提到,儘管這一項細節仍存在爭議,但據稱H800晶片的性能,不如美國試圖限制中國取得的最先進晶片,而且訓練成本相對較低,但卻已引起美國高科技業界的主管們,質疑出口管制措施的有效性。