2025.01.29 16:30 臺北時間

又有新AI模型問世!阿里巴巴發表Qwen 2.5-Max 稱表現上優於DeepSeek V3

mm-logo
時事
又有新AI模型問世!阿里巴巴發表Qwen 2.5-Max 稱表現上優於DeepSeek V3

記者洪宗荃/綜合報導

中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。

阿里雲近日發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型。(圖/翻攝自微博)

根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。

阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。

阿里雲表示,基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3。(圖/翻攝自微博)

在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。

阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。(圖/翻攝自微博)

根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。

◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。

更多FTNN新聞網報導
DeepSeek導致輝達股價大波動!他直問「所以AI算力瞬間過剩?」 網: 漲跌不需理由
從DeepSeek震撼彈中醒來!輝達自信聲明:AI晶片需求只會更多
低成本Deepseek突破美國晶片封鎖?科技專家「高度存疑」:別忘算力限制

更新時間|2025.01.29 17:00 臺北時間
延伸閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀