財聯社1月27日報道,國產大模型公司杭州深度求索開發的AI應用程式Deepseek,登頂蘋果中國地區和美國地區應用商店App Store免費APP下載排行榜,在美國地區下載榜上超越了ChatGPT。
杭州深度求索於本月20日正式發表推理大模型DeepSeek-R1,甫推出便憑藉其「物美價廉」的特性,在海外開發者社群中引起了轟動。
作為開源模型,DeepSeek-R1在數學、程式碼、自然語言推理等任務上的表現,能比肩OpenAI o1模型正式版,並採用MIT授權協議,支援免費商用、任意修改和衍生開發等。
目前,在大模型排名榜Chatbot Arena上,DeepSeek-R1的基準測試排名已升至全類別大模型第三,與OpenAI的ChatGPT-4o最新版並列;並且在風格控制類模型(StyleCtrl)分類中與OpenAI o1模型並列第一。
據DeepSeek介紹,R1的預訓練費用僅557.6萬美元;而在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上執行55天完成,僅是OpenAI GPT-4o模型訓練成本的不足十分之一。
https://www.hk01.com/article/1097855?utm_source=01articlecopy&utm_medium=referral