DeepSeek R1 升級後表現驚人：數學與程式能力躍升，逼近國際頂尖水平

來源： ETtoday

中國大陸AI新創公司DeepSeek發布了DeepSeek-R1模型的升級版DeepSeek-R1-0528，該模型在數學、寫程式和通用邏輯等多個基準測評中取得優異成績，接近國際頂尖模型如o3與Gemini-2.5-Pro。新版模型在推理深度、幻覺率降低和長篇作品輸出等方面均有顯著提升。

重點整理

DeepSeek-R1-0528在多個基準測評中表現優異，接近國際頂尖模型。

新版模型在AIME2025測試中的準確率從舊版的70%提升至87.5%。

新版模型在推理過程中使用更多tokens，表明思考更為深入。

新版模型對於幻覺問題的優化顯著，幻覺率降低45-50%。

新版模型在長篇作品輸出方面有所提升，風格更加貼近人類偏好。

DeepSeek-R1-0528的思維鏈對學術界和工業界具有重要意義。

#科技

#人工智能

#軟體開發

找不到符合尺寸 300 x 250 的素材