//電報內容
【MiniMax發布推理模型對標DeepSeek 算力成本僅約53萬美元】財聯社6月17日電,MiniMax6月17日宣布將連續五天發布重要更新。今天第一彈是開源首個推理模型MiniMax-M1。根據官方的報告,MiniMax-M1多項基準測試比肩DeepSeek-R1、Qwen3等開源模型,接近海外的最領先模型。官方博客還提到,基于兩大技術創新,MiniMax-M1訓練過程高效得“超出預期”,只用了3周時間、512塊H800 GPU就完成強化學習訓練階段,算力租賃成本僅53.47萬美元。這比一開始的預期少了一個數量級。
//解讀摘要
支持上下文長度達DeepSeek R1八倍!MiniMax發布首個推理模型M1,機構稱本地推理需求的增加將促進ASIC市場需求擴容,這家公司的設備可應用于ASIC的電子裝聯和封裝環節,另一家掌握的技術可將光芯片或光模塊與ASIC控制芯片封裝在一起。