上海AI公司开源模型突破技术边界跃居全球第二

近日，上海人工智能企业 MiniMax 推出全球首个开源大规模混合架构推理模型 MiniMax-M1，该模型在多项权威评测中位列全球开源模型第二位。此次突破不仅在技术层面展示了创新实力，也标志着中国在人工智能领域的自主研发能力获得重要进展。

模型核心突破：架构创新与性能领先

MiniMax-M1 基于混合专家架构（MoE）与线性注意力机制构建，支持高达100万 token 的上下文输入，可一次性处理如《三体》英文原著等长文本内容，长度处理能力达到同类主流模型的8倍。在输出方面，M1 支持8万 token 生成，优于谷歌 Gemini2.5Pro 的6.4万 token，适用于技术文档撰写、创意写作等需生成长篇内容的场景。

除性能卓越外，M1 在推理效率方面表现突出。在处理8万 token 深度推理任务时，其算力消耗仅为同类模型的30%，训练成本控制在了53.5万美元，远低于行业平均水平。

👉 查看最新开源模型技术解析

多模态能力突破：视频生成达到新高度

继 M1 发布后，MiniMax 连续推出视频生成模型 Hailuo 02、通用智能体及音色设计工具，形成密集的产品矩阵。其中，Hailuo 02 在视频生成领域实现重大突破，尤其在动态模拟与物理规律还原方面表现出色。

在对比测试中，Hailuo 02 生成的“猫跳水”视频呈现完整的三周半翻转动作并优雅入水，而同类模型生成的视频则出现动作失真、逻辑混乱等问题。该视频在社交平台发布后获得超3亿播放量，并带动“动物奥运会”成为AI视频创作的新类别。

技术背后的打磨与坚持

MiniMax 在模型训练过程中强调多学科协同。技术团队与艺术导演、编剧等专业人员共同协作，提出三项核心要求：电影级视觉质感、高动态复杂动作的支持，以及实际影视素材中5%的可直接用片率。通过高质量训练数据、NCR创新架构及精细的流程控制，团队在提升3倍参数规模与4倍训练数据的同时，实现效率提升2.5倍。

这种坚持技术驱动与效果优先的理念，使得其视频生成应用 Hailuo AI 自去年起持续位列全球排行榜首，已为来自200个国家和地区的用户生成超过3.7亿个视频。

逆行与坚守：技术路线的差异化选择

在全球大模型行业普遍收缩、多数公司转向行业落地之际，MiniMax 仍坚持基座模型的研发。其技术路线凸显前瞻性：

2023年率先转向 MoE 架构，较早放弃传统稠密架构；
成功将线性注意力机制投入大规模商业化应用，显著降低长文本算力消耗；
提出 CISPO 强化学习方法，提升长推理任务中的逻辑连贯性。

行业生态与未来布局

作为上海人工智能领域的代表企业之一，MiniMax 与上海人工智能实验室、商汤科技、阶跃星辰等共同构成多元协同的大模型研发阵营。与此同时，上海市推出《“模塑申城”实施方案》，明确2025年底建成世界级人工智能产业集群的目标，包括建设多个模型创新孵化器与赋能中心。

常见问题

Q1：什么是 MoE 架构？它有什么优势？
MoE（Mixture of Experts）是一种将模型拆分为多个子网络的结构，根据任务动态调用相关“专家”，显著提升计算效率，适合处理大规模多样化任务。

Q2：Hailuo 02 在视频生成中的主要突破是什么？
该模型在动态模拟、复杂运动还原和物理规律遵循方面实现突破，能够生成更具逻辑性和视觉一致性的视频内容，尤其在处理高难度动作时表现优异。

Q3：为何 MiniMax 能在算力成本上实现优化？
通过线性注意力机制和 MoE 架构，模型在长序列处理中算力呈线性而非平方级增长，大幅降低训练与推理的资源消耗。

Q4：开源模型 M1 适合哪些应用场景？
适用于长文本摘要、编程辅助、剧本创作、技术文档生成等任务，尤其擅长处理需长上下文支持的应用。

Q5：MiniMax 如何保障生成内容的质量？
采用多学科协作机制，结合艺术审美与技术优化，在数据构建、算法设计及训练流程各环节严格把控质量。

Q6：中国大模型目前在全球处于什么水平？
以 MiniMax 为代表的团队在部分细分任务上已达到国际领先水平，尤其在开源模型、多模态生成等领域进步显著，逐步形成自身技术特色与生态影响力。

面向未来，大模型技术仍处于快速演进阶段。MiniMax 强调持续提升模型能力与商业闭环的双重目标，致力在高速发展的AI行业中保持竞争力与创新性。

👉 探索更多AI模型实战应用方法