上海AI公司开源模型突破技术边界跃居全球第二

·

近日,上海人工智能企业 MiniMax 推出全球首个开源大规模混合架构推理模型 MiniMax-M1,该模型在多项权威评测中位列全球开源模型第二位。此次突破不仅在技术层面展示了创新实力,也标志着中国在人工智能领域的自主研发能力获得重要进展。


模型核心突破:架构创新与性能领先

MiniMax-M1 基于混合专家架构(MoE)与线性注意力机制构建,支持高达100万 token 的上下文输入,可一次性处理如《三体》英文原著等长文本内容,长度处理能力达到同类主流模型的8倍。在输出方面,M1 支持8万 token 生成,优于谷歌 Gemini2.5Pro 的6.4万 token,适用于技术文档撰写、创意写作等需生成长篇内容的场景。

除性能卓越外,M1 在推理效率方面表现突出。在处理8万 token 深度推理任务时,其算力消耗仅为同类模型的30%,训练成本控制在了53.5万美元,远低于行业平均水平。

👉 查看最新开源模型技术解析


多模态能力突破:视频生成达到新高度

继 M1 发布后,MiniMax 连续推出视频生成模型 Hailuo 02、通用智能体及音色设计工具,形成密集的产品矩阵。其中,Hailuo 02 在视频生成领域实现重大突破,尤其在动态模拟与物理规律还原方面表现出色。

在对比测试中,Hailuo 02 生成的“猫跳水”视频呈现完整的三周半翻转动作并优雅入水,而同类模型生成的视频则出现动作失真、逻辑混乱等问题。该视频在社交平台发布后获得超3亿播放量,并带动“动物奥运会”成为AI视频创作的新类别。


技术背后的打磨与坚持

MiniMax 在模型训练过程中强调多学科协同。技术团队与艺术导演、编剧等专业人员共同协作,提出三项核心要求:电影级视觉质感、高动态复杂动作的支持,以及实际影视素材中5%的可直接用片率。通过高质量训练数据、NCR创新架构及精细的流程控制,团队在提升3倍参数规模与4倍训练数据的同时,实现效率提升2.5倍。

这种坚持技术驱动与效果优先的理念,使得其视频生成应用 Hailuo AI 自去年起持续位列全球排行榜首,已为来自200个国家和地区的用户生成超过3.7亿个视频。


逆行与坚守:技术路线的差异化选择

在全球大模型行业普遍收缩、多数公司转向行业落地之际,MiniMax 仍坚持基座模型的研发。其技术路线凸显前瞻性:


行业生态与未来布局

作为上海人工智能领域的代表企业之一,MiniMax 与上海人工智能实验室、商汤科技、阶跃星辰等共同构成多元协同的大模型研发阵营。与此同时,上海市推出《“模塑申城”实施方案》,明确2025年底建成世界级人工智能产业集群的目标,包括建设多个模型创新孵化器与赋能中心。


常见问题

Q1:什么是 MoE 架构?它有什么优势?
MoE(Mixture of Experts)是一种将模型拆分为多个子网络的结构,根据任务动态调用相关“专家”,显著提升计算效率,适合处理大规模多样化任务。

Q2:Hailuo 02 在视频生成中的主要突破是什么?
该模型在动态模拟、复杂运动还原和物理规律遵循方面实现突破,能够生成更具逻辑性和视觉一致性的视频内容,尤其在处理高难度动作时表现优异。

Q3:为何 MiniMax 能在算力成本上实现优化?
通过线性注意力机制和 MoE 架构,模型在长序列处理中算力呈线性而非平方级增长,大幅降低训练与推理的资源消耗。

Q4:开源模型 M1 适合哪些应用场景?
适用于长文本摘要、编程辅助、剧本创作、技术文档生成等任务,尤其擅长处理需长上下文支持的应用。

Q5:MiniMax 如何保障生成内容的质量?
采用多学科协作机制,结合艺术审美与技术优化,在数据构建、算法设计及训练流程各环节严格把控质量。

Q6:中国大模型目前在全球处于什么水平?
以 MiniMax 为代表的团队在部分细分任务上已达到国际领先水平,尤其在开源模型、多模态生成等领域进步显著,逐步形成自身技术特色与生态影响力。


面向未来,大模型技术仍处于快速演进阶段。MiniMax 强调持续提升模型能力与商业闭环的双重目标,致力在高速发展的AI行业中保持竞争力与创新性。

👉 探索更多AI模型实战应用方法