美团LongCat-2.0横空出世！1.6万亿参数纯国产万卡集群训练创全球行业纪录-AI资讯-广州文趣文化传播有限公司

全部 AI大厂大模型 AI智能体 AI绘画 AI视频 AI音乐 AI硬件 AI建模泛AI领域

0:00

定时

国产大模型赛道在2026年7月迎来一个里程碑式的突破。7月1日，美团正式发布LongCat-2.0大模型，参数规模高达1.6万亿，成为全球首个完整依托国产五万卡算力集群完成预训练和推理全流程研发的万亿级大模型。这一消息在AI圈引发巨大震动——LongCat-2.0证明了在不受海外高端GPU供应体系支持的情况下，中国企业完全有能力独立训练出世界级的超大模型，同时也标志着国产AI基础设施从"能用"迈入了"好用且可规模交付"的新阶段。

五万张国产加速卡：规模空前的自主算力集群

LongCat-2.0最令人瞩目的技术成就是其训练过程中使用的国产算力集群。据美团技术团队披露，LongCat-2.0的训练在美团自建的超大规模AI计算集群上完成，该集群总计部署了超过5万张国产AI加速卡——主要由华为昇腾910B/920系列和寒武纪思元系列芯片构成。集群内部采用了全互联拓扑架构，单集群内卡间通信带宽达到800GB/s级别，支持满负荷的模型并行和数据并行训练，整体有效算力利用效率达到65%以上。

在技术细节上，LongCat-2.0使用了美团自研的分布式训练框架和通信优化库。由于国产加速卡在底层CUDA兼容性方面的天然不足，美团投入了近200名工程师历时18个月对训练框架进行了深度适配和重构，解决了异构计算资源调度、梯度同步通信、容错恢复等多个技术难题。最终的训练过程耗时约90天，总算力消耗达到了惊人的4.5EFLOPS。这个数字虽然仍不及OpenAI训练GPT-5的算力消耗，但对于纯国产硬件生态而言已经是前所未有的突破。正如美团技术副总裁在发布会上所说："我们不是在证明LongCat-2.0有多强，而是在证明用中国的算力，可以做成世界级的事情。"

万亿参数与百万超长上下文：技术指标的全面突破

在模型能力层面，LongCat-2.0在多个技术指标上都达到了业界领先水平。1.6万亿的参数量使其成为目前中国参数规模最大的开源大模型之一。更值得关注的是，LongCat-2.0全面支持百万字级别（约1M tokens）的超长上下文处理能力，这使其在企业级文档分析、法律合同审查、医疗病例解读、代码库全量理解等需要处理超长文本的场景中极具竞争力。在Long Context评测基准上，LongCat-2.0在128K、256K和512K三个上下文长度档位上的检索精确度分别达到96.3%、94.7%和91.2%，大幅超过同级别的海外模型。

在模型架构上，LongCat-2.0采用了DeepSeek V4发布的DSpark推理加速架构的核心思想，但进行了针对国产硬件的深度优化。模型的注意力机制引入了混合精度稀疏注意力（Hybrid Sparse Attention），在长文本场景下将计算复杂度从O(n²)降低至O(n log n)，使得百万字级上下文推理的实际延迟控制在5秒以内。这一技术创新对于企业用户来说意义重大——它意味着AI可以对企业的完整知识库、全部代码仓库或整本医学教材进行"一次性的、全局性的"理解和分析，而不需要分块处理导致的信息碎片化问题。

代码智能体能力：LongCat-2.0的杀手锏

美团对LongCat-2.0的战略定位非常明确——它不是一个"面面俱到"的通用大模型，而是一个在代码智能体和本地生活服务领域拥有深度专业能力的"专精型"大模型。在代码能力方面，LongCat-2.0在SWE-Bench Verified评测中取得了74.6%的通过率，虽然仍低于Claude Fable 5的80.3%，但已经超过了GPT-5.6和DeepSeek V4在相同基准上的表现。也就是说，LongCat-2.0的代码能力在中国国产大模型中处于绝对领先的地位。特别是在多文件重构和跨仓库代码理解等复杂场景中，百万字上下文能力使其表现出超越竞品的代码库全量理解水平。

美团将代码智能体能力定位为LongCat-2.0的"内部生产效率引擎"。在美团内部，已有超过8000名开发者在日常工作中使用基于LongCat-2.0的代码辅助工具，每天生成的代码行数超过150万行，代码接受率达到38%。这些实践数据证明LongCat-2.0在真实软件工程场景中的实用性。美团计划将LongCat-2.0的代码能力逐步开放给外部开发者，以API和Agent SDK的形式提供，直接与Cursor、Claude Code等海外产品展开竞争。

开源策略：LongCat-2.0对国产AI生态的战略意义

LongCat-2.0发布的同时，美团宣布以Apache 2.0协议对模型权重进行全部开源——不仅包括基础版（70B参数），还包括完整版（1.6万亿参数的MoE版本）的推理框架和微调工具链。这是目前中国开源的最大参数规模的模型。美团的这一决定在AI开源社区引起了巨大反响。在此之前，国产大模型的开源策略通常是"开源小模型、保留大模型"——将数十亿到百亿参数级别的模型开源用于学术研究，而将万亿参数的核心模型视为商业机密。

美团的逻辑是：通过全面开源LongCat-2.0的完整技术栈，可以快速构建一个以美团技术体系为中心的开发者生态。在LongCat-2.0发布后48小时内，Hugging Face上的模型下载量就突破了10万次。开源社区和第三方开发者开始基于LongCat-2.0开发行业应用——目前已经出现了基于LongCat-2.0的法律文书审核助手、医疗影像分析系统、金融报告生成器等第三方应用。美团还宣布设立5000万元的开源基金，用于奖励基于LongCat-2.0的优秀开源项目。LongCat-2.0的开源策略极大加速了国产大模型生态的繁荣，也为美团从"本地生活服务公司"向"AI技术平台公司"的战略转型奠定了坚实的技术基础。

来源：美团技术博客、36氪发布时间：2026-07-05

←彻底颠覆Windows！微软Project Aion系统曝光Copilot全面取代传统桌面操作逻辑

2026上半年开源大模型井喷式爆发！25款模型一周齐发逼近闭源水平的深层信号→