Liquid AI发布LFM2.5-230M最小模型：以四分之一规模击败四倍大模型-AI资讯-广州文趣文化传播有限公司

全部 AI大厂大模型 AI智能体 AI绘画 AI视频 AI音乐 AI硬件泛AI领域

LFM2.5-230M：小模型大智慧的技术突破

2026年6月25日，Liquid AI在VentureBeat上正式发布了其最小的AI模型——LFM2.5-230M。这款模型仅包含2.3亿（230M）个参数，在今天的AI大模型领域堪称"袖珍"——相比之下，主流大模型的参数规模通常在数十亿到数千亿之间。然而，在标准化的数据提取任务评测中，LFM2.5-230M以明显优势击败了参数量超过10亿的竞争对手模型，准确率高出约12个百分点。

LFM2.5-230M的核心技术来源于Liquid AI独创的"液体神经网络"架构。与传统的Transformer架构不同，液体神经网络的神经元具有动态的计算特性——每个神经元的连接权重可以根据输入数据的特点实时调整，使模型能够以更少的参数实现更高的表达能力。这种"以巧取胜"的路线为AI效率提升开辟了全新的方向。

具体来说，LFM2.5-230M在数据提取任务上的表现尤为突出。在从非结构化文档（如PDF、网页、电子邮件）中提取结构化信息（如姓名、日期、金额、地址等）的测试中，模型的F1分数达到了93.7%，远高于10亿参数级别对比模型（86.2%）。更令人印象深刻的是，模型的推理速度是对手的5倍以上，内存占用仅为对手的20%。

"更大不等于更好"：AI效率革命的产业逻辑

LFM2.5-230M的成功发布再次验证了AI行业正在经历从"规模竞赛"到"效率革命"的范式转变。过去几年，AI大模型领域的竞争逻辑是"更大的模型=更好的性能"——从GPT-3的1750亿参数到GPT-4传闻中的数万亿参数，从Google PaLM的5400亿参数到DeepSeek V3的6710亿参数（MoE架构），行业的注意力几乎完全集中在"谁能造出最大的模型"上。

然而，这种"越大越好"的逻辑正在面临一系列现实挑战。首先是经济成本问题——训练一个顶级大模型的成本已经从GPT-3时代的数千万美元飙升到了数亿美元甚至更高，只有极少数科技巨头和资金充足的创业公司能够参与这场游戏。其次是部署成本问题——大模型在推理阶段的高昂计算成本严重限制了其大规模商业应用。最后是环境问题——大模型训练和推理的能耗已经成为不可忽视的环境负担。

Liquid AI的小模型路线提供了解决这些问题的全新思路。通过在架构层面的根本性创新，Liquid AI证明了在特定任务场景下，精巧设计的"小模型"可以超越粗放式的"大模型"。这为AI应用的普及化和平民化开辟了新的可能性——更多企业可以在合理的成本范围内部署和使用AI能力。

数据提取场景：小模型的"杀手级应用"机会

LFM2.5-230M选择数据提取作为突破场景具有清晰的战略眼光。数据提取是企业AI应用中最刚需、最普遍的场景之一。据市场调研数据，全球企业在数据管理和提取方面的年支出超过800亿美元，且随着企业数字化转型的深入呈持续增长趋势。从发票处理、合同审查到客户数据管理，几乎每个行业都需要从非结构化文档中提取结构化信息。

传统的解决方案要么依赖规则驱动的模板匹配（灵活性差，维护成本高），要么使用通用大模型（成本高、推理速度慢）。LFM2.5-230M在准确率接近甚至超过大模型的同时，大幅降低了成本和延迟，为这个庞大的市场提供了更具性价比的解决方案。据Liquid AI测算，使用LFM2.5-230M的企业客户可以将数据提取环节的成本降低70%-80%。

Liquid AI正在与多家企业级软件公司合作，将LFM2.5-230M集成到文档管理、ERP和CRM系统中。合作反馈显示，在W-2表格、采购订单、医疗记录等标准化文档的数据提取场景中，LFM2.5-230M的表现已经达到甚至超过了人工处理的水平，处理速度则是人工的100倍以上。

对AI产业生态的深远影响：从"巨量垄断"到"精巧多元"

LFM2.5-230M的成功对AI产业生态的意义超越了单一的技术突破。它代表了一种与当前主流"大模型中心主义"截然不同的技术路线——小而精、专而深。在大模型军备竞赛愈演愈烈的当下，小模型路线的成功证明了"规模"并非AI能力的唯一路径。

这一趋势对AI产业生态的影响将是深远的。对于AI开发者而言，小模型将进一步降低AI应用的门槛——在边缘设备、移动端和IoT设备上运行AI推理成为可能。对于AI投资者而言，小模型创业公司的投资价值正在上升，特别是那些在特定垂直场景中实现突破的"小而美"企业。对于AI用户而言，更多的选择意味着可以根据具体需求和预算选择最合适的AI工具，而不必盲目追求"最强最大"的模型。

当然，小模型也并非万能。LFM2.5-230M的优势主要体现在特定任务上的效率和精度，在通用知识覆盖、复杂推理和创造性生成等维度上，它仍然无法与千亿参数级别的大模型相提并论。最理想的未来图景是"大模型+小模型"混合架构——在需要广泛知识的场景使用大模型，在需要高效执行的场景使用小模型，实现AI能力的最优配置。

来源：VentureBeat、Liquid AI官方博客、MIT Technology Review、ArXiv、Analytics India Magazine

发布时间：2026-06-26

←剪映集成Sora 2与Veo 3.1：AI视频创作进入"多模型选择"时代

腾讯云推出新AI Agent驱动东南亚创新：中国云服务出海加速→