清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

智能相对论

2024-04-03

0 评论 896 浏览 2 收藏

13 分钟

生成式AI过去一年群雄逐鹿，大家都在卷参数卷表达，但Kimi的入局，让大家好像突然找到了方向——原来“长文本”才是大家需要的。于是各个大模型都开始卷入长文本大战，但方向对了吗？且看作者的分析。

Long-LLM（长文本大模型）时代似乎来得有些突然，而引爆这场热潮的，竟是一家由清华学霸牵头的本土AI初创企业。

前不久，月之暗面（Moonshot AI）公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持200万字无损上下文输入。

对比去年10月份Kimi上线时仅支持的20万字，这一波升级直接提升了10倍文本处理能力，同时也引起了强烈的市场反应，特别是在资本市场，Kimi概念股应运而生，诸如九安医疗、华策影视、中广天择等都受益于Kimi概念而实现了股价不同程度的涨幅。

这些刺激更让大模型领域彻底卷起了长文本大战。

01 “长文本”大战，卷的不是字数而是财力

阿里率先完成自家的大模型产品升级，强化长文本处理能力，免费面向大众开放最高1000万字的长文本处理能力。

360则紧随其后，宣布旗下360智脑正式内测500万字的长文本功能，并在360AI浏览器开放给用户使用。

而百度也宣布在下个月进行版本升级，开放长文本能力，文字范围会在200万-500万字。

目前，文心一言的文本上限大致为2.8万字。而像GPT-4Turbo-128k公布的文本范围也不过为10万汉字，Claude3200k上下文约16万汉字。

可以说，这一波热潮直接把国内的大模型厂商一下子都拉进了百万量级的长文本竞赛，而主流厂商的入局也为这场“长文本”大战增添了很多看头。

目前来看，“长文本”大战的赛点主要呈现在两个方面。

一方面，是大模型的支持文本参数。类似阿里通义千问的1000万字、360智脑的500万字、百度文心一言的200万-500万字、Kimi的200万字等等，都在极力向市场争“彩头”，告诉用户自家的长文本处理能力足够“长”。

另一方面，是长文本处理能力的开放程度。有意思的是，Kimi是免费开放给用户使用的，阿里通义千问的长文本处理功能也是免费的，360智脑、百度文心一言也没有要收费的意思。——以“长文本”大战为例，今年的大模型竞争远比去年要“卷”得多。

还记得去年大火的妙鸭相机，以及各式各样的图片生成式服务，都或多或少地通过各种形式如充值、办会员等，要求用户付费才能体验。

今年大模型领域的这把“火”烧得旺，也烧的离奇地“free”。

为什么？

Kimi自升级以来，就有大量用户不断涌入，激增的流量更是一度让月之暗面（Moonshot AI）的服务器承受了巨大的压力，一度陷入宕机，旗下的App和小程序都无法正常使用。

根据月之暗面（Moonshot AI）发布的官方消息，从3.20观测到流量异常增高后，已经进行了5次扩容工作。推理资源会持续配合流量进行扩容，以尽量承载持续增长的用户量。

简单来说，用户对长文本功能是非常有兴趣的，相关的市场需求还在保持持续性的、爆炸性的增长。同时，大量的用户涌进，不仅提高了大模型产品的知名度，更重要的是在大量用户的基础上通过类似于UGC的模式去探索大模型的应用，或许更能进一步推动Long-LLM（长文本大模型）的商业化进程。

当然，在这个过程中，不可避免地就得投入大量资金，一旦商业化加速，大模型厂商就得做好“卷”财力的准备。

阿里通义千问目前免费对所有人开放高达万页的文档处理能力，如果要计算成本，按照目前最便宜的市价0.1元/页，10000页的文档光解析费用就要1000元，这还不包括解析完成之后大模型处理文档的成本。考虑到通义千问网页、APP、钉钉等多个端口的用户基数，需要投入的资金恐怕不会是个小数目。

大模型的商业化在开始阶段并非“赚钱”，而是“烧钱”。

02 长文本，直接“接驳”商业化场景

在大模型的商业化进程上，长文本的爆火是很关键的一环。

就大模型的技术原理而言，解决长文本问题是必要的。因为文本长度的提高，对应的模型能解决问题的边界也将大幅提升，两者呈现出明显的正向关系。

传统的文本处理模型受限于训练结构，可支持的文本范围都不算长，在处理复杂任务和深度专业知识（这一类知识往往都是长篇巨著）时，只能拆解输入训练，由此就有可能导致输出的结果上下文逻辑不连贯不顺畅等问题。

区别于传统的文本处理模型，长文本模型就具备更准确的文本理解和生成能力以及更强大的跨领域迁移能力。这对于打造垂直领域的行业专家是一个非常必要的能力支持，比如面向一些长篇巨制的医疗文献、法律文件、财务报告等，长文本模型就具备更好的理解能力，对应完成跨领域学习和应用，从而打造出更专业的医疗助理、法律助理以及金融助理等应用。

话不多说，实践一下。

在这里，「智能相对论」向阿里通义千问相继“投喂”了几本长达数百页的专业书籍，涵盖以《高产母猪饲养技术有问必答》为代表的农业养殖、以《犬猫营养需要》为代表的宠物喂养等等小众领域。

结果所能实现的效果确实令人惊讶，阿里通义千问不仅能高度概括总结这些长篇巨著的主要内容，还能有针对性的给出具体篇章的知识解答。比如，在《高产母猪饲养技术有问必答》一书中，「智能相对论」向其提问“夏季高温提问应该如何饲养母猪？”很快就得到了书中的精炼解答。