别硬把大模型往手机里塞

2 评论 1662 浏览 4 收藏 14 分钟

越来越多手机厂商将目光瞄向了AI大模型,那么,在手机上运行大模型这件事,可能会遇到哪些方面的挑战?手机厂商们是否思考清楚了“把大模型装进手机里”这个动作的背后意义?一起来看看作者的分析。

商业迷雾当中,那些看似金光闪闪的“机会”,往往是一把将人们困住的镣铐。

CNBC最新消息称,全球芯片巨头高通打算在加州两大据点砍掉约1258名员工。事实上,高通早就向加州就业部门送交了这份“死亡名单”:圣迭戈1064名、圣克拉拉194名。这场人事地震预计将在12月13日爆发。

高通上个季度的报告中,已经暗示了这次“血洗”。从财务结构来看,手机芯片是高通的主要收入来源,占比超过一半,但在三季度里收入同比下降了21.6%。智能手机市场的饱和,像一把无形的大手,正在悄悄扼杀上游供应链的巨头。

手机市场的增长现在主要依赖于设备的升级周期。自2019年以来,受5G驱动的手机更换热潮已经持续了近四年。但Counterpoint的资深分析师Peter Richardson却揭示了一个冷酷的事实:到2022年时,全球手机更换周期已达到史上最长的43个月。

过去五年,手机界苦苦追寻创新之路,急于改变僵局。但当连Apple这样的市场领导者也难以拿出令人震撼的新功能时,其他厂商更是难以维持其市场地位。越来越多的消费者开始质疑,换一部新手机的价值究竟在哪?

有行业专家指出,真正的破局点或许是软件,尤其是AI领域像LLM、Transformer等大模型背后蕴藏着的力量。

尽管目前还不清楚,该如何最大化地利用这些潜力,但这并不妨碍国内手机巨头试图突围。华米OV等都把目光瞄准了AI大模型,迫切要开辟一个新战场。

一、手机巨头争斗大模型赛场

一时之间,国内手机厂商好像都追起了大模型的风头。

8月14日,小米年度发布会上,小米AI大模型亮相,霎那之间成为焦点。在C-Eval、CMMLU两大测试平台上,它分别斩获第十名和中文榜首的佳绩。

雷军信心满满地宣布,小米的这个13亿参数大模型已经在手机端完美运行,其实力在某些场景中甚至能与60亿参数的云端模型匹敌。而家喻户晓的小爱同学也将强化AI大模型的能力,邀请测试已在发布会当天拉开序幕。

瞄准AI大模型的狼烟不只在小米一处升起。

早在8月4日的2023年华为开发者大会,余承东就大手一挥,宣布HarmonyOS 4将受益于“盘古大模型”的加持。与众不同的是,华为决定将大模型深度整合进手机系统,实现更高层次的融合。

继华米之后,vivo和OPPO亦不断展露其对大模型领域的雄心。

近期,OPPO宣布对其全新“小布助手”进行首轮公开测试,引发业内关注。此产品基于了AndesGPT大模型技术。

AndesGPT模型出自OPPO旗下安第斯智能云团队之手,其核心是一个基于混合云架构的高级生成式大语言模型。用户可以通过唤醒小布语音助手并说出“小布大模型”,参与小布1.0公测版报名。更多信息将在11月16日的ColorOS 14发布会上公布。

与同行的宣传异曲同工,AndesGPT在其官方介绍中也荣获了“行业翘楚”等封号,此模型在多个权威评测榜单上频频亮相。

另一个战线上,vivo已锁定11月1日,要召开年度开发者大会。此番集结,vivo将揭晓其独家研发的AI大模型与全新操作系统;而广受瞩目的OriginOS 4也将初露锋芒。

尤其引人关注的,vivo打造的AI大模型矩阵极为丰富,覆盖了十亿、百亿及千亿三大参数级别,共五款模型,旨在满足多样化的核心应用场景。

同样,这批尚在神秘面纱后的产品,已在多个权威评测中崭露头角。最新数据显示,vivo自研AI大模型在C-Eval和CMMLU两大平台上均雄踞榜首。

近期,手机行业已经见证了各大品牌逐个投身于AI大模型的深海。存量市场的激烈争夺,使得各大厂商都希望借助新技术锋芒,为自身在高端市场塑造更具竞争力的形象。

多位行业内有深度洞察的人士认为,强调AI功能的优势,显然是各大厂商策略的重要一环。不仅能刺激用户对高端产品的欲望,更能带动产品价格上涨,从而为品牌创造更为丰厚的利润。

随着时间的推移或能见到,首波真正的“AI手机”即将震撼登场,而未来两年,更会是AI在手机上的创新大爆发时刻。

二、大模型角逐移动端,路径逐渐统一

虽然手机厂商们在宣传中表现得在手机上运行大型模型就如同喝水吃饭般轻松,但实际操作中,背后隐藏的挑战远超预期。

根据小米技术委员会AI实验室大模型团队负责人栾剑的分享,要真正在手机上运行大模型,对手机硬件的要求绝不会低,特别是处理器和内存两项。

大模型首先就是其“大”的特性,一旦占据过多的手机工作内存,将导致其他应用受限,甚至可能造成手机无响应、整体性能锐减,或者最糟糕的情况是直接死机。

此外,计算能力也是评判的关键点。若生成一个字符就需要花费好几秒的时间,这对于用户体验无疑是灾难性的。考虑到人们的平均阅读速度约为每秒十几个汉字,故模型的“生成速度”必须远超于此。

而功耗问题也不容忽视。许多网上的模型Demo常常疏忽这一关键环节。高负载下的计算芯片会导致手机急速发热,若如此长时间运作,势必会对电池的续航产生严重损害。

综上,手机大模型真正的挑战在于如何在处理速度、散热和电池续航等之间找到一个精妙的平衡。因此,业界的重心还放在了端云协同之上。

不久前,联发科与OPPO达成协议,共同研发大模型在端侧的轻量化部署方案,旨在让大模型技术更为贴近消费者的实际使用。

10月18日,联发科同样宣布与vivo在AI领域深度合作和联调,实现了10亿和70亿AI大语言模型以及10亿AI视觉大模型在手机端侧的落地,共同为消费者带来端侧生成式AI应用创新体验。

端侧大模型的好处是,用户可以享受更快的响应速度,同时数据也不需要上传到云端,更加安全。目前许多主流厂商都在研发在移动终端部署 AI大模型的解决方案,以实现在端侧运行大模型的目标。

然而,不能假定仅凭手机端便能解决所有问题。正如小米透露的,他们将继续遵循端云结合的策略。某些功能或能力,如果可以通过端侧的模型来实现,就无需转移到云端处理。

观察vivo的情况,虽然缺乏确切的数据,但可以合理推测,它也将采纳云端和本地结合的大模型策略。

从其大模型的参数量级可以分析,660亿、1300亿和1750亿量级的云端大模型目的在于确保处理能力,以应对更复杂的问题。而10亿和70亿量级的本地大模型则是为了确保用户隐私、能效和快速响应。

这意味着,vivo很可能会采取端云协同工作的方式,即通过评估问题的复杂性来决定是否在本地处理或转移到云端。

结合云端和本地的大模型不仅可以有效地节省成本,而且能够满足用户在计算能力、性能、能耗和隐私保护等多个方面的需求,这无疑是目前整合手机和AI大模型的优选策略之一。

三、厂商跟风之下,一些潜在的挑战

某些业内观点,将目前尝试在手机端运行大模型的技术视作一柄锋利之剑。然而深入背后,也不免露出一种应景而非真正求变的短视之感。

首先,对于“大模型”的界定仍旧模糊不清。以小米的端侧模型为例,其参数量达到13亿,与GPT2的1.5B参数相差无几,但这真的足以赋予其“大模型”的头衔吗?

不乏有业界人士抛出质疑:手机端的大模型实践,更多地是为了满足市场短期热潮,而非技术的真正跃进。若手机真的能毫不费力地驱动大模型,那显卡巨头英伟达的存在意义又在哪里?

再者,为了让大模型适应手机,制造商不得不通过剪枝、蒸馏和量化等策略对其进行大幅压缩。以vivo为例,它可能通过连续的模型裁剪和蒸馏,将参数从1750亿降低到仅10亿,这种操作是否过于牵强,值得思考。

要认识到,大模型并不仅仅是参数数量的简单叠加,它的真正价值在于深度学习中的“深度”。大量的参数意味着更多的信息、知识和上下文的捕捉。

因此,当把一款千亿参数的模型剪裁到几十亿参数时,势必要失去一些原有的学习深度。对于AI的日常应用来说,可能影响不大,但对于那些期望从AI获得深度见解和理解的高端用户来说,这种损失是无法接受的。

即便小米宣称其端侧模型能与云端模型相提并论,但这其中的细节仍不容忽视。拥有13亿参数的端侧模型自然难以与拥有千亿参数的云端模型相比。为了弥补这种差距,小米可以选择让其端侧模型在特定场景下与云端模型匹敌,但终归不能全面比肩。

从这些层面出发,当前手机上的大模型实现方式似乎有点“矫枉过正”。对于普通用户而言,他们并不真正关心模型的参数数量,而更关心能为他们带来什么价值。vivo和小米的这些尝试固然值得鼓励,但也应该反思其真正的目的和意义。

更重要的是,尽管众多手机制造商都在积极探索AI大模型的应用,但未来的路径仍然充满未知。手机市场上,什么才是下一个“杀手级”应用,还有待时日揭晓。

目前手机制造商对AI大模型的具体应用似乎过于偏重“语音助手”。这种单一方向的追求,是否只是迎合了科技热点趋势,而非真正考虑用户的实际需求?

以近期知名博主对vivo新款AI大模型的分享为例,尽管其在OriginOS 4上以焕然新姿亮相,但与现行的语音助手相比,核心并无太大颠覆。

简而言之,AI大模型在手机领域的真正普及仍旧步履蹒跚。如今的种种努力,只是冰山初露的探秘之旅。

参考资料:

腾讯科技-小米的大模型“野心”,始于端侧

作者:樟稻;编辑:伊页

来源公众号:科技新知(ID:kejixinzhi),洞察技术变化背后的产业变迁。

本文由人人都是产品经理合作媒体 @科技新知 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 大模型 怕是要构建新一代的信息茧房

    来自天津 回复
    1. 确实,赶紧学起来

      来自北京 回复