免费,才是最强杀招

0 评论 1849 浏览 2 收藏 17 分钟

本文深入探讨了OpenAI最新发布的GPT-4o模型,这一全能大模型在多模态输入输出上实现了重大突破,不仅在效率、性能上大幅提升,而且对交互性进行了革命性的改进。文章详细分析了GPT-4o的强大功能,并对其免费开放策略进行了深入解读,展望了这一技术进步如何推动社会财富的增长和新时代的适应。对于关注AI技术发展及其对社会影响的读者来说,本文提供了独到的见解和前瞻性思考。

科技巨头之间的竞争,越来越不讲武德了。

原本,OpenAI的“春季新品发布会”定于5月9号,结果硬生生拖到了现在。

为什么呢?因为谷歌明天开开发者大会……

就是要骑脸输出,不给友商任何活路!

于是今天凌晨1点,山姆·奥特曼口中“就像魔法一样的东西”,终于揭开了面纱。

不是大家想象中的GPT-5,而是GPT-4的迭代版本,GPT-4o。

o是omni的缩写,源于拉丁语的omnis,意思是无所不在、无所不知、无所不能。

听起来神神叨叨的,颇有点佛祖、上帝的味道。

GPT-4o,也就是全能大模型。

全能?这就很有意思了。

一、强在哪里

所谓全能,当然不是真的指全知全能。

至少现在不可能。

如果人造“上帝”真的被造出来,我们所有人都可以立刻躺平、混吃等死了,统治世界or解放世界都在这家伙的一念之间。

目前的GPT-4o,能做到的是文字、图像、音频、视频任意组合的全模态。

OpenAI的原话是:GPT-4o是第一个融合所有模态的模型,我们只是触及到其能力的表面。

尽管只是表面,但也极其强大了。

先看横向测评。

简单总结就是:更快、更强、更便宜。

首先是效率。GPT-4o 的处理速度是 GPT-4 Turbo 的两倍,速率限制提高了五倍,最高达到1000万token/分钟,价格还降低了一半。

其次是性能。在所有语言基准测试中,GPT-4o都比GPT-4更强大,还能在50多种语言之间无缝翻译。

然后是最重要的一点:多模态输入输出。

GPT-4o 能够处理文本、音频和图像的任意组合输入,并实时生成相应的输出与用户互动。

注意,是实时!实时!

下面再看看其具体表现。

发布会上,测试者对着手机说:我第一次来直播,有点紧张。

ChatGPT立刻回答:你可以深呼吸。

男子照办。

ChatGPT立刻又开玩笑道:你不是吸尘器吧,不要喘。

当听到对方终于平稳呼吸时,它居然还会开口鼓励。

看到这,苹果手机用户很快就能察觉出有啥不同了。

我们此前用的Siri之类的语音助手,反馈慢倒还罢了,你还必须要等它说完,才能进行下一轮对话。

非常呆板,且浪费时间。

其实这也正常,它毕竟只是个很原始的程序。

之前我们与AI对话,都要经历3个步骤:

1.人说话,AI将音频转成文本代码;

2.AI回答它自己翻译的这段文本;

3.将回复的内容转化成音频输出。

这就相当于一来一回的回合制,不论怎么样都会有延迟,现在业界最快的反应速度是2秒。

别的先不说,至少用户很难有真实交流的沉浸感。

但用GPT-4o,平均反应时间只有0.32秒,基本就是你刚问完、它立刻就能回答你,和真人聊天没啥区别。

更关键的是什么?

因为人与人之间对话,是充满了各种即时反应的,比如嗯嗯啊啊各种预期助词,以及手势、停顿、咽口水等等。

但你过去与AI 聊天,却根本不会存在这些因素,即便AI回答得再完美,你依然无法拥有沉浸感。

而现在,你不仅能随时打断GPT-4o,它甚至能根据你的语速、语调、呼吸乃至面部表情来判断你的情绪,并依次表达出对应的情绪。

这就很Nice了。

不仅仅只是语音对答,GPT-4o的文本、音频、视频所有输入和输出,都由同一个神经网络处理。

也就是说,它在各种维度上,都能有同样强大的表现。

简单来说,就是GPT在能看、能听、能说话方面,更加“通人性”了。

它不一定真的懂情感这回事,但能够模仿。

现阶段而言,只要能模仿就够了,完全够投入商用了。

以上种种,你觉得意味着什么?

意味着ChatGPT在交互性上,又做出了巨大突破。

比如,你可以在睡前,要求GPT用女神的声音、舔狗的语气,讲故事、唱歌哄你入眠。

又比如,你可以把自己的日常资料发给GPT,让它根据每天的天气、突发事件等等状况,生成工作、生活计划。

乃至辅导小孩写作业等等等等……

千万不要小看交互性,它的价值远超想象。

二、为什么免费

除了功能强大,GPT-4o更让人关注的是什么?

免费!

不仅仅是 GPT-4o 免费,更刺激的是 GPT Store、Vision (包含代码解释器、联网功能等),都会陆续开放出来。

为了让用户们用得方便,新版ChatGPT还开放了桌面端。

关于这一点,山姆·奥特曼专门发了博客说明:

OpenAI的核心使命之一,就是免费为人类提供顶尖的AI工具,为世界创造各种利益,让所有人从中受益。在未来,所有人都能免费获得 GPT 的算力,可以使用、转售或捐赠。

你们之前批评我不开源,现在我直接免费,甚至都不用注册,还有话说吗?

按照我们的商业逻辑来看,这不是纯纯的做慈善?

当然不是,至少不完全是。

首先,新模型变小了,运行成本大幅降低。

前文提到过:GPT 4o处理速度翻倍,价格只有GPT 4 Turbo的一半。

原先输入、输出一百万token的价格是10、30美元,现在则只要5、15美元。

其次,是先舍后得的商业逻辑。

免费是有限制的。

官方文档里都说了,免费用户目前每3个小时只能使用10条GPT-4o,用完了就回落到GPT-3.5版本。

10条,够什么用的?

想继续玩?想玩得爽?给我充钱!

只要20美刀/月,你就能成为尊贵的plus会员,每小时能享用80条GPT-4o!

这简直!太不划算了!

就目前的情况而言、对绝大部分人而言,你只要不是无聊到什么都去试着玩,每3小时10条内容完全是足够了。

照OpenAI这么搞,如今ChatGPT的忠实付费用户(原来免费的只能使用GPT-3.4),恐怕都不会充钱了。

为什么OpenAI 要承担丢失付费会员的风险,去给全民提供免费服务?

其实,我们的目光可以放长远一点。

想想看,人人都能免费用上高质量的AI,这意味着什么?

你如果悲观地去看,这很可能对现在社会的分工结构造成重大冲击,造成广泛的失业潮。

看到这里,别的不敢说,我们至少能确定一件事:除非自己感兴趣,以后的小孩都不用再学英语了。

GPT-4o完全可以做到各种口译、同声传译,甚至还带感情、带理解。

除此之外,大量的普通家庭教师、程序员、设计师等等,基本都会被取代。

这是不可避免的事。

但就像前几次技术革命一样,在一些行业消亡的同时,一定会有新的财富风口出现,整个社会的财富总量必然是增加的。

乐观点看,就是另一回事。

三、财富大爆炸

《易经》“乾”卦“用九”:见群龙无首,吉。

王阳明也曾说:人人心中有仲尼。心之良知之谓圣。

真正伟大的时代,应该是人人平等、人人如龙、人人成圣的。

从古至今,这都只能是幻想,但如果能善用AI、善用工具,我们未必不能接近这种境界。

其实从GPT-3.5→GPT-4→GPT-4o,我们能很明显概念感受到,OpenAI想干什么:

他们要让GPT这个人造大脑,越来越符合“人”的标准。

人是什么?

人不仅仅是劳动力,不论是什么时候、用什么工具,人才是创造财富的主体。

随着多模态越来越完善,现有的部分行业将会被怎样改变?

我们的主要关注点应该在娱乐方面。

因为物质世界的体力劳动必然与人类越来越远,人类创造财富的方向肯定将加速集中在精神方面。

从之前投资Descript的举动可以看出,OpenAI早就有意把AI技术引入到影视创作领域。

即便他们不这么干,其他的影视公司也一定会干。

因为未来的趋势就是——“交互式传媒”。

你可以把这种模式,理解为短视频,每个人都是创作者,没有谁更专业一说。

各种短视频平台上,如今已经充斥着大量AI制造的内容。以前我们还能看得出来,现在越来越逼真。

而以后,只要你善用能模仿人情感的多模态大模型,创造出的内容也将彻底脱离“机械感”。

每个人都是最佳导演,一天拍十几部大片都没问题。

想要出圈,就看谁的点子更有新意,更迎合受众口味。

与之相对的,各种影视公司,包括现在的一大堆流量明星,都将没有任何发展空间。

未来,能存活下来的,只有平台,和无数个个人。

除了影视之外,包括音乐、动漫、游戏等任何具备消费价值的娱乐领域,都将变得一样:

去中心化。

每个人都是完美的音乐家、漫画家、游戏设计师,只要你有足够的耐心。

你能想象,这些将催化多大的市场吗?

以游戏为例,到2025年,全球将有35.3亿游戏玩家。数十亿人,有多少千奇百怪的点子?

以前,99%人限于技术,只是单纯的玩家,属于被收割者,只有游戏公司赚钱。

从市场的角度考虑,这个发展效率是非常低下的。

以后,就相当于是这35亿人相互买单,金钱流通速度何止提升10倍!?

再比如社交媒体。

从前是没有技术,当网友分享他的游戏、电影、音乐交互体验后,其他用户除了评论就没啥后续了。

但以后,我们都能在此基础上,让AI定制自己的二次体验,不论是语音、视频还是漫画形式,与其他人分享。

然后其他人看到了,再定制,再分享……

就这样病毒式传播。

这些描述,很像去年底炒作的Web3.0概念。

它的目的,是创造一个去中心化、交互式的互联网世界,打破已经见顶的互联网现有桎梏。

它的驱动力,就是多模态大模型、乃至以后真正完善五感的更高级AI。

拥有五感的GPT,不仅仅是一种技术进步,更是现代商业社会的一次彻底的娱乐、消费、社交革命。

总而言之,让每个人都能免费使用顶级AI,就相当于把生产力赋能给每个人,每个人的价值将进一步凸显,整个互联网世界也将创造出更大的价值。

等到你发现其中的财富效应,乃至未来大多数人或许都要在这样的大环境中生活……

等到AI真正成为每个人创造财富的重要工具,3小时使用10条GPT-4o,你还觉得够吗?

每个月20美刀的会员费,你还觉得贵吗?

就算再贵十倍,你也心甘情愿抢着买!

我们真正应该担心的,不应该是这点鸡毛蒜皮的事,而是:AI 科技的推进速度太快,你有没有意识到要去适应新时代。

千万不要做落后的那一批人。

本文由人人都是产品经理作者【格隆汇】,微信公众号:【格隆汇APP】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 目前还没评论,等你发挥!