月之暗面杨植麟：创新、长期、第一性

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

月之暗面杨植麟：创新、长期、第一性

Monolith砺思

2024-05-07

1 评论 4138 浏览 8 收藏

32 分钟

今年早些时候，我们曾和杨植麟坐下来一起聊了2个小时，谈到了AGI、创业、意识、哲学、生命和愿景。

Monolith砺思资本连续三轮投资月之暗面，以我们对这个团队的了解，他们是一群足够产品和结果导向、务实求真的AGI evangelists。

通往AGI的道路注定漫长，认清真正重要的事并且坚持下去，多年后到达目的地再回望时，可能会发觉当下很多舆论只是微不足道的噪音。

我们使用Kimi整理了这次对话的内容，希望对于外界了解月之暗面这家公司有更多的帮助。

在《2001：太空漫游》的开场，人猿将一块骨头高高抛起，随着飞舞的骨头升上太空，场景瞬间切换到几百万年后的太空，这块骨头也变幻成了太空中漫游的宇宙飞船。斯坦利·库布里克用这样一个极富冲击力和想象力的转场，用一瞬间完成了人类三百多万年的进化之旅，这也成就了世界影史上最伟大的蒙太奇之一。

在这个史诗般的场景里，从茹毛饮血的石器时代到驾驶飞船登上月球，几百万年只在弹指一挥间，这都是因为人猿对工具（科技）的掌握。同时，这艘星舰上还搭载了银幕史上最早的人工智能反派——一台冰冷狡黠的超级计算机HAL9000，它也成为后来科幻电影中人工智能的鼻祖。

在1969年的夏天，阿姆斯特朗的声音通过电视传到了世界的各个角落，在离开地球后110个小时后，他成为航天史上登上月球的第一个人。那一天，全世界约有六亿人通过电视直播观看了这个人类历史上最伟大的壮举。

为了庆祝这一时刻，平克·弗洛伊德当时作为受邀乐队正在BBC的直播间里即兴演奏。

人类登上月球四年之后，平克·弗洛伊德推出了自己的第八张录音室专辑《The Dark Side of the Moon》，在步履的喘息声、催促登机的机场广播、开合的收银机抽屉、跳跃的贝斯中向世界表达着自己对冲突、贪婪、时间和死亡的理解，并在此后长达半个世纪里不断地被提起。

从骨棒到星舰，从人猿到AI，从Monolith到Moonshot，在这个探索过程中，始终伴随着我们的是未知的恐惧，是太空的无垠，但更重要的对宇宙的探索热情梦想、对人类本质以及未来的终极思考。

在今天，实现通用人工智能被称为是这个时代的“阿波罗计划”，月之暗面（Moonshot AI）就是一家致力于实现AGI的大模型公司，他们以平克·弗洛伊德的专辑名字命名，创始人杨植麟在github的介绍是：

The ultimate goal of all my work, including both research and business, is to maximize the value of artificial intelligence.

和杨植麟的对话，我们并没有谈论太多产品和公司的细节，更多地聊了聊在AI领域的长期愿景，对组织、意识和生命的思考，创业的初心和反思，以及最近阅读的书籍和电影。

以下是全文，经砺思资本整理，有调整和删减：

一、“创新、长期、第一性原理”

MONOLITH：

植麟你也可以讲讲公司取名Moonshot的背景。

植麟：

当时我们用Kimi内测的时候，想取一个中文名。想了半天就说那要不叫月之暗面，然后我就输进去问Kimi，「月之暗面如果是一个公司名字，它应该是什么意思？」然后Kimi就引用了两个典故，一个是平克弗洛伊德的专辑，另一个就引用了库布里克的这个电影，所以第一次和曹曦见面就觉得很有渊源。

月之暗面就和AGI 一样，你平时只能看到发光的那面，但你不知道那个暗面是什么样。它很神秘，要看到它又很难，英文正好也翻译成Moonshot，寓意要做成一个价值很大但是又很难的事情，这个跟我们的初衷是蛮匹配的。

MONOLITH：

曹曦你第一次见植麟是什么时候，有什么印象？

曹曦：

第一次见面是线上，当时其实主要是我在pitch（笑）。第二次就来公司楼下了，那次其实印象很深刻，当时觉得好的公司就应该是一两句话就可以说完的，我记得植麟就说我们要做AGI，然后要做toC的产品，我觉得也很纯粹，事情就说完了。

更早之前在2019年，清华的一个活动上，我们也见过面，但当时没有很熟。当时一桌吃饭的人里面，我觉得植麟是一个有 potential 的创业者，有灵气，有意思，后面很多事情也就match了。

MONOLITH：

植麟也可以谈谈曹曦的 pitch 是怎么样打动你的。

植麟：

（笑）其实不光是第一次交流，从认识到现在，包括这几轮的融资，以及业务上和招聘上，曹曦总对我们帮助都非常大，所以也是 so far 我们最喜欢的投资人之一。

MONOLITH：

我们有一个快问快答环节，我昨天告诉Kimi，今天和杨植麟有一场对话，让它生成了 100 个问题，最后精挑细选了10个来问你。

第一个问题，用三个词形容月之暗面这家公司。

植麟：

创新、长期、第一性原理。

MONOLITH：

用三个词形容你自己。

植麟：

跟刚才一样。

MONOLITH：

分享一本最近你在读的书。

植麟：

我最近在读一本书叫《Everybody: a book about freedom》。

MONOLITH：

分享一首歌或者一张专辑。

植麟：

Brain damage，

the dark side of the moon。

MONOLITH：

分享一个对你生命中影响最大的人。

植麟：

最大的一个人，没有。这个要精确，或者要想更久。

MONOLITH：

如果有机会与历史上的任何一个人共进晚餐，你会选择谁？为什么？

植麟：

Steve Jobs，他是一个能把有 taste 的东西泛化的成功案例。这种案例不多，可能Steve Jobs 是一个，Pink Floyd也算。

MONOLITH：

你认为哪位科学家的工作对现代人工智能的发展影响最为深远？

植麟：

Geoffrey Hinton（深度学习之父）。

MONOLITH：

在整个历史上，你认为最成功的互联网产品是什么？

植麟：

YouTube，因为它产生了很大的impact。

MONOLITH：

如果把这个语境缩小到中国呢？

植麟：

中国的话，我觉得是微信，因为它是中国互联网的 super APP。

MONOLITH：

最后一个问题，你现在深信不疑的一件事情是什么？

植麟：

AGI公司需要一个从 0 到 1 的新组织。

MONOLITH：

你对kimi生成的问题还满意吗？

植麟：

我觉得还不错。

二、“show me the code 比其他所有事情都重要”

MONOLITH：

月之暗面不是你第一个创业公司了，你当时在美国呆了一段时间，在那里看到了什么点燃了你再次创业的热情？

植麟：

当然还是觉得看到了很大的变化，AI 这个技术发展了七八十年，从来没有出现这种toC的机会。以前也有一些优秀的 AI 公司，更多是专注在 ToB 业务上。

但从2022年下半年开始，有越来越多像 Midjourney 和 ChatGPT 这样的应用出来，甚至有一些普通的、非技术狂热者的用户也开始使用，然后周活超过1亿，这些都是非常明显的信号，这里面肯定是有巨大机会的。

另外它跟互联网相比，最大的特点是能创造新的生产力，而不光只是去做连接。所以我相信这是接下来 10 年里价值最大的事情之一。

MONOLITH：

如果回过头来看，你当时是否会选择更激进的方式，比如在几年前第一次创业时，就直接去做大模型和AGI？‍

植麟：

当时其实还是做了很多和AGI相关的事情。比如像国内的最早的一些大模型项目，我们在背后做了很多布道的事儿。但客观上要承认，很多事情在合适的时机上去做才能事半功倍。我认为要做一家独立的 AGI 公司还是需要对的时间点。

实际上之前我们踩过了很多坑，对于这次创业有很大的帮助，因为你就知道什么是不 work的。对我来说最大一个的lesson就是——你要做 AGI 的话，你一定是需要从 0 到 1 去搭建一个组织，这是我现在深信不疑的一件事情，也是我们为什么要做现在这个公司最核心的原因。但如果没有之前的这些过程，那很难真正理解它到底为什么是这样。

MONOLITH：

很多人不知道你是个鼓手，之前组建的乐队叫splay tree(取自一个数据结构)。你说过摇滚和创业很像，都代表了一种反叛和打破常规的精神。玩乐队的经历对你有什么影响？

植麟：

我相信一个真正伟大的公司是需要有人文底蕴的，而不光是说有一个技术和产品就够了，还要去看它底层的文化和价值观是什么。对于审美的追求能让我们做出来更好更有灵魂的产品，这点我是相信的。我们公司的人现在应该能组好几个乐队了。

MONOLITH：

我看你在 GitHub 上的自我介绍是——

My goal of all my work, including both research and business, is to maximum the value of artificial intelligence. 这和马斯克说他创立Tesla的全部意义都是为了加速电动汽车时代的到来，而不是成为通用汽车有点像。你是从什么时候开始确立了自己对AI事业的使命和愿景？

植麟：

这是个逐渐形成的过程，因为接触和做AI 这个事情有十多年了，一开始可能只是好奇这个事本身，就是除了人脑之外，还有另外一个东西它也能产生智能。一开始大家可能连这个 Back Propagation（反向传播算法）都要手写，没有很成熟的框架，效果也没有这么好。

在这个过程中慢慢地发现，AI最终确实是可能double GDP，或者10xGDP，100x GDP 的机会，因为人类社会本质上它的生产力bond，就是你的人口对应能产生的脑力的总和，现在突然出现一个东西可以去替代它，这就使得它能达到的上限非常高。

我第一次见到曹曦的时候，当时和他讲了一个事情，就是我之前有一次做梦，梦见自己训练了一个神经网络，它所有任务的准确率都是100%，我就惊醒了。因为我意识到自己突然能改变世界，然后发现并没有（笑）。在那个时候很多任务还只能做到百分之六七十。今天这个梦已经部分实现了。AI在很多任务上超越了大部分人类。

在这个过程中，其实我还蛮感慨的，很多事情发生了变化。包括我们很早就认为语言模型是个很重要的问题，但并不是所有人都是这样认为的。因为当时语言模型最大的用途是拿来给语音识别去重新排序，很多人认为它唯一的作用就是这个。后来大家才逐渐真正看到了更多地用人工智能释放生产力瓶颈的可能性。

MONOLITH：

这个过程中有一个广为人知的事情，就是2019年的时候你那篇TransformerXL的论文一度被 ICLR 给拒绝，理由就是他们不认为大语言模型的提升在实际应用场景中会有更多的价值。当时收到类似这样的负反馈有动摇你吗？

植麟：

那时候看的已经挺开了。大家并不是说那么 care 你一定要在会议和期刊上发表个什么东西，你最重要的就是arXiv加GitHub。所以那会儿其实已经不太 care 那些所谓的同行评审。

这中间也经历了一些变化，十年前peer review和评审很重要，再后来就是 GitHub加arXiv，到现在就是products，要show me the code。用产品说话。

MONOLITH：

就更多从第一性原理去思考问题。

植麟：

做出来一个真正能用的、好用的东西。这四个字——能用，好用，比其他所有东西都重要。

三、“expect the worst, 但尽全力去把事情做好”

MONOLITH：

创业到现在快一年了，公司发展的状态你还满意吗？

植麟：

我觉得so far进展还是很不错的，甚至是超预期的，当然对一个大模型或者对一个 AGI 公司来讲，最核心的还是组织本身，因为你所有的技术其实都是通过组织生产出来的，组织的核心又是人，如果你没有合适的人，光在那谈管理的办法，或者说怎么合作，其实都是空的。所以我觉得组织建设这一点是我们可能前期做得比较好的一个地方。

曹曦：

为什么会超预期？是本来预期就比较低，还是确实做得好？

植麟：

我一直都是保持谨慎的乐观，expect the worst，但尽全力去把事情做好，这个是一部分超预期的原因，另外市场的变量也很重要，人才和资本的流动使得公司构建的速度更快了。

MONOLITH：

在组织建设上，你反提到做AGI需要一个全新的组织形式，这个怎么理解？

植麟：

传统互联网和 AI产品最大的区别，一个是先设计后制造，一个是通过制造完成设计。我没有办法提前规划说有用户会拿 50 个简历放到kimi里去筛选，然后专门去设计和优化这个场景。我们只能说是先把基础能力给设计好，比如让它有很强的 in-context learning 的能力，instruction following的能力，这就是一个在制造中完成设计的过程。

所以，你的生产方式不一样，你的组织肯定就不一样，这点是非常重要的。现在是 model as an application，本质上消费的是智能而不是连接。有的地方和互联网时代比是没有太大变化，但已经发生的变化是很深刻的，以至于说你如果没有一个全新的组织，你可能是很难做的。

曹曦：

所以其实互联网思维和AGI思维倒未必是泾渭分明的，但在需要一个全新的组织这个点上，可能是一些之前的existing player 的创新者的窘境。

MONOLITH：

那在组织建设上，你觉得月之暗面现在想吸引什么样的人？

植麟：

我们公司有很多AGI Evangelist（布道者），就是你认为接下来 10 年只有这个事情是唯一值得做的，这个 vision 是最关键的，所以我们最欢迎对 AGI有强烈热情的人，这是第一点，第二点的话可能就是学习能力。

这里还有很重要的一点，人才也有滚雪球效应，当你认识的一些很优秀的人，比如a、c、d、 e 都在这家公司，然后本身这些人之间都是彼此欣赏或已经认识的，那组织里这样相似的人就会越来越多。

MONOLITH：

你在面试中会问到的最重要的问题是什么？

植麟：

这个我确实有一个，但说了以后就没法用了，所以不能告诉你。（笑）

MONOLITH：

那分享一件你最近很重视和正在推进的事情。

植麟：

最近在搞产品，搞产品，搞产品。

MONOLITH：

说到产品，你觉得现在什么样的产品经理才能做出killer app？

植麟：

我觉得没有一个特定的范式，但最核心的应该是学习能力。比如在保证基础的、核心的判断是正确的前提下，还得会有很多信息输入的情况下快速升级自己。

曹曦：

在过去这些年里，我觉得产品经理是一个被过分放大的刻板印象。这里面会有一个误区，就是有时候其实所谓的产品经理，都没有被精确定义成它是哪个行业的，有些行业里其实没有这个概念，比如游戏行业就没有，ta叫游戏策划，再比如教育行业，这里面最好的产品经理是谁？可能应该首先是对教育有最深认知的从业者。

我觉得这次这一波机会里，对创始人在技术背景上的要求可能甚至要更高，所以我们在去年年初的众多公司中选择bet的，是我们觉得在AI技术上最强的植麟。在这个时代，无论是对从业者还是创业者来说，其实要求都是既要又要的。过去无论是互联网还是移动互联网，这两波大的机会里面，那些长到特别大的公司例如腾讯、百度、网易、字节、快手等公司的founder 都是技术背景。

四、“人类进化的本质是捕获和固化宇宙里的熵”

MONOLITH ：

你觉得什么是意识，机器有没有意识？

植麟：

大概几十年前有人问过这样的一个问题，就是说你怎么去知道一个机器有没有理解一句话？今天是这个问题的升级版，但我觉得本质没有什么变化。

今天不会人再去问「这个机器能不能理解一句话」了，因为这个问题的答案变得很简单。所以我觉得再过几年，你的这个问题也会变得很trivial（微不足道的），你都不需要去衡量它，你就直接感受它就好了。

如果拆解的话也有一些科学的方法，比如把它变成一种形式语言，然后用一个逻辑表达式去表达；或者在operational 层面，比如针对一篇文章或者论文，你去问AI 100 个问题它全都答对了，那它就是理解了，也就有了（意识）。

AI现在还没有办法跟人建立很长期的。以年为单位的connection，它也没有深层的identity，或者一种内生的motivation，这些也可以作为一种衡量标准。

曹曦：

我觉得可能在一些语境的讨论里，意识的定义很多时候是从人的自我角度出发的，就比如这一波智能肯定跟规模有很大的关系。那在自然界里，其实蚂蚁群和蜂群规模到了一定程度之后，看似也有智能的行为，所以你说蜂群或者蚁群它们有没有意识？可能也有，但不是我们定义的那种意识。

植麟：

也是一个量变产生质变的结果，可能到了 10的27 次方以后，它们的意识会更强。所以你今天也不能说它们没有，只是没有那么明显。

MONOLITH：

从第一性原理上讲，我们为什么需要AI？

植麟：

这个问题有两种流派，一种是有效加速主义（effective acceleration）。这一派的人认为宇宙里面漂浮着各种各样的熵，而人类的目标就是去捕获他们，今天的神经网络就是一个捕获熵的能力，你把 loss 从 10 降到1，本质上就是把一堆熵给固化和捕获凝结了。

当然你永远不可能捕获所有的熵，因为有一些东西它是完全不确定的信号，你无法预测。但是你要把能预测的都预测掉，人类进化的本质就是在做这样的事情，它是有利于社会进步的，因为结果是生产力一直在发展，100 年前像Polio（小儿麻痹症）这样的病都没法治。现在除了医学之外，还有各种各样的科技，这是捕捉熵的结果。

另一种流派是有效利他主义（Effective Altruism），他们不认为这种acceleration能带来任何好处，相对更悲观一些。

技术的发展并不以个人的意志为转移，甚至并不以某个单一的社会为转移，因为它本质是一个 free market， free market 会选择它效率最大的是方向去演进。现在这个市场选择了它要加速，本质就是一个效率最大化去捕捉熵的过程，这个是所有人都没有办法去阻止的一件事情，所以就遵循这个宇宙中熵的意志，从中找到一个最好的解法。

MONOLITH：

你怎么看智能涌现这个现象？

植麟；

智能涌现就是通过制造去完成设计。你没法提前设计，因为你不知道它会涌现出来什么东西，这也是我认为我们需要AI native的原因，不是去单点解决问题，而是系统性地解决问题。

曹曦：

我记得你之前提到过，智能可以看作是一种压缩。

植麟：

对，Next token prediction 本质上就是个无损压缩的过程，因为要用最少的比特去表示这个世界。比如说你今天要去预测一个等差数列，你如果知道这个世界的规律，只需要存前两个数，就能预测出来后面每一个数，这就是一个巨大的压缩的过程。

我觉得这个就是智能的意义，因为现实世界会更加混沌，有可预测的部分，也有不可预测的部分，但是当你能把那些可预测的部分做到极致了，你就达到了智能的上限。

曹曦：

我好奇这个过程中，什么是更容易被压缩的，什么是更不容易的？

植麟：

没有本质区别，只要你能放在同一个token space 表示。为什么文字会可能先被压缩，因为它本身是一种更加浓缩的信号。视觉信号的loss会高一点，因为它不确定性更大。但最终都是一个 scaling 的问题。只要你把它放在同一个空间里面scaling，本质上都可以解决。

曹曦：

在我们聊天的过程中，AGI 是一个反复被提到的词，这个词的定义应该怎么理解？

植麟：

我觉得就是今天人类所有在数字世界里能产生的行为，每一个行为都能做到接近人类top 1% 或者专家级别的水平，最终未来在物理世界也达到（一样的水平）。

曹曦：

你说的这个定义是前 1% ，有点像「通用精英智能」。

植麟：

有不同的标准，我的point就是说你最终衡量它，就必须要是细分地去拆解才有办法衡量。

曹曦：

说到模型的基础能力，你觉得LLM（Large Language Model）的局限性会在什么地方？

植麟：

如果我们谈的是广义的基于一个序列模型去做 next token prediction，可能没有太多的局限性，从第一性原理来讲，它其实是通用的，最终所有在数字世界能完成的任务，通过这套范式最终都可以学到。

当然类比旧的计算范式，只要花足够多的投入去做数字化，最终都能变成零一的序列，现在新的计算范式还做不到这一点。比如说只是纯文本的语言模型，那很多东西没有办法表示，这点上还是有局限。

另外还有一个很重要的瓶颈，现在AI 的输入有两根线，一根是电线，一根是数据线。如果你想真正最后做出来一个 super intelligence，那你应该有办法把这个数据线给拔掉，只要往里面输电就可以了，它要自己可以去进化。

曹曦：

把数据线拔掉，可不可以理解为当下已存在的数据，会在某一天不够用？

植麟：

对，这一代模型是10的25次方次浮点数运算，接下来两三年时间里，还会有一到两个数量级的增长。根据 scaling law这个数据还要再增长至少一个数量级，但是这个世界上的高质量数据一定程度上是有限的。你就需要用synthetic data（合成数据），通过模型自己去探索整个表示空间里面那些没有被采样到的点，这个基本上是现在已知的必须要解决的问题。

MONOLITH：

你觉得AI会如何影响普通人的日常生活？

植麟：

我觉得大概率还是会让你的生活变得更好，有更多的人不需要为了钱去工作。你可以去发挥你的创造力，去做更多有创造性的事情。