AI 时代最重要的能力——判断能力
随着 AI 技术的飞速发展,尤其是推理模型如 DeepSeek-R1 的出现,AI 在日常生活和工作中的应用越来越广泛。然而,AI 输出内容的准确性和质量却引发了新的思考。本文将探讨在 AI 时代,普通人如何通过提升判断能力来有效评估 AI 输出内容的正确性和价值。
在 deepseek-R1 发布前,主流大模型是语言模型,大家使用的重点是如何调试 prompt 让大模型输出质量更高的结果;deepseek-R1发布后,主流大模型变成了推理模型,AI 能够做到根据你提问的内容,先推理思考你的深层需求是什么,再根据推理的结果进行输出,使得输出的结果质量大大提高。
这降低了普通人在日常工作生活中使用大模型的门槛,所以,现在提问方式已经不再是限制普通人使用的瓶颈,你只要能详细描述清楚自己想要什么,大概率可以得到看起来还不错的答案。那么,现在的关键点是什么呢?
在提问门槛降低后,普通人现在需要重点关注的,其实是一个更难的能力——判断能力。
一、判断能力
大家经常能听到 AI 幻觉这个词,就是大模型有时会编造它认为真实存在的信息,虽然粗看起来合理可信,但其实并不是真实的。因为大模型的底层逻辑是预测下一个词出现的概率,既然是预测,就不会有100%的准确性。
另一方面,在得出一个结论的过程中,往往需要推理能力,高质量的推理 = 明确的前提 + 严密的逻辑 + 可解释的过程 + 对反例的考虑 + 有意义的结论。但 AI 在推理的每一个方面都容易出现「裂痕」,尽管 AI 可能说得头头是道,但它在逻辑连贯性、内容真实性和推理可靠性等方面都存在明显不足,也很难对其结论的来源进行有效追溯。
虽然目前大部分 AI 工具有「联网搜索」功能,可以在输出的内容中标注参考的信息来源,但 AI 在对参考信息总结时也可能出错,甚至标注的信息来源中根本没有提到 AI 输出的内容。
因此,如何判断 AI 输出内容的正确性以及质量好坏就变成了现在普通人用好大模型的关键。
二、怎么判断
判断 AI 结果的正确性和质量是稀缺性能力,只有知识储备丰富,才能快速分辨。判断力的本质是「用系统对抗混沌」,通过知识体系搭建、思维工具武装、持续实践反馈,才能显著提升这项能力。
但这个方式其实是一个漫长的提升过程,在没有那么大量的知识储备的情况下,比如面对不太熟悉的领域,短期内我们应该怎么做呢?有下面几种方法。
1、分步拆解法
在我们提问后,AI 的回答角度一般会比较全面,但深度往往不够,我们需要先根据 AI 的回答将复杂问题拆解成多个子任务,然后重新提问,再逐个判断每个子任务的回答质量。
比如让 AI 撰写一个行业的市场分析报告时,它一般会从行业概况、行业发展现状、驱动因素分析、竞争格局分析、用户画像分析等方面去阐述,但每个方面提供的内容都较少。信息量少的时候不仅难以判断信息是否正确,而且使用价值很低。
因此,我们可以基于这份回答,把大问题进一步细化,比如分别让 AI 针对行业发展历程、竞争格局现状等单独分析,从而缩小问题和回答的范围。
2、交叉验证法
将问题分步拆解后,我们可以通过横向和纵向的对比,来进一步验证 AI 输出的内容的正确性。
一方面,我们可以使用多个 AI 工具来回答同一个问题,对比它们输出的结果;另一方面,在一个 AI 工具中,把同一个问题用不同的方式再问一遍,看输出的结果是否一致。
通过这种方式,找出这些回答中的共性和差异。共性的部分置信度较高,有差异的部分再去详细了解原因是什么。
3、逆向提问法
在 AI 的内容看上去有道理时,不妨试着问一句“反过来想,如果结论不成立,会发生什么?”或者“有没有可能出现与这个观点相反的情况?”,这个方法非常实用。这类逆向问题可以帮助我们测试 AI 推理是否稳固,也有助于我们构建对问题更全面的理解。
比如你让 AI 给出一个行业下滑的原因,它列出几点你觉得都挺合理。那你可以反问一句“如果这个行业还在增长,那可能说明了什么?”这能暴露 AI 是否只是表面罗列,而没有真正理解因果关系。
4、追踪异常点
在看 AI 输出的内容时,需要重点关注其中的非常规表述和模糊的部分,尤其涉及数据、事实、专业术语、引用相关的部分,要重点核查来源和推理过程,这是 AI 最容易出错的部分。
追踪异常点其实就是在练习“质疑意识”,当你觉得某个点“怪怪的”,不要放过它,而是去把它变成新的问题继续追问。这种方式有两个好处:一是可以帮助你识别 AI 在推理过程中的逻辑断裂或伪装出的“貌似合理”;二是可以逼迫 AI 补全它本来跳过或模糊带过的内容,输出的质量也会随之提高。
久而久之,你会形成一种“异常点雷达”,自动对看似正常但实则不可靠的段落起疑。这在使用 AI 做研究、写方案、甚至做决策辅助时,都是非常核心的能力。
总之,使用 AI 与读书时的注意事项其实有异曲同工之处,尽信书,则不如无书。掌握了这些基本的方法,在不同领域你都可以快速拆解和评估 AI 的内容质量。
三、AI 的价值
从上文的描述中可以看出,我们要对 AI 推理的质量好坏打一个问号,需要花精力去判断。你对某个领域了解越深,就越能快速判断 AI 输出的内容质量。但反过来说,知识储备越多,你可能也越不需要 AI 来帮你生成内容。
所以可能存在这样一个悖论,我们需要用 AI 的部分,判断输出内容质量很困难,而判断起来容易的部分,可能根本不需要使用 AI。那么 AI 的价值在哪里呢?
尽管 AI 存在着这样或那样的问题,但你只要会提问,它就可以根据你的想法快速生成很多内容,你可以低成本的获得大量信息,这可以产生大量的可能性。
因此,AI 的最大价值就在于,它让试错的成本变得极低,从一个点子直通实践,我们可以快速产生各种假设,然后通过实践来验证、迭代,找到其中的最优解。这种快速的实践和迭代,才是我们使用 AI 的正确方式。
尽管 AI 的能力确实越来越强,但未来,不是 AI 替我们工作,而是我们学会更好地和 AI 合作。未来的人机协作模式很可能会变成——人类负责方向把控和价值判断,AI 来承担信息整合与模式挖掘的部分,最终实现 1+1>2 的效果。
我们需要记住的是,可以让 AI 作为一个助手,一定不要让 AI 替你决策,决策权还是在你自己这里。
本文由人人都是产品经理作者【YTY】,微信公众号:【产品二三】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!
