KnowHow与RAG：你的工作数据正在训练替代你的AI

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

KnowHow与RAG：你的工作数据正在训练替代你的AI

叶小钗

2025-03-21

0 评论 1721 浏览 13 收藏

19 分钟

在人工智能飞速发展的当下，AI正在深刻改变我们的工作方式，甚至有可能替代部分人类的工作。然而，AI的训练和发展并非孤立存在，它背后依赖的是大量的行业知识（KnowHow）和数据。本文将深入探讨如何通过RAG（Retrieval-Augmented Generation，检索增强生成）技术，将行业经验与AI相结合，实现知识的可信化和结构化沉淀。

对AI项目有理解的同学会有深刻认知，当前AI应用的核心其实全部在围绕幻觉与模型增强两点做展开。

而这在积累层面的核心是行业KnowHow，其最终体现为公司的结构化数据；在技术方面以RAG与模型训练为主。

并且公司会“乐此不疲”的做这方面的调优，因为从模型层面来说，这些工程应用的细节，基座模型很难兼顾处理。

而数据一块非一朝一夕之事，所以很多公司的关注点全部放在了RAG技术的平台化或者做延伸，阿里的KAG框架就是这类产物。

后续我们会持续讨论类似这种RAG框架，包括DeepSearch、LazyGraphRAG等。而今天我们先来说说think的问题。

一、think变成习惯

由于实际效果或者行业教育，人们已经习惯看到界面中出现长篇大论的“思考内容了”，甚至他们会主动去学习这个内容，觉得是一种进步或享受。

之前AI聚会明叔就一再强调think是非常好的创新，但宜博会站在技术实现角度认为他是一种工程优化或者工程创新，真实情况也如宜博所述，DeepSeek与4o的例子：

请按以下格式回答问题：

##思考过程##

1. 分析需求：首先我会理解用户的核心诉求是…（拆解隐藏需求）

2. 知识检索：关于这个问题，我需要调用的知识包括…（列出相关领域）

3. 逻辑推演：可能的解决路径有： – 方案A（优势/劣势） – 方案B（适用条件分析）

4. 风险评估：特别注意…可能存在…认知偏差

5. 自我验证：通过…方法可以验证结论的可靠性

##最终答案##

（经过上述思考后的最佳方案）

问题：管理的本质是什么

从大模型特性来说，通过提示词的方式虽然能达成目的，但没有大量高质量数据微调后达成的效果（主要体现在泛化与学习这个维度）。

二、RAG的切入

当然以上仅仅是非常浅显的描述，实际在使用过程中，差距很大，比如我这里给出一段法律用于强化学习的片段：

为什么会着重介绍这些内容呢，因为无论是对大模型直接的使用还是微调都是无法溯源的，而无法溯源的东西，都会被怀疑成不可信，于是RAG的含金量还在上升，特别在think里面具备溯源的信息，表明对哪些信息的引用。

比如以下文字就特别让人安心：

根据《劳动合同法》第三十条规定，“用人单位未按照约定支付劳动报酬，劳动者可以解除劳动合同。” 同时，根据最高人民法院的相关判例[2020]XX法判字第999号案件，法院认定雇员在工资未按时支付的情况下有权解除合同，并获得补偿。因此，依据这些法律条文和相关司法解释，雇员可以依法解除劳动合同，并要求支付相应的补偿。

在推理大模型的框架下，R1越发期待用户提示词的手法能像描述需求一样，不仅举报指令，还有完整的上下文，不仅提供问题还要提供问题的背景信息，这个拆解过程与5W2H很是类似，如果再加上权威引用，那就更妙了！

三、RAG本质：可信化解构

逻辑上以下四个问题，模型都无法解决，越是大的模型越难解决：

领域内部知识库，比如公司、医院内部知识库如何AI化；
信息过时，虽然模型信息更新迅速，但其信息依旧有一些滞后性，这对于被抖音教育的各位，显然是不够的。虽然有网页搜索功能但其成本和质量还需要做技术突破；
幻觉，这应该是模型最难的问题，特别是参数量大的问题，在不同领域之间源数据就可能产生逻辑层面的冲突，暂时看来能避免、难以根治，比如领域知识的模糊泛化（法律条文误读风险达37%）、决策过程的不可追溯（医疗诊断错误无法溯源）；
安全，因为模型海量数据来源于网络，那一定会有倾向性，比如R1模型在男性倾向性上就很大，如果做心理类咨询，多半是不能直接使用的；

RAG通过动态知识注入+向量检索+溯源标记构建三重防线以解决上述问题，其目的只有一个：用用户相信我的回答，并且让自己相信产品的回答！以法律场景为例：

A[用户提问] –> B(法条向量库)
B –> C{相似度阈值>0.82}
C –>|是| D[返回民法典第1073条]
C –>|否| E[触发人工审核]
D –> F[生成带条款编号的解析]

而RAG技术在每个公司都有一个持续增进的过程，大概是这样的：

以下是传统提示词工程与结构化Think框架的一些对比：

# 传统方式
prompt = f”请详细解释管理的本质，需要包含经典理论案例”

# Think框架
think_template = {
“分析需求”: “识别用户的知识层级（学生/管理者）”,
“知识图谱”: [
“德鲁克MBO理论”,
“明茨伯格管理角色”,
“华为铁三角案例”
],
“推理约束”: “避免混淆领导与管理的区别”,
“溯源要求”: “标注理论出处与案例来源年份”
}

其实所谓可信度也就是一个感觉罢了，不过是一个评价指标，我随便都可以胡诌几个玄的：

时空锚点：法律条文需标注”2023年修订版《民事诉讼法》第58条”；
置信度标注：医疗建议注明”基于2024年NEJM论文，置信度89.7%”；
反事实校验：”如果采用泰勒科学管理理论，可能产生哪些现代管理冲突？”；

这里的核心依旧是行业KnowHow的数字化沉淀。

四、数字化沉淀

其实所有的RAG本质都是结构化的数据库，只不过这个库能到什么程度端看行业认知以及持续建设情况，一般来说有四个评价维度：

1. 基础图谱

比如医疗领域基于ICD所做的疾病关系，很多CDSS的底层就是图谱；

金融领域也有FIN-NLP金融术语体系；

2. 流程规则

与其说流程规则不如说SOP，比如：化疗方案决策树、信贷审批流程图等。

逻辑上，只要能SOP就能数字化，能够数字化就一定能够AI化。

3. 数据更新

基础图谱只是第一步，更重要的是持续的更新，比如如何用专家会诊记录、操盘手交易日志分析等数据去持续自动化更新基础库，这是关键。

4. 异常处理

一定会有跳出图谱框架、SOP框架的行为，我们这里称之为AI意图溢出Case，这种Case要有专业的预案，要么放给大模型处理，严谨点就不处理。

其本质是黑天鹅事件，这种Case是系统升级的关键。

为了帮助各位理解，这里做更深入点的介绍：

5. 基础库案例

比如常见CDSS案例：ICD-11疾病分类本体

# ICD-11本体片段示例
class 疾病实体: def __init__(self):
self.名称 = “冠状动脉粥样硬化性心脏病”
self.编码 = “BA41.0”
self.父节点 = [
“心血管疾病”,
“慢性病”
]
self.关联症状 = [
“胸痛”,
“呼吸困难”
]
self.诊断标准 = {
“必要条件”: [
“心电图ST段改变”,
“心肌酶升高”
],
“排除条件”: [
“应激性心肌病”
]
}

这种是最理想的RAG数据源，比如：当AI处理”患者主诉胸痛”时，能自动关联到冠心病诊断路径，而非停留在字面理解。

再列举个金融案例，FIN-NLP金融术语体系，会有很多黑话：

银行语境：收益互换 = 利率风险管理工具；
投行语境：收益互换 = 结构化衍生品；
监管文件：收益互换 = 需备案的场外交易；

其底层依旧是数据库的结构化和后续的检索。

6. 流程规则

医疗案例：化疗方案决策树

传统依赖大模型跟医生靠自觉没什么两样，但如果遵循一套SOP，其下限就能得到充分保障：

graph TD A[患者特征] –> B{癌症类型}
B –>|乳腺癌| C[检测HER2表达]
C –>|阳性| D[曲妥珠单抗方案]
C –>|阴性| E[评估化疗敏感性]
E –>|敏感| F[AC-T方案]
E –>|耐药| G[基因检测驱动]

这里的SOP还能多样化，可以是协和医院顶级专家的决策模式、也可以是华西的决策逻辑，其本质都是可复用的算法。

信贷审批流程图也是同样，其规则是很简单的：

1.0时代：收入证明 > 2万 → 通过；
2.0时代：多头借贷数据 + 手机行为分析 → 风险评分；
3.0时代：供应链数据交叉验证 + 工商信息动态监控；

我的一个咨询客户通过分析企业主抖音账号经营数据（非结构化→结构化），发现隐性经营能力证据。

7. 飞轮系统的雏形

AI产品在使用过程中会产生各种数据，而这些数据都应该反哺系统本身。

比如传统专家的会诊意见以自由文本形式散落在病历系统中，我们应该将其结构化：

{
“病例ID”: “C202405001”,
“争议点”: “肺部结节性质判定”,
“张院士意见”: {
“观察维度”: [
“CT值变化曲线”,
“血管穿透特征”
],
“推理逻辑”: “虽体积<1cm但分叶征明显→建议PET-CT”,
“反共识说明”: “不同于指南但符合个人200例类似病例经验”
},
“知识标签”: [
“影像学特征”,
“诊断决策边界”
]
}

类似这种数据如果有个1000份，便会有巨大意义，李飞飞的1000个微调数据样本，其实也是精挑细选出来的。

再比如快递员配送日志分析：

# 数据库原始字段
delivery_log = {
“运单号”: “SF123456”,
“配送员”: “王师傅”,
“派件时间”: “2024-03-15 14:30”,
“包裹重量”: 3.2, # 公斤
“签收状态”: “已签收”
}

备注文本 = “客户电话要求放菜鸟驿站，因家中老人住院需陪护”

# NLP解析结果
deep_info = {
“需求类型”: “变更收货地址”,
“原因分类”: “家庭突发事件”,
“客户画像标签”: [
“家有老人”,
“医疗相关”
]
}

def 挖掘暗模式(配送记录):
# 关联外部数据源
天气数据 = 查询气象局API(配送记录[“时间”])
交通数据 = 获取交警事故通报(配送区域)
社区公告 = 爬取街道办公众号(日期)

# 构建关联模型
if 天气数据[“降雨量”] > 50mm:
return “极端天气影响系数”
elif “道路施工” in 社区公告:
return “基础设施变更预警”
elif 配送延迟 and 交通数据[“事故数”]激增:
return “突发交通事件响应”

# 输出示例暗知识标签 = “03-15暴雨红色预警期间，绕行导致平均配送时长增加22分钟”