AI,个人随笔 当模型开始“思考”:CoT 到底在训练什么? RAG 项目上线后,开发者们往往会陷入一个误区:只要答案正确,模型就算成功。但当模型开始展露思考过程(CoT),你会发现真相远非如此——推理中的逻辑漏洞、无效信息与错误前提瞬间暴露无遗。本文深度拆解 Chain of Thought 的本质不是让 AI 更聪明,而是教会它如何用人类认可的思维方式「正确地犯错」,揭示从 Prompting 到 RM 的多重约束如何共同塑造可信赖的 AI 推理能力。 青蓝色的海 AI训练CoTRAG
AI,个人随笔 RAG 数据到底怎么标?一套“能落地”的判断与取舍逻辑 RAG项目的标注工作远非简单的答案打分,而是充满抉择的艺术。从数据取舍到材料可信度判断,每一步都在考验标注者的专业判断力。本文将揭示RAG标注中的五大关键决策点,带你掌握如何在信息不完美的现实环境中,训练出真正有价值的AI回答。 青蓝色的海 AI应用AI训练RAG
AI,个人随笔 从 ChatGPT 到 Llama 3:大模型训练全流程拆解,小白也能轻松拿捏🤖 大模型已成我们的万能工具人,但你是否好奇它们为何时而精准时而离谱?本文以拆盲盒般的趣味方式,揭秘AI从‘疯狂刷网’的预训练到‘学会唠嗑’的后期训练,再到‘刷题变机灵’的强化学习全流程。无公式纯干货,看完秒懂AI为何能当学霸也会社死,比身边朋友更懂大模型的门道! 游进模型海 AI训练ChatGPTDeepSeek
AI,个人随笔 总结:模型为什么越来越像人,而你为什么会在意这一点 大模型的每一次进化,背后都是人类经验的深度编码。从预训练的基础语言理解,到SFT的行为规范,再到RLHF的情感分寸,这条技术链的本质是人类如何将自己的沟通逻辑、价值判断和社交规则系统化地注入AI。本文将揭示大模型训练过程中那些看不见的人类‘脚手架’,以及它们如何塑造AI的行为边界与人格特质。 青蓝色的海 AI训练DPORLHF
AI,个人随笔 详解AI训练的“黑话”什么是微调、RAG、RM、TTS、ASR 随着AI技术加速落地,围绕模型训练的术语也在快速扩散。微调、RAG、RM、TTS、ASR……这些“黑话”不仅是技术标签,更是理解AI能力边界的关键入口。本文将系统梳理这些核心概念,帮助产品人、运营者、内容创作者建立对AI训练机制的底层认知。 胡宇学AI AI训练基础知识技术原理
业界动态 人类抵抗,番茄小说的AI作者上岗失败 在阅读平台番茄小说,一场关于AI写作的风波正在网络文学作者中酝酿。本文将探讨番茄小说AI写作工具的引入如何引发了作者们的集体抵制,以及这一事件对网络文学创作和版权保护的深远影响。 电厂 AI训练内容创作知识产权
个人随笔 被番茄小说当做AI训练“花肥” 网文作者联合说不 前段时间,网文作者控诉番茄小说让作者签约协议,要让自己的作品成为AI训练的语料。都知道语料是大模型发展的关键,但番茄此举,还是引起了众多不满。 唐辰同学 AI训练大模型番茄小说
个人随笔 AI席卷音乐圈,索尼音乐率先“退出群聊” 自从大模型兴起后,算力和语料就是各家必争之地。而衍生的版权问题悬而未决,一直也是困扰各大公司、国家的难题。而索尼音乐退出大模型的训练,就和这些事儿有关。 音乐先声 AI训练AI音乐索尼
AI 月薪7万,我教AI炒股 如今,券商对于人工智能的需求越来越多,而这些智能项目的发展,离不开“AI训练师”,他们日常便是协助券商的在线客户、交易系统、风控平台等项目进行人工智能的训练。如果你对“AI训练师”这个职业感到好奇,那就一起来看一下吧。 时代财经 4年AI训练中级