DeepSeek官方推荐:R1要这样设置

量子位
0 评论 1845 浏览 3 收藏 4 分钟
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

作为当下热门的AI模型,DeepSeek的部署和使用方式一直是开发者和用户关注的焦点。本文汇总了DeepSeek官方对R1模型的最佳设置建议,供大家参考学习。

家人们,咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?

对于这个问题,DeepSeek官方发话了:

DeepSeek推荐的设置非常简单,只有四项内容。

其中三项,其实在此前相关文档中有所涉及,我们在这里再来回顾一下。

首先,是别用系统提示词(No system prompt),所有的指令都应该包含在用户提示词中。

至于原因,网友认为是因为R1就是这么被训练而来的。

其次,是把Temperature设置为0.6。

DeepSeek在GitHub文档中的解释是:

将Temperature设置在0.5-0.7(建议0.6)的范围内,以防止无休止的重复或输出不一致。

第三点,则是一份缓解模型绕过思维的指南,包含两个细分内容:

对于数学问题,建议在你的提示中包含一个指令,如:“请一步一步地推理,并将你的最终答案放在boxed{}内。”

在评估模型性能时,建议进行多次测试并对结果进行平均。

新的设置推荐

除了上述已有的三点之外,这次DeepSeek官方在推文中引入了一个新的推荐——官方提示搜索和文件上传。

DeepSeek表示:

上传文件时,请按照模板创建提示,其中{file_name}, {file_content}和{question}是参数。file_template = “””[file name]: {file_name}[file content begin]{file_content}[file content end]{question}”””
对于Web搜索,{search_results}, {cur_data}和{question}是参数。
对于中文查询,使用提示词:

对于英文查询,使用提示词:

相应内容在DeepSeek官方GitHub的README文档中也有更新,感兴趣的小伙伴可以进一步了解下~

DeepSeek官方GitHub:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

参考链接:

[1]https://x.com/deepseek_ai/status/1890324295181824107

[2]https://www.reddit.com/r/LocalLLaMA/comments/1i9k284/why_should_one_avoid_adding_a_system_prompt_with/

金磊 发自 凹非寺量子位 | 公众号 QbitAI

本文由人人都是产品经理作者【量子位】,微信公众号:【量子位】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
133155人已学习23篇文章
产品经理,除了会写竞品分析,还要会写产品分析。
专题
55155人已学习12篇文章
据说70%的问题都是沟通问题,沟通能力对产品经理太太太重要了。
专题
14551人已学习13篇文章
本文作者总结了那些踩过的坑,为大家详细的罗列出了规范的产品管理流程及规范。
专题
12964人已学习12篇文章
要想判断一个行业的趋势,就要做好行业分析。本专题的文章分享了如何撰写行业分析报告。
专题
12878人已学习11篇文章
在工作中我们会跟客户/boss/用户等人对接需求,并把需求交付给设计师/开发等人,那么应该怎么做呢,本专题的文章分享了如何对接和交付需求。
专题
13497人已学习14篇文章
企业架构可以辅助企业完成业务及IT战略规划,还是企业信息化规划的核心,也有助于个人职业的健康长远发展。本专题的文章分享了企业架构详解。