Deepseek api 推出了输入缓存服务,降低固定长输入的价格和反应时间,命中缓存的输入部分价格降至 1/10

deepseek 的研发很密集,前几个月刚上线了 v2 的 chat 和 coder 模型,前两天又上线了 JSON output, Function Calling 等功能,今天又上线了输入缓存功能,据称是世界首例

  • api 输入命中缓存的部分收费为 0.1 元/ 百万 token,也就是目前输入价格的 1/10
  • 各用户缓存独立
  • 仅缓存输入,不缓存输出。缓存命中从第 0 个 token 开始匹配。适用于长 prompt 和需要输入长预设对话的情况,降低成本、提高反应速度

多种应用能从上下文硬盘缓存中受益:

  • 具有长预设提示词的问答助手类应用
  • 具有长角色设定与多轮对话的角色扮演类应用
  • 针对固定文本集合进行频繁询问的数据分析类应用
  • 代码仓库级别的代码分析与排障工具

DeepSeek 的 API 口碑好像不错,但它那个对话谜之不咋的——我之前问了两个问题都是答非所问气得我直接就注销了:joy:

我用的感觉还不错,很多情况下能替代 gpt4o,不过确实,要想获得合适的回答,deepseek 需要更详细的提示词,所以最好配合提前配置好的 prompt 使用:joy:

1 个赞