deepseek 的研发很密集,前几个月刚上线了 v2 的 chat 和 coder 模型,前两天又上线了 JSON output, Function Calling 等功能,今天又上线了输入缓存功能,据称是世界首例
- api 输入命中缓存的部分收费为 0.1 元/ 百万 token,也就是目前输入价格的 1/10
- 各用户缓存独立
- 仅缓存输入,不缓存输出。缓存命中从第 0 个 token 开始匹配。适用于长 prompt 和需要输入长预设对话的情况,降低成本、提高反应速度
多种应用能从上下文硬盘缓存中受益:
- 具有长预设提示词的问答助手类应用
- 具有长角色设定与多轮对话的角色扮演类应用
- 针对固定文本集合进行频繁询问的数据分析类应用
- 代码仓库级别的代码分析与排障工具