月之暗面MoonShot KimiChat API价格怎么计费的?

广告也精彩

计费逻辑解释

Input 和 Output 的计费规则

问题:如何对 Input 和 Output 进行计费?

答案:无论是上传文档内容作为 Input 还是将抽取的文档内容作为 Output 传输给模型,都是按量计费。但仅上传并抽取文档,不会产生费用。

API限速原因

问题:为什么要对API实行限速?

答案:限速主要基于以下几点考虑:

  1. 防止API滥用或误用,如防范恶意大量请求导致服务中断。
  2. 确保公平访问,避免个别用户过多请求拖慢API速度。
  3. 管理集群总负载,避免请求急剧增加导致服务器性能问题。

产品定价

文本生成模型 Moonshot-v1 定价表

模型及价格

  • moonshot-v1-8k:1M tokens 价格为 ¥12.00 1000token 价格为0.012
  • moonshot-v1-32k:1M tokens 价格为 ¥24.00 1000token 价格为0.024
  • moonshot-v1-128k:1M tokens 价格为 ¥60.00 1000token 价格为0.060
  • 注释:这里的 1M 指的是 1,000,000 tokens。

模型区别

答案:不同模型的最大上下文长度不同,但在效果上并无区别。

充值与限速

用户等级及限速规则

表格解释

用户等级根据累计充值金额划分,影响并发请求、每分钟请求(RPM)、每分钟token数(TPM)和每日token数(TPD)。

  • Free 等级:无充值,限制为 1 并发,3 RPM,32,000 TPM 和 1,500,000 TPD。
  • Tier1 等级:累计充值 ¥50,限制提升至 50 并发,200 RPM,128,000 TPM 和 10,000,000 TPD。
  • Tier2 等级:累计充值 ¥100,限制为 100 并发,500 RPM,128,000 TPM 和 20,000,000 TPD。
  • Tier3 等级:累计充值 ¥500,限制为 200 并发,5,000 RPM,384,000 TPM 和无限制的 TPD。
  • Tier4 等级:累计充值 ¥5,000,限制为 400 并发,5,000 RPM,768,000 TPM 和无限制的 TPD。
  • Tier5 等级:累计充值 ¥20,000,限制为 1,000 并发,10,000 RPM,2,000,000 TPM 和无限制的 TPD。

限速概念详解

各项指标解释

  • 并发:指同一时间内处理的最多请求数。
  • RPM (request per minute) :一分钟内最多发起的请求数。
  • TPM (token per minute) :一分钟内最多交互的token数。
  • TPD (token per day) :一天内最多交互的token数。

特别说明

集群负载应对措施

当集群负载达到上限时,可能会采取临时限流措施调整各类限速。代金券不计入累计充值总额。


通过上述内容的解释和梳理,我们可以了解到API的计费逻辑和限速机制都是为了保证服务的稳定性和公平性。文本生成模型的定价策略清晰明了,并且用户等级制度让用户根据自己的需求选择合适的服务等级。整体上看,这种机制既保证了服务提供者的利益,也保护了用户的权益。感觉上这样的设计体现了一种互联网服务的普遍逻辑——既要防范风险,又要尽量满足不同用户的需求。

标签:计费逻辑, API限速, 产品定价, 用户等级, 限速规则

© 版权声明
chatgpt4.0

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...
error: Content is protected !!