在亚马逊云科技中国峰会上,月之暗面 B 端负责人黄震昕透露,,互联网、金融、制造、教育、医疗等行业,都已经成为公司重要企业客户
黄震昕表示,最终还是希望探索智能的上限,希望能和海外那三家模型公司掰掰手腕。
黄震昕提到,用户对于高性能的 Token 需求有溢价支付意愿,但模型厂商也在通过 Cache 命中率优化、推理优化等技术努力,去对冲成本影响,将 Token 的实际成本往下拉。目前 Kimi 原厂服务的 Cache 命中率已经超过 90%。
6 月 12 日,月之暗面 Kimi 发布并开源 Kimi K2.7 Code 编程模型。据介绍,新模型相比 K2.6 模型显著提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。










