首页 / AI工具 / KTransformers – 清华开源的大语言模型推理优化框架

AI工具

KTransformers – 清华开源的大语言模型推理优化框架

baidu09_com 2025-08-29 8 0

KTransformers是清华大学KVCache.AI团队联合趋境科技推出的开源项目，能优化大语言模型的推理性能，降低硬件门槛。KTransformers基于GPU/CPU异构计算策略，用MoE架构的稀疏性，支持在仅24GB显存的单张显卡上运行DeepSeek-R1、V3的671B满血版，预处理速度最高达到286 tokens/s，推理生成速度最高能达到14 tokens/s。项目用基于计算强度的offload策略、高性能算子和CUDA Graph优化等技术，显著提升推理速度。

KTransformers – 清华开源的大语言模型推理优化框架第1张

（图片来源网络，侵删）

KTransformers – 清华开源的大语言模型推理优化框架第2张

（图片来源网络，侵删）

清华开源软件站清华大学开源软件清华开源镜像清华大学开源镜像下载站 kali清华源2020 清华大学开源镜像站怎么用 kali 清华源

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13997.html

上一篇

边缘部署GenAI机遇与挑战并存，NPU成破局关键

下一篇

海湾机油使用感受怎么样？海湾机油质量很差吗

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部