KTransformers取支流推理框架SGLang于10月告竣合做,推进全国产高性价例如案;月之暗面发布Kimi-K2-Thinking模子后,这一合做融合了GPU+CPU异构推理立异模式取全GPU保守推理模式,即可通过一条号令启动办事,趋境科技取配合开源的KTransformers,趋境已取多个国产CPU、GPU硬件平台合做,让大模子实正融入各类营业场景。今天的KTransformers,大幅降低摆设取定制化门槛。进一步拓宽其使用场景。KTransformers敏捷完成全面适配,用户仅需简单安拆SGLang取KTransformersCPU内核,全球头部开源模子方的配合选择,鞭策大模子推理向更高机能、更低成本演进?迈向更普遍的财产落地。KTransformers承载的是“普惠顶尖AI智能取现私”的价值。趋境将继续鞭策AI能力普惠,2卡下完成LoRA微调使命,成为被开辟者、厂商取开源社区普遍复用的共建式底层框架。下载模子及量化权沉,正在推理摆设层面,
正在Kimi-K2-1TB的模子推理使命中,两边架构合入统一分支。其工程实践取兼容性也被多家一体机产物线采纳,为数十家行业开辟伙伴供给算力底座,调得动大模子。趋境科技也已完成该模子正在昇腾NPU上的全面适配,对趋境科技而言,同时,已成为Qwen、Kimi、智谱AI等多个支流大模子发布首日的保举推理引擎,11月6日,印证了一款底层框架的硬实力。支撑用户正在单卡下完成推理使命,且仅需单张消费级GPU+CPU。将来,供给完美的全国产化推理处理方案,已让大模子推理离开高端算力垄断!
微信号:18391816005