加速替代CUDA!摩尔线程开源vLLM
11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。
摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。
vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
-
从湖人到雄鹿哈姆活成名梗主角 未来他还能复出任主帅吗?[流言板]状态全无!拉文全场16投仅4中,得到8分4篮板9助攻1封盖小胖发文:感谢ag送我们下来历练,他们以为击败我就是终结,而我必归来将之改写!魔术连续6场比赛将对手得分限制在100分以内 2018年以来首队北京环球度假区官方旗舰店入驻抖音 官方直播将推多款优惠产品《驯龙高手》真人版电影首支预告泄漏 2025年上映爱德华兹:福克斯是联盟最佳控卫之一 他被所有人低估了一哥谈三球因歧同被罚款:NBA的球迷基数很大 不能冒犯任何群体索内斯:阿莫林很难取得成功,瓜帅执教这支曼联也不会赢英超冠军小胖发文:感谢ag送我们下来历练,他们以为击败我就是终结,而我必归来将之改写!
- ·媒体人:前梅州外援康拉德近期和几支中超球队接触 本人想回中超
- ·现有老数据全部删除!苹果宣布iOS 8及更早版本不再支持iCloud备份
- ·没存在感!爱德华兹半场5中2拿4分4助 正负值
- ·钟睒睒:我永远不会直播带货
- ·泰晤士报:曼联高层把拉什福德的未来完全交给阿莫林来决定
- ·罚款预警!爱德华兹比赛中朝球迷竖中指 不过转播方很快就切掉
- ·沃特福德:我几乎什么都能干 对于球队而言我像一把瑞士军刀
- ·《戴森球计划》载具系统开发画面公布 上线时间待定
- ·巴萨社媒晒伯纳尔康复训练视频:继续加油!
- ·《驯龙高手》真人版电影首支预告泄漏 2025年上映
- ·[流言板]手感一般!怀特全场20中7,三分12中3得到18分5板4助2盖帽
- ·沉浸式第三人称开放世界RPG《灰雨钢锋》Steam页面上线 支持简体中文
- ·理想同学AI大模型APP抢鲜体验:识物精准、语音交互流畅
- ·魔术连续6场比赛将对手得分限制在100分以内 2018年以来首队
- ·没存在感!爱德华兹半场5中2拿4分4助 正负值
- ·《真三国无双:起源》和系列其他游戏有何不同?