CANN/HCCL Server间通信算法支持度列表

张

张建站

2026/5/9 18:38:16

10分钟阅读

Server间通信算法支持度列表【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl下面分别给出Server间不同型号的产品支持的算法以及对应算法下支持的通信算子介绍表格中未列出的则代表不支持。Ascend 950PR/Ascend 950DTNHR算法集合通信算子数据类型网络运行模式通信算子展开模式ReduceScatterint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDAllGatherint8、int16、int32、int64、uint8、uint16、uint32、uint64、float16、float32、float64、bfp16、fp8-e5m2、fp8-e4m3、hif8、fp8-e8m0- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDAllReduceint8、int16、int32、float16、float32、 bfp16- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDBroadcastint8、int16、int32、int64、uint8、uint16、uint32、uint64、float16、float32、float64、bf16、fp8-e5m2、fp8-e4m3、hif8、fp8-e8m0- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDReduceint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDScatterint8、int16、int32、int64、uint8、uint16、uint32、uint64、float16、float32、float64、bf16、fp8-e5m2、fp8-e4m3、hif8、fp8-e8m0- 单算子模式AI_CPU/CCU_SCHEDBroadcastint8、int16、int32、int64、uint8、uint16、uint32、uint64、float16、float32、float64、bf16、fp8-e5m2、fp8-e4m3、hif8、fp8-e8m0- 单算子模式- 图模式Ascend IRAI_CPU/CCU_SCHEDAtlas A3 训练系列产品/Atlas A3 推理系列产品ring算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法Reduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法ReduceScatterVint8、int16、int32、int64仅单算子模式支持此数据类型、float16、float32、bfp16- 单算子模式自动选择为NHR或者H-D_R算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR或者H-D_R算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR或者H-D_R算法NHR算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法ReduceScatterVint8、int16、int32、int64仅单算子模式支持、float16、float32、bfp16- 单算子模式自动选择为H-D_R或者ring算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为H-D_R或者ring算法NB算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法ReduceScatterVint8、int16、int32、int64仅单算子模式支持、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法AHC算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Atlas A2 训练系列产品/Atlas A2 推理系列产品ring算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllGatherint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllReduceint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法Reduceint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法ReduceScatterVint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法Scatterint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式自动选择为NHR或者H-D_R算法AllGatherVint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法H-D_R算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法Reduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法NHR算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法ReduceScatterVint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法NHR_V1算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法NB算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法ReduceScatterVint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法pipeline算法注意针对Atlas A2 训练系列产品/Atlas A2 推理系列产品如果选择pipeline算法不支持开启确定性计算否则pipeline算法不会生效。集合通信算子数据类型网络运行模式不支持算子处理方法AllReduceint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IR针对浮点计算的溢出模式不支持饱和模式仅支持INF/NaN模式。自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法ReduceScatterint8、int16、int32、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AlltoAllint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR的动态shape场景自动选择为pairwise算法AlltoAllVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR的动态shape场景自动选择为pairwise算法AlltoAllVCint8、int16、int32、int64、float16、float32、bfp16- 图模式Ascend IR的动态shape场景自动选择为pairwise算法pairwise算法集合通信算子数据类型网络运行模式不支持算子处理方法AlltoAllint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AlltoAllVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AlltoAllVCint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法CP算法集合通信算子数据类型网络运行模式不支持算子处理方法AlltoAllVint8、int16、int32、int64、float16、float32、bfp16单算子模式自动选择为pairwise算法Atlas 训练系列产品ring算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllGatherint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法AllReduceint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法Reduceint8、int16、int32、 int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者H-D_R算法H-D_R算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法Reduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR或者ring算法NHR算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为H-D_R或者ring算法NHR_V1算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法NB算法集合通信算子数据类型网络运行模式不支持算子处理方法ReduceScatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllGatherint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法AllReduceint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法Broadcastint8、int16、int32、int64、float16、float32、bfp16- 单算子模式- 图模式Ascend IR自动选择为NHR、H-D_R或者ring算法ReduceScatterVint8、int16、int32、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法AllGatherVint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法Scatterint8、int16、int32、int64、float16、float32、bfp16- 单算子模式自动选择为NHR、H-D_R或者ring算法【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

从arm64-v8a到x86_64：一文读懂Android应用兼容性与性能选择的底层逻辑

1. 为什么你的安卓应用安装失败？CPU架构的隐形门槛上周帮朋友安装一个开源阅读器时，遇到了典型的兼容性问题。他兴冲冲下载了APK，结果安装时弹出"此版本与你的系统不兼容"的提示。这种情况就像拿着Type-C充电器找iPhone的Lightnin…...

2026/5/9 18:37:44 阅读更多 →

从73.7到89.5，HALO 智能体用“轨迹分析“实现了递归自我进化

HALO (Hierarchical Agent Loop Optimization) 一个递归自改进的智能体框架，在 AppWorld 测试的成绩将原有智能体的表现，从 73.7 提升至 89.5。而89.5 的成绩意味着接近实用级别。一、核心理念HALO 的核心思想可以用一个闭环来概括：收集 Agen…...

2026/5/9 18:37:01 阅读更多 →

Magisk终极指南：为Android设备安全获取Root权限的完整教程

Magisk终极指南：为Android设备安全获取Root权限的完整教程【免费下载链接】Magisk The Magic Mask for Android 项目地址: https://gitcode.com/GitHub_Trending/ma/Magisk Magisk是一款革命性的Android系统修改工具，它通过"系统无痕"…...

2026/5/9 18:36:43 阅读更多 →

环境配置与基础教程：2026自动化标注黑科技：使用 Segment Anything (SAM) 零样本辅助标注 YOLO 分割与检测数据集

编者按在计算机视觉项目中，数据标注一直是最让人头疼的环节。根据社区普遍反馈（源自多个CSDN项目经验和公开技术报告），传统人工标注一张包含精细多边形掩码的图像需要3到10分钟，而一个完整的实例分割数据集往往需要上千张图片。如果你曾经带领团队连续加班数周只为了完成…...

2026/5/8 18:17:36 阅读更多 →

如何3步完成TikTok评论数据采集：开源工具的高效实战指南

如何3步完成TikTok评论数据采集：开源工具的高效实战指南【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper TikTokCommentScraper是一个专为抖音内容创作者、市场分析师和社区运营者设计的开源数据…...

2026/5/8 11:05:15 阅读更多 →