CANN/asc-devkit Mul乘法操作API

张

张建站

2026/5/11 18:58:45

10分钟阅读

Mul【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品 / Atlas A3 推理系列产品xAtlas A2 训练系列产品 / Atlas A2 推理系列产品x功能说明根据mask对输入数据srcReg0、srcReg1按元素相乘操作将结果写入dstReg。计算公式如下函数原型template typename T DefaultType, MaskMergeMode mode MaskMergeMode::ZEROING, typename U __simd_callee__ inline void Mul(U dstReg, U srcReg0, U srcReg1, MaskReg mask)参数说明表 1模板参数说明参数名描述T操作数数据类型。Ascend 950PR/Ascend 950DT支持的数据类型为uint16_t/int16_t/uint32_t/int32_t/half/float/bfloat16_t/uint64_t/int64_t/complex32/complex64mode选择MERGING模式或ZEROING模式。ZEROING, mask未筛选的元素在dstReg中置零。MERGING, 当前不支持。U目的操作数的RegTensor类型例如RegTensorhalf由编译器自动推导用户不需要填写。表 2参数说明参数名输入/输出描述dstReg输出目的操作数。类型为RegTensor。srcReg0输入源操作数。类型为RegTensor。两个源操作数的数据类型需要与目的操作数保持一致。srcReg1输入源操作数。类型为RegTensor。两个源操作数的数据类型需要与目的操作数保持一致。mask输入源操作数元素操作的有效指示详细说明请参考MaskReg。返回值说明无约束说明结果为不饱和模式位宽和srcReg位宽一致。调用示例templatetypename T __simd_vf__ inline void MulVF(__ubuf__ T* dstAddr, __ubuf__ T* src0Addr, __ubuf__ T* src1Addr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensorT srcReg0; AscendC::Reg::RegTensorT srcReg1; AscendC::Reg::RegTensorT dstReg; AscendC::Reg::MaskReg mask; for (uint16_t i 0; i repeatTimes; i) { mask AscendC::Reg::UpdateMaskT(count); AscendC::Reg::LoadAlign(srcReg0, src0Addr i * oneRepeatSize); AscendC::Reg::LoadAlign(srcReg1, src1Addr i * oneRepeatSize); AscendC::Reg::Mul(dstReg, srcReg0, srcReg1, mask); AscendC::Reg::StoreAlign(dstAddr i * oneRepeatSize, dstReg, mask); } }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

【渐进式披露】：从 UI 设计原则到 AI Agent 的上下文工程核心策略

【渐进式披露】：从 UI 设计原则到 AI Agent 的上下文工程核心策略写在前面：渐进式披露（Progressive Disclosure）是一个诞生于 1980 年代的 UI 设计原则，却在 2026 年成为了 AI Agent 工程师最热门的话题。为什么&…...

2026/5/11 18:57:10 阅读更多 →

小白程序员也能抓住的AI高薪机遇：大模型时代的机会与挑战

某书成立AI一级部门，预示着AI成为大厂核心战略。AI已从噱头渗透到工作和生活中，带来高薪机遇。AI大模型应用开发工程师年薪可达70万，薪资高源于需求大、供给少。无论技术岗还是非技术岗，AI都将创造更多机会。普通人应主动学习AI工…...

2026/5/11 18:55:22 阅读更多 →

从[SUCTF 2019]EasyWeb看无字母数字Webshell的构造与open_basedir绕过实战

1. 无字母数字Webshell的构造原理在CTF比赛中，经常会遇到需要构造无字母数字Webshell的场景。这类限制通常出现在代码执行漏洞中，题目会过滤掉所有字母和数字字符，使得传统的Webshell构造方法失效。这时候我们就需要利用PHP的一些特性来绕过…...

2026/5/11 18:54:19 阅读更多 →

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…...

2026/5/11 10:49:24 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/11 6:47:19 阅读更多 →

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …...

2026/5/10 0:09:21 阅读更多 →