asc.language.basic.leaky_relu【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascasc.language.basic.leaky_relu(dst: LocalTensor, src: LocalTensor, scalar: int | float, count: int, is_set_mask: bool True) → Noneasc.language.basic.leaky_relu(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool True) → Noneasc.language.basic.leaky_relu(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool True) → None按元素执行Leaky ReLULeaky Rectified Linear Unit操作。对应的Ascend C函数原型template typename T, bool isSetMask true __aicore__ inline void LeakyRelu(const LocalTensorT dstLocal, const LocalTensorT srcLocal, const T scalarValue, const int32_t calCount)template typename T, bool isSetMask true __aicore__ inline void LeakyRelu(const LocalTensorT dstLocal, const LocalTensorT srcLocal, const T scalarValue, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams repeatParams)template typename T, bool isSetMask true __aicore__ inline void LeakyRelu(const LocalTensorT dstLocal, const LocalTensorT srcLocal, const T scalarValue, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams repeatParams)参数说明is_set_mask是否在接口内部设置mask模式和mask值。dst目的操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。src源操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。scalar源操作数数据类型需要与目的操作数中的元素类型保持一致。count参与计算的元素个数。mask用于控制每次迭代内参与计算的元素。repeat_times重复迭代次数。params元素操作控制结构信息。约束说明操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。调用示例tensor高维切分计算样例-mask连续模式mask 128 scalar 2 # repeat_times 4一次迭代计算128个数共计算512个数 # dst_blk_stride, src_blk_stride 1单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride 8相邻迭代间数据连续读取和写入 params asc.UnaryRepeatParams(1, 1, 8, 8) asc.leaky_relu(dst, src, scalar, maskmask, repeat_times4, repeat_paramsparams)tensor高维切分计算样例-mask逐bit模式mask [uint64_max, uint64_max] scalar 2 # repeat_times 4一次迭代计算128个数共计算512个数 # dst_blk_stride, src_blk_stride 1单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride 8相邻迭代间数据连续读取和写入 params asc.UnaryRepeatParams(1, 1, 8, 8) asc.leaky_relu(dst, src, scalar, maskmask, repeat_times4, repeat_paramsparams)tensor前n个数据计算样例asc.leaky_relu(dst, src, scalar, count512)【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考