dataflow.CountBatch【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√函数功能CountBatch功能是指基于UDF为计算处理点将多个数据按batch_size组成batch。该功能应用于dataflow异步场景具体如下。长时间没有数据输入时可以通过CountBatch功能设置超时时间如果没有设置padding超时后取当前已有数据送计算处理点处理。设置超时时间后如果数据不满batch_size时可以通过CountBatch功能设置padding属性计算点根据padding设置对数据进行填充到batch_size后输出。函数原型CountBatch(batch_size0, slide_stride0, timeout0, paddingFalse)参数说明参数名称数据类型取值说明batch_sizeint64_t组batch大小。timeoutint64_t只有设置了batch_size时该参数才生效。组batch等待时间单位ms取值范围[0,4294967295)默认值是0表示一直等待直到满batch。paddingBool只有设置了batch_size和timeout时该参数才生效。不足batch时是否padding。默认值false表示不padding。slide_strideint64_t只有设置了batch_size时该参数才生效。滑窗步长取值范围[0,batch_size]。- 0,batch_size时表示启用滑窗方式组batch。- 不设置等于0等于batch_size时按照未设置滑窗步长方式组batch。- batch_size时报错。返回值正常场景下返回None。返回“TypeError”表示参数类型不正确。调用示例import dataflow as df # 按需设置count_batch中的各个属性值通过构造方法直接传入 count_batch df.CountBatch(batch_size300, slide_stride5,timeout10,padding300) # 先创建后设置count_batch的值 count_batch df.CountBatch() count_batch.batch_size 300 # 通过FlowNode的map_input接口使用 df.FlowNode(...).map_input(..., [count_batch])约束说明当前CountBatch特性无法做负荷分担因此如果使用2P环境需要在dataflow.init初始化时添加{ge.exec.logicalDeviceClusterDeployMode, SINGLE}, {ge.exec.logicalDeviceId, [0:0]}。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考