高层次综合中PE处理单元

张

张建站

2026/5/13 11:35:09

10分钟阅读

一、PE概念1.PE也就是Processing Element处理单元。2.PE本质上是一个独立执行特定计算任务的硬件模块。3.PE在vivado hls设计中不是预先定义好的固定结构而是通过c/c代码进行设计并配合pragmas指令来定义的PE结构。二、PE的特点1.PE首先是模块化设计每个PE需要有清晰的输入和输出接口2.PE具备可复制性PE的实例化可以实现多个单元的并行设计三、PE的案例void mac_pe(float a, float b, float *acc) {#pragma HLS INLINE off#pragma HLS PIPELINE II1*acc a * b;}对函数使用inline off和pipeline进行优化其中inline off用于保证函数的独立性这个是PE的前提其中pipeline是对PE的性能进行优化设计。#pragma HLS PIPELINE II1则指定了流水线初始化间隔为1意味着每个时钟周期都能开始一次新的计算。四、PE的接口使用什么协议1.stream和pingpang-buffer是PE单元最理想的接口设计五、生产者-消费者模型#include hls_stream.hvoid producer(hls::streamint data_out) {#pragma HLS PIPELINE II1for(int i0; i1024; i) {data_out.write(i); // 写入数据到Stream}}void consumer(hls::streamint data_in) {#pragma HLS PIPELINE II1for(int i0; i1024; i) {int val data_in.read(); // 从Stream读取数据// 处理数据...}}void top_function() {#pragma HLS DATAFLOWhls::streamint data_stream;#pragma HLS STREAM variabledata_stream depth8producer(data_stream);consumer(data_stream);}六、PE实现的方式1.通过函数实例化多个PE2.通过循环分块将内存映射为PE3.使用dataflow和stream连接PE形成流水线或者网络常用结构vector向量PE矩阵阵列PE;七、使用函数来实现PE1.将PE封装为一个子函数2.将子函数使用inline off关闭内联3.PE内部使用pipeline进行优化设计4.多个PE之间使用#pragma hls dataflow进行优化八、循环展开映射PE1.可以将循环体的单次迭代封装为一个PE2.使用unroll将循环展开3.这样实现循环内部多个PE并行处理void top_parallel_dot(hls::streamint a[4], hls::streamint b[4],hls::streamint result[4], int len) {#pragma HLS DATAFLOWpe_dot_product(a[0], b[0], result[0], len);pe_dot_product(a[1], b[1], result[1], len);pe_dot_product(a[2], b[2], result[2], len);pe_dot_product(a[3], b[3], result[3], len);}

教育内容自动化运维：基于静态站点与CI/CD的实践指南

1. 项目概述：一个面向教育内容自动化的运维工作空间如果你也负责一个教育类网站或内容平台的日常更新，并且厌倦了手动上传文件、检查链接、生成报告这些重复性劳动，那么你可能会对sgdailyhub-ops这个项目背后的思路感兴趣。这不是一个直接面向…...

2026/5/13 11:34:09 阅读更多 →

局域网设备发现神器：5分钟掌握arp-scan完全指南

局域网设备发现神器：5分钟掌握arp-scan完全指南【免费下载链接】arp-scan The ARP Scanner 项目地址: https://gitcode.com/gh_mirrors/ar/arp-scan 你是否曾好奇自己的局域网里到底连接了多少设备？是否担心有陌生设备悄悄接入你的网络&#xff…...

2026/5/13 11:33:09 阅读更多 →

微信聊天记录永久保存：WeChatExporter免费备份方案完整指南

微信聊天记录永久保存：WeChatExporter免费备份方案完整指南【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 还在为误删微信聊天记录而烦恼吗？想要…...

2026/5/13 11:32:09 阅读更多 →

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…...

2026/5/12 13:39:41 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/12 8:30:03 阅读更多 →

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …...

2026/5/11 23:43:42 阅读更多 →