从PCM到PDM：基于FPGA的Delta-sigma调制器设计与音频重构实践

张

张建站

2026/4/12 5:58:26

10分钟阅读

1. 数字音频处理的基础概念在开始讨论Delta-sigma调制器之前我们需要先理解几个关键的数字音频概念。PCM脉冲编码调制是目前最常见的数字音频格式它将模拟信号通过采样和量化转换为数字信号。每个采样点用16位或24位二进制数表示CD音质就是采用44.1kHz采样率、16位量化的PCM格式。PDM脉冲密度调制则是另一种数字音频表示方式它使用单比特数据流来表示音频信号。与PCM不同PDM通过脉冲的密度来传递信号幅度信息。这种表示方式的最大优势是只需要一根信号线就能传输音频数据非常适合简单的硬件实现。我第一次接触PDM音频是在一个嵌入式项目中当时需要在不增加额外DAC芯片的情况下实现音频输出。通过FPGA直接生成PDM信号配合简单的RC低通滤波器就成功还原出了可识别的音频信号。这种方案的硬件成本极低但音质却出乎意料地好。2. Delta-sigma调制原理详解Delta-sigma调制是连接PCM和PDM的关键技术。它的核心思想是通过过采样和噪声整形来提高信号的有效分辨率。简单来说就是通过牺牲采样率来换取更好的信噪比。二阶Delta-sigma调制器的工作原理可以用一个生活中的例子来理解想象你在往杯子里倒水目标是保持水位恒定。你不断观察当前水位与目标水位的差距减法器然后根据这个差距调整倒水的速度积分器。如果水位低了就加快倒水高了就减慢。最终你的倒水动作PDM输出的密度就反映了需要补充的水量。在数字域实现时调制器包含两个主要部分差分器和积分器。差分器计算输入信号与反馈信号的差值积分器则累加这些差值。最终通过比较器产生1位的PDM输出。这个输出又反馈回输入端形成闭环系统。3. FPGA实现方案设计基于FPGA实现Delta-sigma调制器需要考虑几个关键参数。首先是过采样率OSR它决定了系统的信噪比和最终音频质量。一般来说OSR在64到256之间就能获得不错的音质。在我的项目中我选择了128的过采样率这样在48kHz音频采样率下PDM时钟频率就是6.144MHz。Verilog实现的核心是积分器和比较器。下面是一个简化版的二阶调制器代码片段module delta_sigma_modulator ( input clk, input reset, input signed [15:0] pcm_in, output reg pdm_out ); reg signed [31:0] integrator1, integrator2; wire signed [31:0] feedback pdm_out ? 32767 : -32768; wire signed [31:0] error1 pcm_in - feedback; wire signed [31:0] stage1 integrator1 error1; wire signed [31:0] error2 stage1 - feedback; wire signed [31:0] stage2 integrator2 error2; always (posedge clk or posedge reset) begin if (reset) begin integrator1 0; integrator2 0; pdm_out 0; end else begin integrator1 stage1; integrator2 stage2; pdm_out (stage2 0); end end endmodule实际项目中还需要考虑时钟域转换问题因为PCM数据通常来自低速的音频接口而PDM生成需要高速时钟。我使用了一个异步FIFO来桥接这两个时钟域。4. 硬件设计与音频重构PDM信号最终需要通过模拟低通滤波器还原为音频信号。这个滤波器设计看似简单但实际上对音质影响很大。我最初尝试使用一阶RC滤波器10kΩ电阻100nF电容结果高频衰减不够导致明显的量化噪声。经过多次实验我发现二阶有源滤波器效果更好。使用一个运算放大器如常见的NE5532配合两个RC节截止频率设在20kHz左右。具体电路如下PDM输出 → 10kΩ → 100nF → 运放反相端 ↓ 10kΩ → 100nF → 输出 ↓ 运放输出这种配置下滤波器的滚降特性更陡峭能有效抑制高频噪声。在实际布线时要特别注意缩短模拟部分的走线长度避免引入额外的噪声。5. 系统优化与性能评估要获得最佳音质还需要调整几个关键参数。首先是积分器的位宽太窄会导致溢出太宽会浪费资源。我发现在二阶调制器中使用32位中间变量足够避免溢出同时不会过度消耗FPGA资源。另一个重要参数是直流偏移处理。由于PDM信号是单极性的0和1需要在数字前端加入直流偏置。我通常在PCM数据进入调制器前将其从有符号转换为无符号wire [15:0] unsigned_pcm pcm_in 32768;音质评估可以采用客观和主观两种方法。客观测试可以使用音频分析仪测量THDN总谐波失真加噪声好的设计应该能达到-60dB以下。主观测试就是直接听音注意是否有明显的背景噪声或失真。6. 实际应用中的问题排查在调试过程中我遇到过几个典型问题。首先是时钟抖动问题当PDM时钟不稳定时会导致明显的音频失真。解决方法是在FPGA中使用专用的时钟管理模块生成干净的低抖动时钟。另一个常见问题是pop噪声特别是在音频开始和停止时。这是由于积分器初始状态不确定导致的。我的解决方法是在系统复位时先将积分器清零然后渐进式地启动音频流。最棘手的问题可能是接地噪声。在第一个原型中数字地和模拟地没有处理好导致明显的嗡嗡声。后来采用星型接地策略将模拟部分单独接地问题才得到解决。7. 进阶应用与扩展掌握了基础实现后可以尝试一些进阶应用。比如实现立体声PDM输出只需要复制调制器模块分别处理左右声道。也可以尝试更高阶三阶或四阶的调制器虽然实现更复杂但能获得更好的高频性能。另一个有趣的扩展是直接使用麦克风PDM输入。现在很多MEMS麦克风都直接输出PDM信号配合FPGA可以实现完整的数字音频处理链路。我曾经用这种方案做过一个实时语音处理系统效果很不错。

抖音批量下载神器：douyin-downloader 完整使用指南

抖音批量下载神器：douyin-downloader 完整使用指南【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support.…...

2026/4/12 5:57:20 阅读更多 →

Phi-3-mini-4k-instruct长文本处理实战：128K上下文窗口应用案例

Phi-3-mini-4k-instruct长文本处理实战：128K上下文窗口应用案例 1. 引言想象一下，你需要分析一份上百页的法律合同，或者理解一篇复杂的科研论文，传统的大语言模型往往会在处理到后面时忘记前面的内容。这就是长文本处理的痛点所…...

2026/4/12 5:54:35 阅读更多 →

Java后端集成SDMatte：基于SpringBoot构建高并发图像处理服务

Java后端集成SDMatte：基于SpringBoot构建高并发图像处理服务 1. 为什么需要Java集成图像处理模型电商平台每天要处理数十万张商品图片的抠图需求，传统方案要么外包给设计公司（成本高、周期长），要么用Photoshop批量处…...

2026/4/12 5:54:11 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/12 0:00:08 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/12 0:01:49 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/12 0:07:16 阅读更多 →