低比特散斑成像：用二值化数据实现穿透散射介质的清晰重建与追踪

张

张建站

2026/5/28 21:52:05

10分钟阅读

1. 项目概述当光遇到“毛玻璃”我们如何看清背后的世界想象一下你隔着一块磨砂玻璃散射介质去看后面的物体眼前只有一片模糊、随机闪烁的光斑散斑。在传统认知里这几乎等于“失明”。然而计算成像技术正是一门“化腐朽为神奇”的学科它通过精妙的算法从这些看似无意义的光斑中逆向推演出被隐藏物体的清晰图像甚至能实时追踪它的运动轨迹。这听起来像魔法但其背后是坚实的物理原理和信号处理技术。散斑自相关成像正是这类技术中的一颗明珠它无需事先了解散射介质的特性即“非侵入性”仅凭单张散斑图就能进行重建在生物组织成像、穿雾观测、水下探测等领域潜力巨大。但这项技术面临一个现实瓶颈高质量成像通常需要相机记录高比特深度如16位的原始散斑数据这意味着巨大的数据量和存储压力以及对相机硬件如模数转换器ADC的高要求严重制约了其在动态、实时场景如活体细胞观测、高速运动追踪中的应用。那么一个核心问题浮现了我们是否真的需要如此“丰富”的数据能否用更“简陋”的信息实现同样的目的这正是我们今天要深入探讨的核心低比特深度散斑成像与追踪。这项研究直击痛点它挑战了“数据越丰富结果越精确”的直觉。通过系统性的仿真与实验我们将揭示一个反直觉的结论即使将散斑图二值化只剩下纯黑和纯白我们依然能够高精度地重建目标图像并追踪其运动轨迹。这不仅大幅降低了对相机硬件成本和数据存储的需求更关键的是数据量的锐减意味着数据传输和处理速度的飞跃为真正的实时、高速计算成像应用打开了新的大门。无论你是光学工程的研究者还是对计算摄影、计算机视觉感兴趣的开发者理解这套“以简驭繁”的思路都将为你打开一扇新的窗户。2. 核心原理拆解为什么“简陋”的散斑依然有效要理解低比特深度散斑为何能工作我们必须先回到散斑成像的物理基石——记忆效应。这不是计算机的内存而是光在无序介质中传播时表现出的一种惊人特性。2.1 记忆效应散射介质中的“空间平移不变性”当一束光穿过像毛玻璃这样的强散射介质时出射光场会形成一个极其复杂、随机的散斑图案。然而Freund等人在1988年发现如果入射光的倾斜角度在一个很小的范围内约λ/πl其中λ是波长l是散射介质的有效厚度变化那么产生的不同散斑图案之间并非完全独立而是高度相关的。简单来说当你微微移动光源或物体时产生的散斑图案会整体发生一个对应的、一致的平移。生活类比你可以把散射介质想象成一个充满无数微小镜子的混乱房间毛玻璃内部的微小颗粒。当你在房间一侧移动手电筒改变入射角时墙上的光斑图案散斑会整体滑动但图案本身的“纹理”结构几乎不变。这种“纹理结构不变只发生整体平移”的特性就是记忆效应的直观体现。这种“平移不变性”是散斑自相关方法的生命线。它意味着散斑图案虽然看起来随机但其内部结构即点扩散函数PSF在记忆效应范围内是稳定的。因此相机记录到的散斑图I可以近似看作是目标物体O与这个稳定的散射系统点扩散函数PSF的卷积结果I ≈ O * PSF。2.2 自相关与相位恢复从卷积中“解”出目标知道了I O * PSF我们的目标是从I中恢复O。直接解卷积非常困难因为PSF未知且极其复杂。这里的关键转折在于自相关运算。根据卷积定理和维纳-辛钦定理一个信号的自相关函数等于其功率谱的逆傅里叶变换。更重要的是对于I O * PSF其自相关R_I满足R_I (O * PSF) ⋆ (O * PSF) (O ⋆ O) * (PSF ⋆ PSF)。而在满足记忆效应的条件下PSF的自相关(PSF ⋆ PSF)近似为一个尖锐的峰值狄拉克δ函数。因此散斑图I的自相关R_I近似等于目标物体O的自相关R_O。R_O丢失了物体的相位信息但保留了其傅里叶域的幅度信息。此时经典的迭代相位恢复算法如Fienup算法就可以登场了。该算法在已知R_O即从R_I测得的前提下通过施加物体在实空间的支持域约束如非负性、有限尺寸在傅里叶域幅度已知相位未知和实空间之间反复迭代最终收敛从而从自相关函数中“猜”出最可能的原始物体图像O。2.3 低比特量化的关键保留结构舍弃细节现在来到最核心的部分为什么对散斑图进行大幅度的量化降低比特深度甚至二值化仍然能成功成像和追踪其根本原因在于无论是成像还是追踪我们所依赖的核心信息是散斑图案的空间结构相关性而非其精确的灰度强度值。对于成像自相关自相关运算R I ⋆ I的核心是计算图像中不同位置的相似性。二值化虽然粗暴地将灰度图变为黑白图但它极大地强化了散斑图案中明暗区域的对比度和边界。只要二值化过程没有彻底破坏散斑颗粒之间的相对空间分布结构即亮斑和暗斑的相对位置关系那么计算出的自相关函数的峰值位置和整体轮廓就不会发生本质改变。自相关函数的形状决定了相位恢复算法的输入只要这个输入的主体结构正确算法就有很大概率收敛到正确的解。对于追踪互相关追踪运动物体时我们比较的是连续时刻的两张散斑图I_t和I_{t1}。通过计算它们的互相关函数其峰值的位置偏移量就对应了物体的位移。二值化后的散斑图其互相关函数的峰值可能不如原始图锐利但峰值的位置几乎不受影响。因为决定峰值位置的是两幅图案中“亮斑集群”的整体偏移二值化反而可能抑制了噪声使这种整体偏移的检测在某些情况下更鲁棒。实操心得这里有一个微妙的平衡。量化比特深度过低如1比特虽然保留了结构但会引入量化噪声可能降低重建图像的信噪比(PSNR)。然而研究表明当比特深度从8位降至2-4位时PSNR的下降并不显著直到1比特时才有较明显损失。这意味着在实际系统中我们完全可以在图像质量和数据效率之间找到一个极佳的折中点。3. 从仿真到实验低比特散斑的实战验证理论需要实验的支撑。我们遵循“仿真先行实验验证”的路径来具体看看低比特散斑如何工作。3.1 仿真搭建在计算机中构建散射世界在动手搭建昂贵的光学平台之前用MATLAB或Python进行仿真是成本最低、效率最高的验证方式。我们的仿真流程严格遵循物理模型定义目标物体通常用一个高对比度的二值图像开始比如字母“H”或“X”。这简化了问题便于评估重建效果。生成随机PSF模拟散射介质。我们可以生成一个尺寸远大于物体的随机矩阵例如服从复高斯分布其傅里叶变换的幅度平方的逆变换可以模拟一个散斑图案的PSF。更简单的做法是直接用一个随机矩阵作为PSF的近似。卷积生成散斑将标物体O与生成的随机PSF进行卷积操作得到模拟的原始散斑图I_raw。此时I_raw是一个浮点数矩阵。均匀量化对I_raw应用均匀量化器。假设要将8位数据0-255量化为n位。量化步长δ (max(I_raw) - min(I_raw)) / 2^n。然后对每个像素值I_raw(i, j)应用公式Q(I) δ * floor(I/δ) δ/2。当n1时就是二值化通常以中值或均值为阈值进行划分。计算自相关对量化后的散斑图I_quant计算其自相关R ifft2(|fft2(I_quant)|^2)。这里用到了快速傅里叶变换(FFT)来高效计算。相位恢复重建将上一步得到的自相关R作为输入送入迭代相位恢复算法。算法通常从随机相位开始在实空间施加支持域约束如物体非负、尺寸有限和傅里叶空间用sqrt(R)作为幅度约束之间迭代直至收敛。仿真结果会清晰地展示即使使用二值化散斑图1e其自相关图图1f与原始散斑的自相关图图1c在主体结构上高度相似最终都能重建出可识别的字母“H”图1g。3.2 实验系统搭建把仿真搬进实验室仿真验证了原理的可行性接下来就需要用真实的光学和散射介质来检验。一个典型的实验光路如图2所示光源采用中心波长625nm的LED并经过准直形成空间非相干光。非相干光可以抑制激光散斑的相干噪声使散斑更稳定。物体使用光刻制作的金属掩模版图案为字母“X”尺寸约750μm。这个尺寸必须小于记忆效应范围实验中约1.5mm。散射介质一块220 grit的毛玻璃地面玻璃扩散片这是产生强散射的标准元件。成像系统物体距毛玻璃u190mm毛玻璃后放置一个孔径光阑限制视场再后是CCD相机距毛玻璃v100mm。系统放大率M v/u ≈ 0.526。数据采集固定物体CCD采集一张原始散斑图8位。然后通过计算机程序对这张图进行6、4、3、2、1比特的均匀量化生成一系列低比特散斑图。注意事项实验中的关键是对准和稳定性。任何微小的振动都会导致散斑图案变化破坏记忆效应假设。因此光学平台必须具有隔振功能所有元件需牢固固定。此外孔径光阑的大小需要优化太小会损失光通量降低信噪比太大会引入超出记忆效应范围的光线降低相关性。3.3 结果分析数据压缩的代价与收益处理实验采集的数据我们得到如图3所示的结果。第一行是不同比特深度的散斑图第二行是其自相关图第三行是重建出的物体图像。核心发现如下重建质量随比特深度下降但存在“拐点”使用峰值信噪比(PSNR)量化重建图像与理想图像的差异。如图3所示从8比特到6、4比特PSNR下降非常轻微图像质量肉眼几乎难以区分。从3比特到2比特开始有可见的噪点增加。到1比特二值化时PSNR下降最明显但字母“X”的形状依然被清晰重建。这说明将比特深度从8位压缩到2-4位是性价比极高的选择能以极小的质量损失换取75%-87.5%的数据量压缩。自相关图对量化不敏感对比图3第二行各图不同比特深度散斑的自相关图几乎一模一样。这直接证明了我们之前的论断自相关运算依赖的是结构对灰度细节不敏感。这对于那些只依赖自相关或互相关结果而不需要最终图像的应用如某些类型的传感器或触发器极具价值。硬件与存储收益对于相机低比特深度意味着ADC可以更简单、更快帧率可以更高。对于存储和传输数据量呈指数级下降。原本存储一张1024x1024的8位图像需要1MB二值化后仅需128KB为高速连续拍摄和实时处理扫清了障碍。4. 动态目标追踪二值化散斑的用武之地成像解决了“是什么”的问题而追踪要解决“去哪儿了”的问题。在散射介质后追踪运动物体是更具挑战性的任务。低比特散斑在这里展现出更大的优势。4.1 基于互相关的追踪原理追踪不依赖于重建出清晰的图像。其核心思想是物体在记忆效应范围内发生微小位移时其产生的散斑图案会整体平移。因此比较连续两帧散斑图I_t和I_{t1}的互相关函数其峰值的位置(Δx, Δy)就直接对应了物体在x和y方向上的位移。位移(ΔX_obj, ΔY_obj)与散斑偏移像素数(Δx_pix, Δy_pix)的关系由系统放大率M决定ΔX_obj Δx_pix * p / M其中p是相机像元尺寸。实验中我们通过已知的物体位移来标定这个比例系数C公式5。4.2 实验与结果二值化追踪的精度验证实验设置如图2但物体被置于一维平移台上按预设轨迹运动先沿x轴移动再沿y轴最后沿对角线返回。在每个移动步长500μm后采集一帧散斑图。我们同时处理原始8位散斑序列和将其二值化1位后的序列。对于每一对连续帧分别计算原始散斑和二值化散斑的互相关图对比图4c和4g。结果显示两者的互相关峰位置完全一致。将计算出的所有位移连接起来就得到了物体运动的复原轨迹图4h。可以看到由原始散斑和二值化散斑计算出的轨迹高度重合且都与物体的真实运动轨迹完美匹配。4.3 超越记忆效应范围的大范围追踪这里有一个精妙的要点记忆效应范围本例约1.5mm限制的是单次曝光内物体移动后散斑还能保持相关性的最大距离。也就是说物体每一步的移动步长500μm必须小于这个范围。但是物体的总运动范围可以远远超过记忆效应范围。如图4d所示物体在x方向的总位移达到了4.5mm是记忆效应范围的3倍。这是因为追踪是“步进式”的只要每一步的移动在记忆效应内我们就能通过连续帧的互相关准确测出这一步的位移。将这些小位移累加起来就能还原出长距离的运动轨迹。这极大地拓展了该技术的实用场景。避坑指南在实际追踪中有两个常见问题。一是累积误差每一步的微小测量误差会随着步数增加而累积。解决方法是在轨迹中引入已知的参考点或闭环路径进行校正。二是丢失跟踪当物体移动过快或突然被遮挡导致连续帧散斑完全不相关。此时需要结合预测算法如卡尔曼滤波或扩大搜索范围来重新捕获目标。使用二值化数据能更快地计算互相关为实施更复杂的实时跟踪算法赢得了时间裕度。5. 系统实现要点与参数选择考量要将这项技术从论文搬到实际应用有几个关键的工程实现细节需要仔细考量。5.1 光源与照明的选择空间相干性激光会产生严重的相干散斑噪声图案对比度高但稳定性差易受环境振动影响。LED等非相干光源产生的散斑对比度较低但更稳定更适合需要长时间观测或动态追踪的场景。波长记忆效应范围Δθ ≈ λ/(πl)。波长λ越长记忆效应角范围越大能容忍的物体位移或系统不对准量也越大。但长波长可能带来衍射极限分辨率下降的问题。需要在视场范围和分辨率之间权衡。均匀性物体照明必须均匀否则不均匀的亮度分布会被卷积进散斑在重建图像中引入伪影。5.2 散射介质与记忆效应范围评估介质选择常用的有毛玻璃、乳白玻璃、甚至生物组织切片。介质的散射强度由厚度l和散射系数决定直接影响记忆效应范围。l越大散射越强记忆效应范围越小但散斑对比度可能更高。范围测量在实际应用中需要预先标定系统的记忆效应范围。一个简单的方法是固定系统让物体平移一小段距离Δd计算两幅散斑图的互相关峰值。逐渐增加Δd当互相关峰值下降到初始值的一半时对应的Δd即可近似认为是记忆效应在物平面的范围。这决定了追踪时单步移动的最大允许距离。5.3 量化策略与比特深度选择均匀量化是最简单的策略但并非最优。在实际中可以考虑自适应量化根据散斑图像的灰度直方图动态调整量化区间使得每个量化级包含大致相等的像素数从而保留更多信息。抖动技术在量化前加入特定的随机噪声抖动可以打破量化误差与信号之间的相关性将量化噪声转化为白噪声从而在视觉上或后续处理中提升重建质量。这对于极低比特深度如1比特成像尤为重要。比特深度选择建议高质量静态成像建议使用4-6比特。能在PSNR损失极小1dB的情况下将数据量压缩至原来的25%-12.5%。高速动态追踪强烈推荐使用1-2比特二值化或四值化。数据量降至原来的12.5%-25%互相关计算速度可提升数倍极易实现高帧率实时追踪。资源极端受限的嵌入式系统1比特二值化是首选。可以直接用FPGA或单片机进行高速互相关运算。5.4 算法实现与加速技巧相位恢复算法如Fienup的混合输入输出法HIO或误差减少法ER是计算瓶颈。以下是一些加速技巧GPU并行化算法的核心是FFT/IFFT和简单的数组操作非常适合在GPU上并行执行。使用CUDA或OpenCL可以轻易实现数十倍的速度提升。多分辨率重建先在小尺寸下采样图像上快速迭代得到一个粗糙解再将其作为初始值上采样到全尺寸进行精细迭代可以大幅减少总迭代次数。提前终止设定一个重建误差阈值当迭代误差低于该阈值时即停止避免无谓计算。对于追踪应用互相关计算也可以用FFT加速CrossCorr(I1, I2) ifft2(fft2(I1) * conj(fft2(I2)))。对于二值化图像甚至可以使用更快的二进制互相关算法进一步降低计算复杂度。6. 应用场景展望与挑战低比特深度散斑成像与追踪技术因其对硬件要求低、数据处理效率高的特点在多个领域展现出独特的应用潜力。6.1 潜在应用领域微型化与嵌入式视觉在无人机、微型机器人或内窥镜等空间、功耗严格受限的设备上可以使用低分辨率、低比特深度的廉价传感器通过此算法实现“穿障”视觉极大拓展其工作环境。高速工业检测在充满粉尘、水雾或透明包装材料的工业生产线上需要对高速运动的零件进行视觉定位或缺陷检测。低比特散斑追踪能实现高帧率、鲁棒的视觉跟踪且数据流极小适合实时处理。生物医学动态成像观察活体组织深部的微血管血流或细胞运动。传统高比特成像数据量巨大而低比特技术可以长时间、高帧率记录动态过程同时减轻数据存储压力。穿透散射介质监控用于雾天、水下或透过毛玻璃等场景下的安防监控。系统可以做得更轻便续航更长。6.2 当前面临的挑战与未来方向尽管前景广阔该技术走向广泛应用仍需克服一些挑战记忆效应范围的限制这是物理层面的根本限制。对于厚散射介质如生物组织记忆效应范围可能只有几十微米极大限制了可成像的视场或可追踪的步长。研究如何扩展记忆效应范围或开发超越该范围的算法是核心挑战。复杂物体与三维重建目前演示多为高对比度、二维的简单物体。对于复杂纹理、低对比度或三维物体重建质量会显著下降。需要结合深度学习等先验知识来改善重建。动态散射介质如果散射介质本身也在变化如流动的烟雾、搏动的组织散斑图案会随时间快速变化破坏帧间的相关性。这需要发展更快的拍摄速度或能解耦介质动态与目标运动的新算法。系统校准与鲁棒性实际系统中放大率M、距离u和v的精确测量以及振动、温度漂移的影响都需要通过在线校准策略来补偿以提高系统的鲁棒性和实用性。从我个人的实验经验来看低比特散斑技术的魅力在于它用一种“极简”的硬件思路撬动了“极复杂”的成像问题。它提醒我们在计算感知的时代算法的智能与硬件的简约可以协同进化。我们不再一味追求传感器的“高保真”而是思考如何用最经济的数据提取最关键的信息。这种思维转变或许比任何单项的技术突破都更有意义。下一步我计划尝试将深度学习中的二值神经网络(Binary Neural Networks)与二值化散斑处理结合探索端到端的、硬件友好的智能散射成像系统这可能是通往真正实用化的一条有趣路径。

Nintendo Switch文件管理利器：NX-Shell完整使用指南

Nintendo Switch文件管理利器：NX-Shell完整使用指南【免费下载链接】NX-Shell A multi-purpose file manager for the Nintendo Switch. 项目地址: https://gitcode.com/gh_mirrors/nx/NX-Shell NX-Shell是一款专为任天堂Switch设计的全能文件管理器&#x…...

2026/5/28 21:50:13 阅读更多 →

从Haar特征到SURF：深入拆解积分图如何成为计算机视觉的‘加速神器’

从Haar特征到SURF：深入拆解积分图如何成为计算机视觉的‘加速神器’在计算机视觉领域，效率往往决定着算法的生死。想象一下，当我们需要在每帧图像中检测数百个人脸时，传统像素遍历方法会让计算量呈爆炸式增长。而1984年由Crow提出…...

2026/5/28 21:50:05 阅读更多 →

五管OTA运放设计避坑指南：为什么你的带宽总不达标？从工艺参数到gm/Id方法的思考

五管OTA运放设计避坑指南：从工艺陷阱到gm/Id方法的实战解析在模拟集成电路设计中，五管OTA（运算跨导放大器）堪称工程师的"必修课"，但真正动手设计时，超过60%的初学者会遇到带宽不达标的困境。当你…...

2026/5/28 21:50:02 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/26 6:08:07 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/26 6:15:52 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/27 21:40:10 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/27 10:36:27 阅读更多 →