具身智能中的传感器技术48——麦克风阵列3
麦克风阵列在人形机器人上的主流安装位置为头顶和胸口。头顶采用环形阵列61或4麦优势在于360°无遮挡拾音、精准声源定位和低噪音干扰但垂直角度感知较弱胸口采用线性阵列2-4麦适合前方增强拾音且结构紧凑但存在后方盲区和噪音干扰问题。特殊分散式布局因算法复杂极少使用。头顶方案适合全向交互场景胸口方案则适用于定向服务需求。在具身智能人形机器人上麦克风阵列的安装位置不仅要考虑听得清还要考虑交互自然和避开自身噪音。最主流的安装位置只有两个头顶和胸口。一、 黄金位置头顶 (Top of Head) —— “360° 全能王”这是目前90% 高端服务机器人如 Pepper, 优必选 Walker, 甚至智能音箱的标准方案。1. 布局形态通常采用61 环形阵列或4 麦环形阵列。在头顶圆盖的边缘均匀分布麦克风。2. 核心优势无遮挡全向拾音头顶是机器人的最高点四周没有任何身体部件遮挡。无论用户站在前后左右哪个方位声音都能直达麦克风。声源定位最准环形结构天生适合做 360° 平面定位。远离本体噪音离腿部电机、胸腔散热风扇较远信噪比相对较好。3. 劣势俯仰角感知弱环形阵列擅长分辨水平角度Azimuth但不擅长分辨垂直角度Elevation。不过对于面对面交流这也够了。二、 备选位置胸口/肩部 (Chest / Shoulders) —— “定向聆听者”通常用于屏幕类机器人或特种作业机器人。1. 布局形态通常采用线性阵列 (Linear Array)。在胸口横着排开 2-4 个麦克风。2. 核心优势前方增强线性阵列非常适合做前方波束成形。它能像聚光灯一样强力收集正前方的声音抑制侧面和背后的噪音。结构紧凑不需要像头顶那样占一大块圆盘面积。3. 劣势后方盲区声音从背后传来时会被机器人的躯干遮挡声影效应导致听不清或定位错误。噪音干扰胸口通常离散热风扇和核心计算单元GPU最近风噪和电磁干扰最大。三、 特殊位置分散式 (Distributed)概念像人耳一样在头部左右两侧各装一个麦克风阵列或者全身分布。现状极少使用。原因算法太难。多个阵列之间的时钟同步极其复杂且并没有带来特别明显的性能提升。总结想做全能管家装在头顶环形阵列听八方来风。想做前台接待装在胸口线性阵列专注听前面的人说话。