Linux-RGMII PHY 88E1512 双模式驱动适配与调试实战
1. 认识88E1512 PHY芯片与RGMII接口第一次接触88E1512这颗PHY芯片是在一个工业网关项目上当时我们需要在AM5728平台上实现双网口功能。Marvell的88E1512确实是个很有意思的芯片它支持RGMII-to-Copper和RGMII-to-SGMII两种工作模式相当于一颗PHY能当两颗用。RGMII接口大家应该不陌生这是目前嵌入式系统中最常见的MAC-PHY接口标准之一全称Reduced Gigabit Media Independent Interface。RGMII和SGMII的区别很有意思。简单来说RGMII就像是双向四车道的高速公路数据线和时钟线分开传输而SGMII更像是单车道但速度更快的隧道。在实际项目中RGMII接口最大的特点就是它只需要12根信号线相比GMII的24根少了一半但代价是需要精确的时序控制。我记得有一次调试时就因为PCB走线长度差了几毫米导致网络时通时断后来加了时序补偿才解决。88E1512的灵活之处在于它的模式切换功能。通过配置寄存器我们可以让它工作在不同的模式RGMII-to-Copper模式直接连接RJ45网口RGMII-to-SGMII模式可以对接其他交换芯片 这种设计特别适合需要多种网络接口的场景比如我们的网关就需要同时连接本地设备和上级网络。2. 硬件环境搭建与设备树配置在AM5728平台上使用88E1512第一步就是要正确配置设备树。创龙的AM5728开发板默认使用的是KSZ9031 PHY所以我们需要针对88E1512做一些调整。设备树配置中最关键的几个参数是cpsw_emac0 { phy-mode rgmii-id; phy-handle phy0; dual_emac_res_vlan 1; }; cpsw_emac1 { phy-mode rgmii-id; phy-handle phy1; dual_emac_res_vlan 2; };这里有个容易踩坑的地方rgmii-id和rgmii的区别。前者表示RX/TX的延时都由PHY来补偿后者则需要MAC来补偿。我们项目里用的是rgmii-id所以后面还需要关闭AM5728内部的延时补偿功能。为了让驱动能区分两种工作模式我添加了一个自定义属性phy0: phy0 { reg 0; operating-mode 0; /* 0 for RGMII-to-Copper */ }; phy1: phy1 { reg 1; operating-mode 2; /* 2 for RGMII-to-SGMII */ };这个operating-mode属性后面会在驱动中用到。配置设备树时还要注意检查PHY的地址是否正确88E1512通常是通过硬件引脚配置地址的如果地址不对后面怎么调试都没用。3. 驱动修改与模式切换实现驱动修改是整个过程的核心部分。88E1512使用的是Marvell的通用PHY驱动源码在drivers/net/phy/marvell.c中。我们需要修改的主要是m88e1510_config_init函数。先来看看关键的寄存器操作流程选择Page 1888E1512的功能配置寄存器都在这个页面修改Register 20的MODE[2:0]字段执行软复位使配置生效具体代码实现如下static int m88e1510_config_init(struct phy_device *phydev) { int err, temp; u32 mode_num; struct device_node *np phydev-mdio.dev.of_node; /* 读取设备树中的operating-mode属性 */ if (of_property_read_u32(np, operating-mode, mode_num)) { dev_err(phydev-mdio.dev, missing operating-mode property\n); return -EINVAL; } if (mode_num 0) { /* RGMII-to-Copper模式 */ dev_info(phydev-mdio.dev, Configuring RGMII-to-Copper mode\n); /* 切换到Page 18 */ err phy_write(phydev, MII_MARVELL_PHY_PAGE, 18); if (err 0) return err; /* 配置MODE[2:0]为0x0 */ temp phy_read(phydev, MII_88E1510_GEN_CTRL_REG_1); temp ~MII_88E1510_GEN_CTRL_REG_1_MODE_MASK; temp | MII_88E1510_GEN_CTRL_REG_1_MODE_RGMII_TO_COPPER; err phy_write(phydev, MII_88E1510_GEN_CTRL_REG_1, temp); if (err 0) return err; /* 软复位 */ temp | MII_88E1510_GEN_CTRL_REG_1_RESET; return phy_write(phydev, MII_88E1510_GEN_CTRL_REG_1, temp); } else if (mode_num 2) { /* RGMII-to-SGMII模式 */ dev_info(phydev-mdio.dev, Configuring RGMII-to-SGMII mode\n); /* 类似上面的流程但MODE[2:0]设为0x4 */ err phy_write(phydev, MII_MARVELL_PHY_PAGE, 18); if (err 0) return err; temp phy_read(phydev, MII_88E1510_GEN_CTRL_REG_1); temp ~MII_88E1510_GEN_CTRL_REG_1_MODE_MASK; temp | MII_88E1510_GEN_CTRL_REG_1_MODE_RGMII_TO_1000BASE_X; err phy_write(phydev, MII_88E1510_GEN_CTRL_REG_1, temp); if (err 0) return err; temp | MII_88E1510_GEN_CTRL_REG_1_RESET; return phy_write(phydev, MII_88E1510_GEN_CTRL_REG_1, temp); } return m88e1121_config_init(phydev); }调试这个功能时我遇到一个典型问题修改配置后网络不工作。后来发现是忘记执行软复位了。88E1512的寄存器修改后必须通过软复位才能生效这个细节在数据手册里虽然写了但很容易被忽略。4. 文件系统辅助工具与调试技巧驱动加载成功后还需要一些用户空间的配置才能让整个系统正常工作。特别是对于RGMII-to-SGMII模式的PHY1还需要额外的配置使用mdio工具切换PHY页面mdio eth1 22 1 # 切换到Fiber Page这个命令的作用是让MAC能正确读取PHY的链路状态。因为默认情况下PHY会报告Copper Page的状态而我们的PHY1连接的是SGMII接口。LED配置也很重要。在我们的硬件设计中PHY1的LED1引脚还被用作PPS输入。如果不配置为高阻态会影响PPS信号质量mdio eth1 22 3 mdio eth1 16 0xa0 # 配置LED1为Hi-Z模式关闭AM5728内部的RGMII延时补偿。因为我们使用的是rgmii-id模式延时补偿已经在PHY侧完成devmem2 0x4A002558 w 0x00000000调试PHY时有几个实用技巧值得分享环回测试88E1512支持内部环回可以用来快速验证PHY到MAC的链路是否正常# 设置环回模式 mdio eth0 0 16 0x4000 # 测试发包 ping -I eth0 192.168.1.1 # 恢复普通模式 mdio eth0 0 16 0x0000统计计数器PHY和MAC都有丰富的统计寄存器可以查看收发包数量、错误计数等# 查看PHY的统计信息 ethtool -S eth0信号质量检查用示波器测量RGMII时钟信号的质量确保眼图符合要求。我们曾经遇到过因为时钟信号抖动太大导致网络性能下降的问题。5. 常见问题排查与解决方案在实际项目中调试88E1512遇到问题在所难免。下面分享几个典型问题及其解决方法问题1PHY无法被识别检查MDIO总线是否正常mdio eth0 0 0应该能读取到PHY ID确认PHY地址正确88E1512的地址由硬件引脚决定测量PHY的电源和复位信号是否正常问题2链路时通时断检查RGMII时序特别是TX/RX时钟的相位关系确认延时补偿配置正确PHY或MAC一侧补偿不要两边都补偿用示波器检查信号完整性排除PCB设计问题问题3RGMII-to-SGMII模式不工作确认对端设备交换芯片的SGMII配置正确检查PHY是否成功切换到Fiber Page验证SGMII的自动协商是否完成问题4网络性能不达标检查DMA配置确保MAC的DMA缓冲区足够大使用ethtool -k eth0检查offload功能是否启用测量系统负载排除CPU性能瓶颈调试时的一个好习惯是保存各种状态的寄存器快照。我通常会记录以下信息PHY的基本控制寄存器Reg 0特定模式的配置寄存器如Page 18的Reg 20中断状态寄存器统计计数器值当问题出现时对比正常状态和异常状态的寄存器值往往能快速定位问题根源。例如有一次我们发现网络会随机断开通过对比寄存器发现是自动协商被意外改动了最终追踪到是某个驱动在错误地重置PHY。