NGMRES加速Navier-Stokes方程求解:理论、实现与三维问题范数选择
1. 项目概述与核心价值在计算流体动力学CFD和许多其他涉及非线性偏微分方程PDE求解的科学计算领域我们常常面临一个棘手的挑战如何高效、稳定地求解像Navier-Stokes方程这样复杂的非线性系统。传统的Picard迭代法因其全局稳定性和线性收敛性而备受青睐但它的致命弱点在于当雷诺数Re较高即流动变得复杂时其收敛速度会急剧下降甚至完全发散。这直接限制了我们在模拟高雷诺数湍流、复杂几何体内流动等实际工程问题时的计算能力。过去几十年研究者们提出了多种加速技术如Anderson加速AA、非线性共轭梯度法等。其中非线性广义最小残差法Nonlinear GMRES, NGMRES作为一种源自Krylov子空间思想的加速方法自1997年由Washio和Oosterlee提出以来已在张量分解、图像恢复等多个领域证明了其有效性。然而一个根本性问题长期悬而未决NGMRES究竟通过何种机制来加速收敛缺乏严格的理论分析使得该方法的应用多少带有些“黑箱”色彩参数选择如深度m、优化范数也往往依赖于经验。本文所探讨的工作正是为了捅破这层窗户纸。它首次为NGMRES加速Navier-Stokes方程Picard迭代建立了完整的、单步的收敛性理论。其核心贡献在于不仅证明了NGMRES能够加速收敛更精确地指出了加速的根源在于优化问题本身的“增益”。具体来说理论分析表明NGMRES每一步的收敛速率等于原始Picard迭代的收缩常数κ乘以一个小于等于1的优化增益因子γ_{k1}。这意味着只要优化步骤有效γ_{k1} 1收敛就会被加速。此外研究还首次明确指出对于Navier-Stokes方程这类问题在NGMRES的优化问题中使用对偶空间V‘范数而非常用的ℓ²范数在理论上是更自然、在实践上尤其是三维问题中是更优的选择。这项工作的价值对于一线研发工程师和科研人员而言是立竿见影的。它不仅仅是一篇数学论文更是一份**“操作手册”和“避坑指南”**。通过本文你将彻底理解NGMRES-Picard为何有效、如何使其更有效并能在自己的CFD代码中自信地实现和调优该方法从而大幅提升高雷诺数流动问题的求解效率。2. NGMRES-Picard方法的核心原理与框架拆解2.1 问题背景Navier-Stokes方程与Picard迭代的瓶颈我们考虑定常、不可压缩Navier-Stokes方程在域Ω⊂ℝ^d (d2,3)上的标准形式-νΔu u·∇u ∇p f, 在Ω中 ∇· u 0, 在Ω中并配以适当的边界条件如Dirichlet边界。其中u是速度场p是压力场ν 0是运动粘度与雷诺数Re成反比f是已知的体积力。其弱形式为寻找u ∈ V散度自由函数空间使得对所有v ∈ V有ν(∇u, ∇v) (u·∇u, v) (f, v)为了求解这个非线性方程Picard迭代也称Oseen迭代是一种经典的线性化方法。给定第k步迭代的速度场u_k下一步的近似解ũ_{k1}通过求解以下线性问题得到ν(∇ũ_{k1}, ∇v) (u_k · ∇ũ_{k1}, v) (f, v), ∀ v ∈ V然后令u_{k1} ũ_{k1}。这个迭代的吸引力在于每一步只需要求解一个线性化的Stokes/Oseen问题有成熟的数值方法如有限元和高效的预条件子可用。然而Picard迭代的收敛性严重依赖于一个关键常数κ M ν^{-2} ||f||{H^{-1}}其中M是依赖于域大小的常数。理论证明当κ 1时Picard迭代在H^1_0范数下以速率κ线性收敛。但问题在于对于许多有实际物理意义的高雷诺数流动ν小||f||{H^{-1}}可能不小κ很容易大于1导致迭代收敛极其缓慢甚至发散。这正是我们需要加速技术的根本原因。2.2 NGMRES加速的基本思想从线性到非线性的推广GMRES广义最小残差法是求解大型稀疏线性方程组Axb的经典Krylov子空间方法。其核心思想是在第k步在Krylov子空间K_k span{r_0, Ar_0, ..., A^{k-1}r_0}中寻找解x_k使得残差范数||b - A x_k||最小。NGMRES将这一思想推广到了非线性方程g(u)0的求解。它并不直接处理原方程而是作用于一个与之相关的固定点迭代u_{k1} q(u_k)。对于Picard迭代这个固定点算子q就是求解上述线性Oseen问题的算子。NGMRES(m)算法深度为m的第k1步可以描述如下固定点步计算候选解 ũ_{k1} q(u_k)。优化步寻找系数β_i^{k1}使得以下残差的某种范数最小min_{β} || g(ũ_{k1}) Σ_{i0}^{m_k} β_i^{k1} (g(ũ_{k1}) - g(u_{k-i})) || 其中 m_k min{k, m}这里g(u)是原非线性方程的残差算子。对于NSEg(u) -νΔu u·∇u - f在弱意义下。外推步用找到的最优系数组合新旧迭代值生成新的迭代点u_{k1} ũ_{k1} Σ_{i0}^{m_k} β_i^{k1} (ũ_{k1} - u_{k-i})直观理解优化步试图利用当前步残差g(ũ_{k1})与过去m步残差{g(u_k), ..., g(u_{k-m})}的信息构造出一个线性组合使得组合后的“残差”在某种度量下最小。这相当于在由这些残差张成的子空间中寻找一个更好的搜索方向。然后外推步沿着这个方向对固定点步的结果进行修正。当m0时NGMRES退化为一种松弛或阻尼形式的Picard迭代。2.3 关键创新优化范数的选择与理论框架的构建以往绝大多数NGMRES的实现和研究都默认使用ℓ²范数即向量2-范数作为优化步的目标范数这主要是出于计算简便的考虑。然而本文的理论分析揭示对于Navier-Stokes方程最优的优化范数应该是与问题本身匹配的V‘范数对偶范数。为什么是V‘范数对于Navier-Stokes方程非线性残差算子g: V → V‘其像空间是V的对偶空间V‘。V‘范数的定义是||g(v)||_{V‘} sup_{0≠χ∈V} (g(v), χ) / ||∇χ||这个范数自然地来源于变分形式它衡量的是残差在能量意义下的大小。而ℓ²范数或等价的L²(Ω)范数对于v·∇v这样的项当v仅属于H^1时可能没有良好的定义或控制。本文采用了一个等价的、更便于理论分析的约束优化形式来描述NGMRES步u_{k1} α_{k1} ũ_{k1} α_k u_k ... α_{k-m} u_{k-m}其中系数向量α (α_{k1}, α_k, ..., α_{k-m})通过求解以下约束最小二乘问题得到min_{Σα_i 1} || α_{k1} g(ũ_{k1}) α_k g(u_k) ... α_{k-m} g(u_{k-m}) ||_{V‘}系数和为1的约束保证了外推的合理性。在此基础上论文定义了两个关键的“增益”因子θ_{k1}: 优化后残差范数与上一步残差范数之比。它衡量了NGMRES步相对于上一步的“即时收缩率”。θ_{k1} ||α_{k1} g(ũ_{k1}) ... α_{k-m} g(u_{k-m})||_{V‘} / ||g(u_k)||_{V‘}γ_{k1}: 优化后残差范数与纯Picard步残差范数之比。它直接量化了NGMRES优化步带来的加速效果。γ_{k1} ||α_{k1} g(ũ_{k1}) ... α_{k-m} g(u_{k-m})||_{V‘} / ||g(ũ_{k1})||_{V‘}根据定义θ_{k1}和γ_{k1}都小于等于1。只有当优化问题分别退化到选择纯上一步(0,1,0,...)或纯Picard步(1,0,...)时它们才等于1。因此γ_{k1} 1 就意味着加速发生了。3. 收敛性理论的核心结论与证明思路解析本文的核心理论成果可以概括为以下两个不等式它们分别揭示了θ和γ在收敛行为中的作用。3.1 主要定理陈述对于NGMRES-Picard方法应用于NSE在适当的正则性假设和系数有界性假设下有以下收敛估计定理 3.2 (简化表述) 对于任意深度 m ≥ 1假设 Picard 迭代是收缩的即 κ 1且优化系数一致有界则存在常数 C使得第 k1 步的非线性残差满足(1) ||g(u_{k1})||_{V‘} ≤ θ_{k1} ||g(u_k)||_{V‘} C * (||g(u_k)||_{V‘}^2 ... ||g(u_{k-m})||_{V‘}^2) (2) ||g(u_{k1})||_{V‘} ≤ γ_{k1} κ ||g(u_k)||_{V‘} C * (||g(u_k)||_{V‘}^2 ... ||g(u_{k-m})||_{V‘}^2)3.2 定理的工程意义解读这两个不等式是理解NGMRES加速机制的钥匙。不等式(1)的意义它表明NGMRES迭代序列本身在V‘范数下是局部收缩的其每一步的收缩率由θ_{k1}主导。θ_{k1}直接来源于优化问题的解是一个可以计算的量。这意味着即使我们不知道确切的κ在实际问题中κ往往只是一个上界估计我们也可以通过监控θ_k来实时评估迭代的收敛速度。数值实验也证实当残差变小后θ_k与实际的残差缩减比 ||g(u_k)||/||g(u_{k-1})|| 吻合得非常好说明这个估计非常尖锐。不等式(2)的意义这是加速效应的直接体现。它将NGMRES步的收敛速率与原始Picard迭代的收缩常数κ联系了起来。右边第一项是 γ_{k1} κ ||g(u_k)||{V‘}。由于γ{k1} ≤ 1只要优化步骤有效即γ_{k1} 1NGMRES步的线性收敛速率就严格优于原始Picard迭代的速率κ。γ_{k1}正是优化问题带来的“增益”。它衡量了优化后的组合残差相比于单纯采用Picard步残差对应系数(1,0,...,0)的改善程度。高阶项的角色两个不等式末尾的O(||g||^2)项是二阶小量。在迭代初期残差较大时这些项可能不可忽略甚至会暂时影响收敛性。这解释了数值实验中有时观察到的现象在迭代初期深度m较大的NGMRES可能因为高阶项较多而表现不如m0或m1的方法但当残差下降到一定程度后线性项主导深度更大的方法因其更强的优化能力更小的γ而展现出更快的收敛速度。这为设计自适应深度策略如初期用小m后期用大m提供了理论依据。3.3 证明思路的关键步骤证明的骨架清晰而有力主要分为以下几个环节建立基本估计首先需要关于Picard迭代残差w_{k1} ũ_{k1} - u_k和NSE非线性残差g(u_k)的基本关系。关键的引理2.1给出了两个不等式||∇w_{k1}|| ≤ ν^{-1} ||g(u_k)||_{V‘} ||g(ũ_{k1})||_{V‘} ≤ κ ||g(u_k)||_{V‘}第一个不等式将Picard步的更新量与非线性残差的大小联系起来。第二个不等式则表明纯Picard步本身就能以速率κ减小非线性残差的V‘范数。这是后续分析的基石。构造残差恒等式引理3.2这是整个证明中最核心、技术性最强的一步。目标是将g(u_{k1})表达成两部分之和g(u_{k1}) [α_{k1}g(ũ_{k1}) α_k g(u_k) ... α_{k-m}g(u_{k-m})] R第一部分正是优化问题中最小化的那个线性组合。第二部分R是一个剩余项它包含了形如w·∇w, e·∇w, e·∇e的交叉项其中e是迭代值之间的差分。通过精细的代数恒等变形可以将R完全用w_{k1}和过去的e_j表示出来。估计剩余项R利用NSE非线性项的双线性估计(2.1)和(2.2)式以及第一步得到的基本估计可以对R的V‘范数进行控制。最终发现R的范数可以被一系列非线性残差g(u_j)的范数的二次项所控制即O(||g||^2)。这正是高阶项的来源。取范数并应用增益定义对恒等式两边取V‘范数利用三角不等式并代入θ和γ的定义即可直接得到定理中的两个主要不等式。证明的巧妙之处在于它没有试图直接分析u_{k1}与真解的距离而是转而分析非线性残差g(u_{k1})的范数。这使得我们可以充分利用优化问题最小化的对象即那个线性组合的残差来直接控制主项而将复杂的非线性相互作用打包进高阶项R中。这种“残差导向”的分析思路非常适用于这类加速方法。4. 优化范数选择的深度剖析与数值实验验证理论指出了V‘范数的优越性但实际计算中我们面临选择是遵循理论使用V‘范数还是沿用计算简便的ℓ²范数本节将结合理论分析和数值实验深入探讨这个工程实践中的关键抉择。4.1 理论视角为什么V‘范数更合理根本原因在于函数空间的不匹配。对于Navier-Stokes方程当速度场u属于能量空间H^1_0(Ω)时非线性项u·∇u并不属于L²(Ω)而是属于更弱的空间。实际上通过Sobolev嵌入和双线性估计可以证明u·∇u属于对偶空间V‘。因此非线性残差g(u) -νΔu u·∇u - f作为一个整体其自然的存在空间是V‘而不是L²。在离散情形下例如使用有限元方法我们是在离散的散度自由空间V_h中求解。此时虽然所有量都是有限维的理论上任何范数都等价但等价的常数会依赖于网格尺寸h。论文在第3.3节进行了精辟的分析在二维情况下利用逆不等式可以建立估计||w_h · ∇w_h||_{L²} ≤ C (log(h^{-1}))^{1/2} ||∇w_h||_{L²}^2这里多出了一个对数项log(h^{-1})^{1/2}。当网格加密时这个因子增长缓慢。因此在二维问题中使用L²或等价的ℓ²范数进行优化其理论估计中的高阶项只会被一个缓慢增长的因子放大在实际计算中通常可以接受性能可能与V‘范数相近。在三维情况下逆不等式给出||w_h · ∇w_h||_{L²} ≤ C h^{-1/2} ||∇w_h||_{L²}^2这里出现了h^{-1/2}项这意味着当网格细化时h → 0使用L²范数时理论估计中的高阶项会被一个发散的因子放大。这可能导致高阶项在误差中占据主导地位从而破坏收敛性或者严重劣化方法的性能。因此从理论一致性出发V‘范数是“正确”的选择因为它与残差算子的本质属性相匹配能保证估计中的常数与网格尺寸h无关即方法具有网格无关的收敛性。而ℓ²/L²范数在三维问题中可能引入与h相关的、可能很大的常数从而带来风险。4.2 数值实验对比2D vs 3D的显著差异论文在第四部分通过丰富的数值实验验证了上述理论预测。实验涵盖了经典的2D方腔驱动流、3D方腔驱动流以及一个更复杂的3D狭窄动脉血管流模型。实验设置要点空间离散使用Scott-Vogelius有限元(P_r, P_{r-1}^{disc})在重心细分的三角形/四面体网格上求解。该单元能强满足散度自由条件。线性求解器每个非线性迭代步内的线性Oseen问题使用grad-div稳定化和基于压力质量矩阵近似Schur补的块LU分解预条件子进行求解。收敛准则以非线性残差g(u_k)的V‘范数下降到指定容差如10^{-8}为准。4.2.1 2D方腔驱动流结果对于Re5000和10000的2D问题对比了使用V‘和ℓ²优化范数时不同深度m的NGMRES性能。收敛性如图4所示当m较小0或1时使用V‘范数的收敛性明显优于ℓ²范数。但当m增大到5或10时两种范数下的收敛曲线变得非常接近性能差异不大。解读这与理论分析吻合。在2D中使用ℓ²范数引入的额外因子是对数级的影响相对温和。当优化深度m增加时优化子空间更大优化效果更强可能在一定程度上弥补了范数选择不当带来的损失使得两者最终表现相近。4.2.2 3D方腔驱动流与动脉流结果在3D问题中情况发生了根本性变化。方腔流Re400, 1000如图7所示使用V‘范数时NGMRES能有效加速收敛即使对于不收敛的Picard迭代Re1000采用m20的NGMRES也能在约70步内收敛。而使用ℓ²范数时所有测试m0,5,10,20均无法达到设定的收敛容差残差在下降到10^{-4}左右后便停滞不前。动脉流复杂几何如图10所示结论更加鲜明。使用V‘范数NGMRES能稳定收敛且随着m增大收敛加快m∞即全历史版本收敛最快。而使用ℓ²范数时NGMRES完全失效残差几乎不下降。网格均匀性实验作者还做了一个对照实验将生成网格的Chebyshev点分布改为均匀分布。使用V‘范数时收敛行为基本不变。而使用ℓ²范数时均匀网格下的收敛略好于非均匀网格残差最低点从10^{-4}降至10^{-5}但仍远未达到收敛。这印证了理论分析h^{-1/2}因子与网格尺寸相关更均匀的网格最大h更小可能使该因子略小但无法从根本上解决问题。实操心得与避坑指南三维问题务必使用V‘范数这是从本文中获得的最重要的一条实践准则。在3D CFD模拟中实现NGMRES加速时切勿因为贪图简便而使用ℓ²范数。虽然计算V‘范数需要额外的对偶范数求解通常需要求解一个伴随的Stokes问题但其计算成本远低于一个Picard步且是收敛成功的保证。二维问题可酌情选择对于2D问题如果追求极致的编码简便且问题规模不大、网格不是极度精细使用ℓ²范数可能是可以接受的折衷方案尤其是在深度m较大时。但对于高精度计算或作为通用库开发建议仍采用V‘范数以保证鲁棒性和理论一致性。如何计算V‘范数在有限元离散下计算||g(u_h)||{V‘}等价于求解一个线性变分问题寻找z_h ∈ V_h使得 (∇z_h, ∇v_h) (g(u_h), v_h) 对所有v_h ∈ V_h成立然后有 ||g(u_h)||{V‘} ||∇z_h||。这本质上是一个Poisson/Stokes类型的问题可以利用已有的求解器框架高效求解。4.3 深度m的选择策略与自适应启发理论不等式中的高阶项O(||g||^2)提示我们在迭代初期残差较大时较大的深度m可能会因引入更多的高阶项而带来不稳定性或效率低下。数值实验也观察到了这一点在2D Re10000的测试中m1的NGMRES甚至失败了而m0和m10则能收敛。在多个测试中作者尝试了一种自适应策略在迭代初期使用m0即简单的松弛当残差下降到一定程度如10^{-3}后切换到m10。这种策略往往能结合小m初期稳定和大m后期快速收敛的优点取得最佳的整体性能。建议的实践策略保守启动从一个较小的m开始例如m1或2。监控与切换实时监控残差下降率或增益因子θ_k。当残差下降缓慢且稳定例如连续若干步θ_k变化不大且小于0.9时可以考虑增大m以寻求更快的收敛。重启机制类似于GMRES可以考虑周期性地清空历史信息重启特别是在残差平台期或优化问题出现病态系数过大时。系数过滤如同在Anderson加速中一样当优化问题的系数异常大时可能意味着历史信息接近线性相关。此时可以引入过滤策略丢弃最旧的信息或对系数进行正则化以维持优化问题的良态。5. 实现细节、常见问题与性能调优将理论转化为可运行的代码需要关注一些关键细节。本节将基于论文中的算法描述和实验设置梳理出实现NGMRES-Picard的实用步骤和常见陷阱。5.1 算法实现步骤拆解假设我们已有求解Picard迭代单步即求解线性Oseen问题的求解器solvePicard(u_k)返回ũ_{k1}和计算出的非线性残差g(ũ_{k1})注意计算g(ũ)需要一次额外的残差评估但通常比求解线性系统成本低。算法NGMRES-Picard for NSE (使用 V‘ 范数)初始化给定初始猜测u_0历史队列H为空深度m收敛容差tol。主迭代循环(for k 0, 1, ... until convergence): a.固定点步调用[ũ, g_new] solvePicard(u_k)。这里g_new是g(ũ)在离散对偶范数下的表示通常是一个向量。 b.更新历史队列将当前迭代对(u_k, g(u_k))存入队列H如果队列已满长度m则移除最老的记录。注意我们需要存储g(u)而不是u或ũ。 c.构建优化问题 i. 令向量b g_new。 ii. 构建矩阵A其列向量为[g_new - g_old_1, g_new - g_old_2, ..., g_new - g_old_p]其中g_old_i是历史队列中的残差向量p min(k, m)。 iii. 我们的目标是找到系数向量β最小化|| b - A β ||_{V‘}。这等价于求解法方程(A^T W A) β A^T W b其中W是V‘内积对应的质量矩阵。在离散设置中V‘范数||v||_{V‘}的计算等价于求解M z v然后||v||_{V‘}^2 v^T z其中M是速度空间上的刚度矩阵或离散的H^1半内积矩阵。因此W M^{-1}。实际上我们通常避免显式形成M^{-1}而是通过求解一个以M为系数矩阵的线性系统来计算内积。 d.求解最小二乘问题使用稳定的方法如QR分解、SVD求解上述带权最小二乘问题。注意论文中使用的是带约束(Σα1)的公式这与上述无约束形式是等价的可以通过变量变换相互转化。实践中无约束形式更易实现。 e.外推步计算新的迭代点u_{k1} ũ Σ β_i (ũ - u_{k-i})。注意系数对应关系无约束形式的β_i对应于约束形式中的(α_{k1} - 1, α_k, ..., α_{k-m})的特定组合。 f.收敛判断计算||g(u_{k1})||_{V‘}或相对残差。若小于tol则终止否则令u_k u_{k1}继续循环。5.2 关键实现难点与解决方案V‘范数内积的计算问题每次优化都需要计算形如x, y_{V‘} x^T M^{-1} y的内积其中M是速度空间的刚度矩阵。显式求逆不可行。解决方案将内积计算转化为一个线性求解问题。即为了计算x^T M^{-1} y我们可以求解M z_x x得到z_x。则x, y_{V‘} z_x^T y。优化在构建法方程矩阵A^T W A时需要计算许多这样的内积。可以批量求解M Z A即一次性求解多个右端项以利用求解器的可扩展性。由于M是刚度矩阵这个求解类似于一个Poisson问题通常比Picard步的Oseen问题求解要快得多。优化问题的病态性问题随着迭代进行历史残差向量可能变得近似线性相关导致法方程矩阵A^T W A病态求出的系数β可能非常大且不稳定。解决方案正则化在最小二乘问题中加入Tikhonov正则项即最小化||b - Aβ||^2 λ||β||^2。λ是一个小的正数如1e-10。QR/SVD with truncation使用QR分解或SVD求解最小二乘问题并丢弃过小的奇异值设置一个阈值如rcond 1e-12。重启定期清空历史队列H重新从m0开始。这是最直接的方法也是GMRES中的常见策略。存储与计算开销问题存储m个历史速度场和残差场可能占用大量内存尤其是对于3D大规模问题。解决方案合理选择m。数值实验表明对于NSE问题m在5到20之间通常足够。不需要使用全历史mk。只存储残差向量g(u)而不是速度场u。在外推步需要历史速度场时可以按需从存档中读取或存储速度场的低秩近似/压缩格式。5.3 性能调优与参数选择建议基于论文实验和理论分析以下是一些调优建议参数/选择推荐设置理由与说明优化范数V‘范数对偶范数三维问题必须使用二维问题强力推荐。保证网格无关收敛性和鲁棒性。深度 m自适应策略初期小(0-2)后期大(5-20)。或固定一个中等值如5-10。初期残差大高阶项影响显著小m更稳定。后期残差小大m优化能力强加速明显。线性求解器内层使用针对Oseen问题的高效预条件子如压力对流扩散预条件、块三角预条件等。Picard步是主要计算成本。求解器的效率和鲁棒性直接影响整体性能。V‘内积求解器使用快速Poisson求解器如几何多重网格、代数多重网格。需要频繁求解以M为系数矩阵的系统其性能对优化步开销影响大。收敛容差非线性残差 重启策略每20-50次迭代或当优化系数异常时清空历史。防止历史信息冗余导致优化问题病态控制内存使用。系数过滤若某系数|β_i| 10^3或最小奇异值过小则重启或丢弃最老信息。维持优化问题的数值稳定性。5.4 与Anderson加速AA的简要对比与选型思考论文在结论中提到将NGMRES与同样成功的Anderson加速进行对比是未来的研究方向。这里结合已有知识给出一些初步的工程化对比机制差异AA最小化的是固定点残差q(u) - u的线性组合而NGMRES最小化的是非线性残差g(u)的线性组合。对于NSE的Picard迭代g(u)和q(u)-u通过Lemma 2.1联系起来但两者范数不同。理论框架本文的NGMRES理论首次明确了优化增益γ是加速机制并与AA-Picard的理论[38]有相似之处都是单步分析优化增益驱动加速。但分析细节因外推形式和残差选择不同而有本质差异。计算成本每步AA需要存储和操作的是q(u)-u一个速度场而NGMRES需要存储和操作g(u)一个对偶空间向量计算其范数需要额外求解。AA通常使用ℓ²范数。因此单步成本上NGMRES使用V‘范数可能略高于AA。实践选择目前对于NSE的Picard迭代两者都是有效的加速器。选择哪一个可能取决于具体实现便利性、历史代码基础以及对特定范数的偏好。本文的工作为NGMRES提供了坚实的理论基础和明确的范数选择指南使其成为一个更具理论保障的选择。一个实用的建议如果你已经有一个稳定运行的AA-Picard求解器并且它在你的问题上表现良好可能没有必要立即切换到NGMRES。但如果你正在为新代码选择加速器或者在使用AA时遇到了收敛性问题尤其是在3D细网格上那么实现一个基于V‘范数的NGMRES-Picard将是一个非常有价值的尝试本文为你提供了完整的路线图。