AI经济学：倒置的价值链

张

张建站

2026/5/22 21:07:12

10分钟阅读

Yann LeCun最近说了一些让我印象深刻的话。在与Dario Amodei就AI是否会消除一半白领工作进行公开争论的过程中LeCun用一句简单的指令切入了核心不要听CEO的。他们有既得利益去夸大他们销售产品的能力。他的建议是听听经济学家的。AI对劳动力、对市场、对整个行业结构的影响——“是一个经济学问题而不是技术问题。”不要听CEO的。他们有既得利益去夸大他们销售产品的能力。 — Yann LeCun我认为他比他自己预期的还要正确。大多数人用来理解AI的视角是技术性的——基准测试、模型能力、推理突破。但如果你真正想了解钱流向哪里、谁赢了、谁被挤压了以及为什么这个周期感觉与之前的一切都如此不同你需要经济学。具体来说你需要审视AI价值链的结构——这是自PC、互联网和移动时代以来最大的价值链拥有自己独特的经济学打破了从云时代继承下来的大多数心智模型。Altimeter Capital的合伙人、在斯坦福教授MSE 435课程的Apoorv Agrawal自2024年以来一直在追踪Gen AI价值链。他的核心观察简单而令人不安AI经济是我们所见过的每一个平台周期的倒置版本。资金流向技术栈的底部而不是顶部。这种倒置的原因——他称之为tokenomics问题——很好地解释了为什么这个周期在结构上与云计算、移动或互联网不同。1、倒置三角形想想云计算经济学是如何成熟的。硬件在底部基础设施在中间应用在顶部。随着时间推移价值向上迁移。到2010年代末应用公司捕获了云计算栈中约70%的总毛利。半导体公司捕获了约6%。应用是高估值倍数所在的地方因为那是你离终端用户最近的地方也是边际成本接近零的地方。AI翻转了这一点。整个Gen AI生态系统现在的年收入约为4,350亿美元——比2024年初增长了5倍。但分布方式严重失衡如果用云计算的规范来衡量看起来会显得很不正常。半导体捕获约3,000亿美元。基础设施占约750亿美元。应用——OpenAI、Anthropic和每个聊天机器人产品所在的层级——获得约600亿美元。半导体捕获了生态系统中约79%的总毛利。利润率更加直白地说明了问题。NVIDIA的数据中心业务毛利率约为73%。基础设施层约为55%。应用公司平均约为33%。每一美元的AI应用收入的经济权重约为芯片美元的一半。芯片公司将这一利润率优势再投资于下一代硬件从而保持了差距。在云计算中应用捕获了70%的毛利半导体捕获了6%。在AI中半导体捕获了79%应用可能只有10%。技术栈几乎完全倒置了。为什么一个词的回答是tokenomics。2、为什么Tokenomics改变了一切在传统的SaaS中服务一个新用户的边际成本接近零。你构建一次软件托管在共享基础设施上每个额外的席位几乎都是纯利润。这就是为什么云应用公司能运行70-80%的毛利率并证明其数倍收入估值是合理的。经济学奖励靠近用户的一方。AI不是这样运作的。与AI模型的每一次交互都消耗算力——它生成token而token不是免费的。每个新用户、每个新查询、每个新智能体会话都在燃烧GPU周期。服务下一个用户的边际成本是正的且显著的特别是当我们从一次性聊天机器人响应转向推理模型和智能体工作流时。在AI中服务下一个用户的边际成本是正的且显著的这种转变的规模值得深思。推理模型——在回答之前逐步思考问题的那种——每个任务消耗的token可能比2023年简单的单次响应多出数量级。一个计划、执行、检查和迭代的智能体工作流可能消耗单个提示的50-500倍的token。推理需求曲线正在变陡而不是变平。这里有一个悖论正在企业AI预算中上演根据斯坦福AI指数2023年到2025年间每token成本下降了约280倍——从每百万token 20美元降至约0.07美元GPT-3.5等效性能。这是不到三年内99.7%的成本下降。有记录的历史上没有任何商业技术在如此压缩的时间窗口内经历过 comparable 的价格重组。然而企业AI支出在一年内翻了三倍从2024年的115亿美元增至2025年的370亿美元。当价格大幅下降且需求高度弹性时总支出会上升即使单位成本崩溃。经济学家称之为杰文斯悖论——它发生在煤炭、电力和带宽上现在正在计算token上发生。分析单位已经从每次查询的成本转移到累计月度token消耗这些数字已经足以引起警惕以至于FinOps基金会在其2026年报告中将AI确定为增长最快的企业支出类别。这就是为什么应用层运行33%的毛利率而半导体层运行73%。不是因为应用公司管理不善。而是因为他们的COGS——生成使其产品工作的token的成本——在结构上高于任何SaaS公司处理过的。他们为每一单位产出向半导体层付费而这些付款直接流向NVIDIA的利润表。3、电动机问题所以AI技术栈是倒置的tokenomics解释了原因。但还有第二个令人不安的模式值得单独理解AI投资与可衡量的生产力增长之间的差距。Robert Solow在1987年观察到你到处都能看到计算机时代但在生产力统计中看不到。全球AI投资现在每年超过5,000亿美元。OpenAI的估值在一年内从1,570亿美元增长到5,000亿美元。然而经合组织国家的全要素生产力增长仍然顽固地停滞不前。这里标准的史实类比是电动机。当电动机在1880年代首次出现时工厂主做了一件完全理性但完全错误的事情他们用电动发动机替换了蒸汽机但没有改变工厂布局。工厂仍然是围绕中央动力源设计的通过传动轴和架空皮带分配机械力。电动机只是放在了蒸汽机曾经的位置上。生产力增益微乎其微。花了将近40年——直到1920年代——新一代管理者才意识到电力的真正优势是分布式动力。你可以在每个工位放一个小型电机。你可以围绕工作流程而不是动力源的位置重新设计整个工厂。只有那时生产力才开始起飞。早期与电力相关的生产力增益微乎其微。花了将近40年——直到1920年代——新一代管理者才意识到电力的真正优势是分布式动力Paul David在他1990年的论文《电动机与计算机》中记录了这一滞后。他的论点是通用技术——电力、计算以及现在的AI——需要组织、管理和业务流程的互补创新其生产力潜力才能实现。仅靠技术是不够的。你必须重新布线工厂。我们现在正处于AI的电动机阶段。大多数公司正在做相当于更换蒸汽机的事情他们将AI附加到现有工作流上而没有重新思考工作流本身。一个客户支持团队添加了聊天机器人但保持了相同的工单路由逻辑。一个软件团队使用Copilot但保持了相同的冲刺结构和代码审查流程。一个法律部门使用AI进行文档审查但保持了相同的律师配置模型。Databricks的CEO Ali Ghodsi一直在提出类似的观点。仅在他的平台上现在有80%的数据库是由AI智能体而非人类构建的——但这并不是均匀分布的。企业采用受到他所描述的40年积累的数据架构混乱的制约来自不同供应商的软件、跨系统隔离的数据、使甚至简单的集成都变得困难的安全顾虑。直到公司将目前困在员工头脑中的上下文——机构知识、隐性工作流、不成文规则——放入模型中AI仍然只是一个花哨的工具而不是生产力杠杆。AI带来的生产力革命将会到来。但它将来自重新布线工厂而不是将更智能的引擎固定到现有的布局上。而这种重新布线是组织性的不是技术性的。它很难、很慢不会出现在季度收益中——这正是为什么生产力统计数据仍然停滞不前即使AI投资在爆发式增长。4、职业阶梯正在断裂有一个领域AI的影响已经在数据中清晰显现而它不是大多数人预期首先看到的地方。斯坦福数字经济实验室的Erik Brynjolfsson、Bharat Chandar和Ruyu Chen利用覆盖数百万美国工人的ADP工资数据发表了首批关于AI就业影响的大规模实证研究之一。他们的发现自生成式AI广泛采用以来在AI暴露度最高的职业中22-25岁的早期职业工作者经历了16%的相对就业下降即使在控制了公司层面的冲击之后也是如此。软件开发人员和客户服务代理——典型的入门级知识工作角色——看到了最陡峭的下降。这种模式是具体且具有揭示性的。不是AI在广泛地摧毁工作岗位。同一高暴露领域的年长工作者30岁以上在同一时期看到了6-12%的就业增长。低暴露领域的工人如家庭健康助手看到了相反的模式——对年轻工人的需求稳定。冲击集中在AI可以替代书本知识和实施技能的入门级角色上而这些技能曾经定义了初级员工的价值。初级软件开发人员的主要贡献是根据规范编写代码——将需求转化为实现。这正是AI编码工具擅长的事情。相比之下高级开发人员的价值来自系统架构决策、理解机构上下文、驾驭模糊性和指导——这些是AI处理得不好的事情。初级开发人员的梯子被踢走了但高级开发人员的栖身之地仍然完好无损。Chandar将年轻工作者描述为煤矿中的金丝雀——更广泛重组的早期信号。研究区分了自动化和增强负面的就业影响集中在AI替代任务的领域而不是增强任务的领域。主要以增强型AI应用为主的职业没有出现类似的入门级招聘下降。这种区别对于你如何思考职业策略很重要。传统的职业阶梯假设了可预测的晋升路径。Chandar提议用职业网格来替代它AI赋能的学习使跨职业的横向移动变得更快、更实际。价值从你所知道的越来越商品化转移到你如何运用判断力、说服力和领导力持续稀缺。5、铁锹仍然在赢所有这些对理解超级周期之所以重要是因为经济学和人类影响通过相同的结构性原因连接在一起计算很昂贵计算是约束条件谁控制了受约束的资源谁就捕获了剩余价值。NVIDIA的数据中心业务在2025年底的一个季度就达到了620亿美元年化约2,500亿美元。当AI计算需求以估计每年310%的速度增长而芯片供应以约45%的速度增长时约束是显而易见的。NVIDIA不仅从擅长制造芯片中受益——它从成为瓶颈中受益。以目前的规模仅NVIDIA一家在过去两年增加的增量收入大约是整个应用层总和的三倍。前五大超大规模企业——微软、谷歌、亚马逊、Meta、Oracle——2025年在资本支出上花费了约4,430亿美元预计2026年将超过6,000亿美元其中约75%用于AI基础设施。这些数字是前所未有的。资金流向计算因为计算是约束整个系统的东西。但在计算之下还有一层约束着它的东西能源。这是瓶颈分析变得真正有趣的地方。AI计算栈有多个依赖项每个都以不同的速度增长。芯片生产以每年约45%的速度增长。内存带宽约28%。网络互连约35%。但AI数据中心的能源容量以每年约15%的速度增长而计算需求以310%的速度增长。整个系统的有效供应增长受限于其最慢的组件。但AI数据中心的能源容量以每年约15%的速度增长而计算需求以310%的速度增长。整个系统的有效供应增长受限于其最慢的组件。现在那就是能源。这不是资本可以在短时间内轻松解决的问题——许可、电网互联排队以及大规模电力基础设施的基本物理学都在十年时间尺度上运作。这就是为什么核电站重启的对话和小型模块化反应堆的部署已经成为严肃的基础设施策略而不仅仅是绿色公关。这就是为什么黄仁勋说能源是他唯一担心的约束——因为与芯片供应或封装能力不同你不能通过预承诺来获得额外的50吉瓦电网电力。投资含义追踪瓶颈因为那是剩余价值汇集的地方。三年来一直是芯片。现在部分是能源。随着芯片供应的扩展约束将会迁移——到内存带宽、到网络、到任何成为新的最慢环节的东西。无论约束集中在哪里经济学就跟随到哪里。到目前为止三种模式。倒置三角形是结构性的不是偶然的——tokenomics使应用利润率保持低位半导体利润率保持高位这种情况直到推理成本下降到足以使应用COGS可以忽略不计时才会解决尽管成本下降了99.7%但由于需求增长速度快于成本下降速度这还没有发生。生产力影响是真实的但滞后的——就像电动机一样就像计算机一样——在大多数公司中捕获它所需的组织重新布线几乎还没有开始。劳动力市场影响已经可衡量但比标题所暗示的要窄集中在AI可自动化任务中的入门级角色上而高级工作者和以增强为主的领域的工人正在经历就业增长。这三种模式都指向同一个方向铁锹生意仍然是这个周期中最好的生意。6、一个假设我们如何知道三角形已经翻转如果每个先前的平台周期最终都将价值向上移动那么问题是AI何时跟随。不是作为带有日期的预测——那些通常是错误的——而是作为带有可观察标记的假设。我们实际上需要看到什么才能得出AI超级周期已经从基础设施建设成熟为应用驱动型经济的结论云计算的先例是最接近的类比。AWS于2004年推出。软件层直到2010-2012年才真正接管。在大约15年的时间里技术栈从硬件主导转向软件主导。以AI利润份额迁移的当前速度——基础设施和应用每两年各增长约4个百分点——达到类似云计算的利润分配将需要十多年。云计算的转变花了15年。AI可能更快但更快可能意味着7-10年而不是2-3年。以下是我会关注的标记——不是作为确定性而是作为倒置开始解决的信号。推理成本通缩超过需求弹性。目前每token成本下降280倍导致总支出增长3倍。当成本通缩远远超过需求增长使应用毛利率开始向50%以上扩张时——这是传统软件业务运作的水平——三角形开始翻转。我们还没有接近这个点。但成本下降的轨迹是非凡的在某个点杰文斯悖论会饱和——需求弹性有天花板成本通缩没有。定制硅片碎片化NVIDIA的利润率。谷歌的TPU项目是最成熟的替代方案据报道已经迫使NVIDIA做出了一些价格让步。亚马逊已经部署了140万颗Trainium2芯片其定制芯片业务的ARR已超过100亿美元。微软的Maia 200现在为一些ChatGPT工作负载提供动力。如果其中两三个项目在真正的训练规模上取得成功——而不仅仅是推理——半导体层利润率将压缩利润将向上重新分配。这可以在NVIDIA的毛利率趋势中按季度观察。注意持续压缩到70%以下。在支付意愿巨大的行业中应用层的崛起。医疗保健占美国GDP的17%。教育是另一个巨大的市场。如果AI能够大规模交付有意义的个性化医疗诊断或辅导应用收入机会将使当前的聊天机器人生态系统相形见绌。下一个万亿美元的AI公司可能根本不会看起来像聊天机器人。它们看起来会像是碰巧运行在AI基础设施上的医疗保健和教育平台。这里的信号是应用层收入开始比其运行的基础设施增长更快——这在绝对金额上还没有发生。电动机重新布线达到临界质量。这是直接衡量最困难但可以说最重要的一项。当公司开始报告来自AI的真正生产力增益时——不是我们添加了一个聊天机器人而是我们围绕AI原生工作流重组了运营和人员编制——那就是工厂地面真正围绕分布式动力重新设计的时候而不仅仅是更换引擎。Ali Ghodsi观察到Databricks上80%的新数据库是由AI智能体而非人类构建的这可能是一个早期信号。但我们需要看到这种模式在各行业中传播而不仅仅是在数据基础设施层内。推理在计算组合中占主导地位。目前GPU使用大约60%用于训练40%用于推理。随着自主智能体开始持续工作——24/7监控、计划、执行任务而不是响应单次提示——推理需求将以训练不会的方式复合增长。当推理超过总计算使用的70-80%时经济学在结构上转向应用层因为推理收入比训练收入更接近终端用户。这可以在超大规模企业的披露和NVIDIA自己的细分报告中直接观察到。这些标记都还没有被触发。有些可能几年内都不会被触发。但它们共同形成了一个可检验的假设AI超级周期成熟——以及三角形翻转——当组织重新布线赶上技术能力时当token成本下降到足以给应用公司真正的利润率时以及当约束资源从硬件供应转向更接近人类采用速度的东西时。这个周期的长期赢家可能仍然是应用公司——就像云计算周期的长期赢家是SaaS业务而不是AWS。最重要的构建者将是那些想清楚如何重新布线工厂的人而不是那些将聊天机器人固定到现有布局上的人。那种重新布线——组织性的而非技术性的——是实际生产力增益隐藏的地方。这也是这个周期中最艰难、最有价值的工作仍有待完成的地方。原文链接AI经济学倒置的价值链 - 汇智网

5分钟终极指南：用Fan Control轻松掌控Windows电脑风扇，打造静音高效散热系统

5分钟终极指南：用Fan Control轻松掌控Windows电脑风扇，打造静音高效散热系统【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https:…...

2026/5/22 21:04:13 阅读更多 →

深入解析RocketMQ消息生命周期：从生产、存储到消费的全链路实践

1. 项目概述：从零开始理解一条消息的旅程作为一名在后端领域摸爬滚打了多年的开发者，我处理过各种各样的消息队列，但RocketMQ的设计哲学和实现细节，总能让我在每次深入探究时都有新的收获。今天，我们不聊枯燥的官方文档…...

2026/5/22 21:04:03 阅读更多 →

LwIP移植实战指南：从协议栈选型到内存调优的嵌入式网络开发

1. 项目概述：从零到一，LwIP移植的实战心法搞嵌入式网络开发的朋友，对LwIP这个名字肯定不陌生。它是一个轻量级的开源TCP/IP协议栈，专为资源受限的嵌入式系统而生。但“轻量”不代表“简单”，尤其是当你需要把它从官方例…...

2026/5/22 21:02:45 阅读更多 →

单相光伏发电并网控制【附代码】

✨ 长期致力于光伏电池、整流控制、逆变控制、最大功率点跟踪技术研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）自适应变步长电导增量法最大功率点跟…...

2026/5/22 11:02:58 阅读更多 →

【代码】hot100

Easy 两数之和两数之和 class Solution:def twoSum(self, nums: List[int], target: int) -> List[int]:xdict{}for i in range(len(nums)):jtarget-nums[i]if j in xdict.keys():return [i,xdict[j]]else:xdict[nums[i]]i 有效的括号有效的括号 class Soluti…...

2026/5/22 12:51:34 阅读更多 →

G-Helper终极教程：华硕笔记本轻量级性能控制神器

G-Helper终极教程：华硕笔记本轻量级性能控制神器【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertb…...

2026/5/22 16:38:09 阅读更多 →