算力大爆炸：GPU凭什么统治了AI时代？

张

张建站

2026/5/30 16:30:56

10分钟阅读

说实话到现在我还记得第一次接触GPU的感受。那时候是2012年, 我购置了一张二手显卡, 心里期望玩游戏能够更流畅些。谁能料想到十年之后, 这物品竟然变成了全球最匮乏的资料, 就连黄牛都着手炒作显卡了, 你会相信这件事吗?为什么GPU比CPU更适合算力任务好多人会发问, CPU难道不就是处理器, 为何AI训练非得要用GPU。这个问题其实挺有意思的。中央处理器宛如一位无所不能的超级学霸, 对各类知识皆能涉猎, 然而在同一时刻仅能够处理为数不多的几件事情。图形处理器恰似一位体育教师, 尽管思维的敏捷程度略逊一筹, 不过却可以在同一时间带领几百号人员进行体操活动。你瞧, 一块平常的CPU大约有8个至16个核心, 然而一块GPU呢, 却有几千个, 就拿的A100来说, 它拥有6912个CUDA核心, 当然, 我们不提及品牌名, 仅仅讲述这个数量级。当进行AI训练之际, 你所面对的情形是, 存在海量的矩阵运算, 并且, 其中一个模型或许有着上亿个参数, 要是利用CPU逐个进行运算, 那将会算到遥遥无期, 然而, GPU却能众多一起上, 几千个核心同时开展工作, 其效率直接远超几十倍。在2018年期间, 对GPT - 1进行训练, 动用了8颗GPU。直至2020年GPT - 3出现, 其数量一下子飙升到上万颗。到了2024年, 传闻中的GPT - 4, 据说使用数量达到了25000颗。这样的增长速率, 相较于房价而言更为迅猛。显存到底有多重要你可能听说过“显存不够”这个词。比如这么说: 称作显存的存储空间, 就如同你日常使用的办公桌, 桌面的面积越大, 那么你可以平铺开来放置的资料数量就会越多, 要是显存的容量过小, 模型便无法完整存放只得是频繁地从硬盘之中调取数据, 如此一来速度就会急剧下降到仿佛脚踝处那般缓慢。目前处于主流地位的AI模型, 其参数动不动就达到几百亿。仅仅是7B的那种模型, 也就是有着70亿参数的, 大约要14GB的显存才可以使其运行起来。而70B的模型呢, 起码得有140GB。单单一张显卡根本无法容纳这么多, 必须得让几块显卡并联才行。所以, 你瞧那些从事AI行业的公司, 为啥动不动就在抢购显卡 , 并非是由于他们热衷于玩游戏实则是真真切切地缺乏显卡, 无法满足需求。在2025年的时候, 存在着这样一个数据, 全球GPU的出货量预计将会达到2.5亿块, 其中, 用于数据中心的高性能GPU这一部分, 大概占据了3%到5%的比例。尽管这个比例看起来比较小然而其价值却在整个市场中占据了40%还多。算力为什么成了硬通货我存在一位友人, 于杭州开展AI创业相关事宜。他向我讲述过那么一档子话: “现今进行融资操作时, 投资人首先提及的那句话并非询问商业模式怎样, 而是询问‘你手上持有多少张卡’。“。听起来荒诞但这就是现实。在2024年时的全球AI算力市场, 其金额差不多估计是有着500亿美元之数。而到了2027年, 经预计其能够达到1500亿。这样的增长曲线状况, 相较于火箭而言还要显得更加陡峭, 呈现在更高的陡度特征上。为什么这么贵因为制造难度太大了。在一块顶级GPU的芯片之上, 集成了数量超越800亿个的晶体管。制造工艺历经从7纳米至5纳米, 而后又到3纳米的变化。每一步骤皆是在耗费资金。一座具备先进制程的晶圆厂, 其所需要的投资额超过200亿美元。据说, 台积电2025年有关3纳米的产能, 其中70%可都是被一家公司给包揽了。而这般的垄断程度, 相较于石油而言, 那可是还要更为夸张的。算力缺口有多大别以为只有大公司在抢。中小企业也在抢。在2025年, 依据IDC所给出的数据表明, 这全球范围约多达60%的企业, 它们已然或者正处于部署AI应用的进程当中。然而, 在这些企业里面那些占据80%比例的中小企业, 实际上能够获取到的算力情况是, 其数量还达不到自身需求的30%。这般情形究竟意味着什么呢? 意味着绝大多数的公司都在借助算力延长自己的持续存在时期, 并非是实现自身的进步与扩展。有的小型团队, 为了运行一个模型而守候, 需要等待三天时间。大型企业情况? 经过三分钟便能够得出结果。这样的差距可不是一点点。能效比是个大问题GPU好归好但真是电老虎。一块具备高端性能的GPU, 其功耗能够达到700瓦, 一个数据中心若安置上几万块这样的GPU, 那么每小时所消耗的电量可达几十万度。在2024年时, 全球数据中心的用电总量, 已经在全球总用电量中占据了2%到3%的比例, 而且这个比例还处于持续上涨的态势。国际能源署预测, 到二零二六年, 人工智能训练所消耗的电量, 有可能会增长至原来的三倍, 这个数据相当惊人。因此当下众人都着手开展“绿色算力”方面的工作, 像液冷技术这类, 它能够使散热效率提高超过百分之三十, 并且还能够减少百分之五十的能耗, 然而其成本也是高昂的, 改造一套液冷系统, 起步就是几百万。未来的算力会怎么走我猜未来两三年会有几个方向。一方面是, 能够像提供水电那般, 依据需求来供应的算力云化, 你并非要自己去购置显卡, 而是可以选择租赁。其一为芯片呈现出多样化的特质, 其二是除了GPU之外, 还存在着诸如TPU、DPU、NPU此类各种各样的专用芯片, 其三是在2025年的时候, 针对全球范围内的AI芯片市场而言非GPU的份额大概有可能会处于15%左右的水平之上, 其四是到了2030年的时候, 该项份额大概有可能会攀升至30%。其三是国产替代, 尽管当下仍存在差距, 然而国产GPU在推理场景已然可以投入使用, 举例而言, 在2025年时, 某些国产芯片已然能够使百亿参数模型运行成功, 虽说训练方面尚不可行, 但是推理方面并无问题。最后说句实话。算力这东西不是万能的但没有算力是万万不能的。眼前映入你视线之中的每一款人工智能应用, 每一回展开产生的智能对话, 其背后皆是一列列发出嗡嗡声响的显卡正在竭尽全力地从事劳作。它们既不进行休息, 也不发出言语, 单纯只是静悄悄地持续运算着, 运算着, 将数字转化成为令人惊叹的奇迹。你和我, 此刻正伫立在这个算力呈现极大规模爆发式增长的门口之处。有的人察觉到了其中的恐惧之感, 有的人则发现了蕴含的机会所在。你呢

基于Dagshub与Azure的数据版本控制与云端训练实践

1. 项目概述：当数据湖遇上云端训练在机器学习和数据科学项目里，数据管理一直是个让人头疼的“脏活累活”。想象一下这个场景：你的训练数据分散在本地硬盘、团队共享盘、甚至某个同事的电脑里，每次启动一个云端训练任务&#xff0…...

2026/5/30 16:30:56 阅读更多 →

机器人末日：技术现实与经济社会冲击的深度解析

1. 从科幻到现实：我们离“机器人末日”还有多远？“机器人末日”这个词，听起来像是科幻电影里的陈词滥调，从《终结者》里的天网到《黑客帝国》里的矩阵，人类被自己创造的智能造物反噬的恐惧，似乎从未远离过我…...

2026/5/30 16:26:02 阅读更多 →

Unity 2024新手必看：用Tilemap复刻FC经典《超级马里奥》第一关，保姆级避坑指南

Unity 2024新手必看：用Tilemap复刻FC经典《超级马里奥》第一关，保姆级避坑指南当像素风的经典旋律在耳边响起，你是否也曾想过亲手重建那个充满蘑菇与金币的奇妙世界？本文将带你用Unity 2024的Tilemap系统，从零开始完…...

2026/5/30 16:25:13 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/26 6:08:07 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/29 11:21:15 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/30 9:36:03 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/30 17:00:57 阅读更多 →