说实话到现在我还记得第一次接触GPU的感受。那时候是2012年, 我购置了一张二手显卡, 心里期望玩游戏能够更流畅些。谁能料想到十年之后, 这物品竟然变成了全球最匮乏的资料, 就连黄牛都着手炒作显卡了, 你会相信这件事吗?为什么GPU比CPU更适合算力任务好多人会发问, CPU难道不就是处理器, 为何AI训练非得要用GPU。这个问题其实挺有意思的。中央处理器宛如一位无所不能的超级学霸, 对各类知识皆能涉猎, 然而在同一时刻仅能够处理为数不多的几件事情。图形处理器恰似一位体育教师, 尽管思维的敏捷程度略逊一筹, 不过却可以在同一时间带领几百号人员进行体操活动。你瞧, 一块平常的CPU大约有8个至16个核心, 然而一块GPU呢, 却有几千个, 就拿的A100来说, 它拥有6912个CUDA核心, 当然, 我们不提及品牌名, 仅仅讲述这个数量级。当进行AI训练之际, 你所面对的情形是, 存在海量的矩阵运算, 并且, 其中一个模型或许有着上亿个参数, 要是利用CPU逐个进行运算, 那将会算到遥遥无期, 然而, GPU却能众多一起上, 几千个核心同时开展工作, 其效率直接远超几十倍。在2018年期间, 对GPT - 1进行训练, 动用了8颗GPU。直至2020年GPT - 3出现, 其数量一下子飙升到上万颗。到了2024年, 传闻中的GPT - 4, 据说使用数量达到了25000颗。这样的增长速率, 相较于房价而言更为迅猛。显存到底有多重要你可能听说过“显存不够”这个词。比如这么说: 称作显存的存储空间, 就如同你日常使用的办公桌, 桌面的面积越大, 那么你可以平铺开来放置的资料数量就会越多, 要是显存的容量过小, 模型便无法完整存放只得是频繁地从硬盘之中调取数据, 如此一来速度就会急剧下降到仿佛脚踝处那般缓慢。目前处于主流地位的AI模型, 其参数动不动就达到几百亿。仅仅是7B的那种模型, 也就是有着70亿参数的, 大约要14GB的显存才可以使其运行起来。而70B的模型呢, 起码得有140GB。单单一张显卡根本无法容纳这么多, 必须得让几块显卡并联才行。所以, 你瞧那些从事AI行业 的公司, 为啥动不动就在抢购显卡 , 并非是由于他们热衷于玩游戏 实则是真真切切地缺乏显卡, 无法满足需求。在2025年的时候, 存在着这样一个数据, 全球GPU的出货量预计将会达到2.5亿块, 其中, 用于数据中心的高性能GPU这一部分, 大概占据了3%到5%的比例。尽管这个比例看起来比较小然而其价值却在整个市场中占据了40%还多。算力为什么成了硬通货我存在一位友人, 于杭州开展AI创业相关事宜。他向我讲述过那么一档子话: “现今进行融资操作时, 投资人首先提及的那句话并非询问商业模式怎样, 而是询问‘你手上持有多少张卡’。“。听起来荒诞但这就是现实。在2024年时的全球AI算力市场, 其金额差不多估计是有着500亿美元之数。而到了2027年, 经预计其能够达到1500亿。这样的增长曲线状况, 相较于火箭而言还要显得更加陡峭, 呈现在更高的陡度特征上。为什么这么贵因为制造难度太大了。在一块顶级GPU的芯片之上, 集成了数量超越800亿个的晶体管。制造工艺历经从7纳米至5纳米, 而后又到3纳米的变化。每一步骤皆是在耗费资金。一座具备先进制程的晶圆厂, 其所需要的投资额超过200亿美元。据说, 台积电2025年有关3纳米的产能, 其中70%可都是被一家公司给包揽了。而这般的垄断程度, 相较于石油而言, 那可是还要更为夸张的。算力缺口有多大别以为只有大公司在抢。中小企业也在抢。在2025年, 依据IDC所给出的数据表明, 这全球范围约多达60%的企业, 它们已然或者正处于部署AI应用的进程当中。然而, 在这些企业里面那些占据80%比例的中小企业, 实际上能够获取到的算力情况是, 其数量还达不到自身需求的30%。这般情形究竟意味着什么呢? 意味着绝大多数的公司都在借助算力延长自己的持续存在时期, 并非是实现自身的进步与扩展。有的小型团队, 为了运行一个模型而守候, 需要等待三天时间。大型企业情况? 经过三分钟便能够得出结果。这样的差距可不是一点点。能效比是个大问题GPU好归好但真是电老虎。一块具备高端性能的GPU, 其功耗能够达到700瓦, 一个数据中心若安置上几万块这样的GPU, 那么每小时所消耗的电量可达几十万度。在2024年时, 全球数据中心的用电总量, 已经在全球总用电量中占据了2%到3%的比例, 而且这个比例还处于持续上涨的态势。国际能源署预测, 到二零二六年, 人工智能训练所消耗的电量, 有可能会增长至原来的三倍, 这个数据相当惊人。因此当下众人都着手开展“绿色算力”方面的工作, 像液冷技术这类, 它能够使散热效率提高超过百分之三十, 并且还能够减少百分之五十的能耗, 然而其成本也是高昂的, 改造一套液冷系统, 起步就是几百万。未来的算力会怎么走我猜未来两三年会有几个方向。一方面是, 能够像提供水电那般, 依据需求来供应的算力云化, 你并非要自己去购置显卡, 而是可以选择租赁。其一为芯片呈现出多样化的特质, 其二是除了GPU之外, 还存在着诸如TPU、DPU、NPU此类各种各样的专用芯片, 其三是在2025年的时候, 针对全球范围内的AI芯片市场而言非GPU的份额大概有可能会处于15%左右的水平之上, 其四是到了2030年的时候, 该项份额大概有可能会攀升至30%。其三是国产替代, 尽管当下仍存在差距, 然而国产GPU在推理场景已然可以投入使用, 举例而言, 在2025年时, 某些国产芯片已然能够使百亿参数模型运行成功, 虽说训练方面尚不可行, 但是推理方面并无问题。最后说句实话。算力这东西不是万能的但没有算力是万万不能的。眼前映入你视线之中的每一款人工智能应用, 每一回展开产生的智能对话, 其背后皆是一列列发出嗡嗡声响的显卡正在竭尽全力地从事劳作。它们既不进行休息, 也不发出言语, 单纯只是静悄悄地持续运算着, 运算着, 将数字转化成为令人惊叹的奇迹。你和我, 此刻正伫立在这个算力呈现极大规模爆发式增长的门口之处。有的人察觉到了其中的恐惧之感, 有的人则发现了蕴含的机会所在。你呢