苏州市干将路303号创意产业园
0512-3565 6563
Jackjones@kuaidata.com
联系客服
数据中心托管服务/管理式网络
服务:
400 651 8888
微软云服务:
400 089 2448
markjune@kuaidata.com
内容分布式网络服务:
400 811 0278
云集成与合作:
cloud@kuaidata.com
2026-06-22
过去,大模型行业最重要的指标是参数量。如今,这个指标正在被另一个更现实的指标取代——Token价格。
当GPT-4发布时,每百万Token的价格仍然处于美元级别;而今天,无论是开源模型还是商业模型,Token价格都在以近乎“跳水”的速度下降。过去需要几美元才能完成的任务,如今可能只需要几美分就能实现。
进入6月,OpenAI、Anthropic等全球多家大模型厂商开始重新调整Token价格,以回应企业用户对AI成本暴涨的不满。 然而,较此前声势浩大的推广潮,此次Token价格下调更像是行业新一轮残酷竞赛的序幕。
从表面看,这是技术进步带来的效率红利。但从产业视角观察,Token降价远不是一次简单的价格调整,而是一场影响AI产业链上下游的深层变革。
当Token成为新的生产资料,Token价格就如同工业时代的电价、互联网时代的带宽价格一样,最终决定着整个产业的价值分配逻辑。而真正值得讨论的问题是:当Token越来越便宜,谁将成为赢家?谁又会成为被淘汰的人?
Token价格雪崩,AI行业进入“产能过剩时代”?
如果回顾过去两年的AI产业发展,会发现一个有趣现象。几乎所有参与者都在拼命扩大供给。芯片企业不断推出更高性能GPU;云厂商持续建设超大规模智算中心;模型厂商不断训练更大的基础模型;资本市场则持续向AI基础设施投入巨额资金。整个产业都在重复一个逻辑:未来Token需求将无限增长,因此必须提前建设足够多的算力供给。

这种逻辑本身没有问题,问题在于供给增长速度已经开始超过需求增长速度。过去一年,全球新增GPU数量增长远远快于真实商业化AI应用增长。许多企业采购大量算力后发现,训练任务结束之后,GPU利用率并没有达到预期。于是,大量闲置算力开始流向推理市场。推理市场竞争的核心,就是Token价格。当越来越多模型服务商拥有相似能力时,用户开始把Token视为一种标准化商品。模型质量差距不断缩小,价格差距则成为竞争焦点。这种现象与云计算行业早期极其相似,当计算资源开始标准化,最终比拼的不再是谁拥有服务器,而是谁能把计算资源卖得更便宜。今天的大模型行业,也正在经历同样的过程。Token正在从高附加值产品,逐渐变成标准化工业品。而工业品最典型的特征,就是价格持续下降。对于用户而言,这是利好。但对于供给侧而言,这意味着残酷的利润压缩已经开始。从某种意义上说,Token降价不仅是技术进步的结果,更是产能竞争的产物。价格战的背后,本质上是整个AI行业开始进入供给主导时代。
用户买的将不再是Token,而是结果
历史上,每一次基础资源价格下降,都会引发产业价值链重组。电力如此,带宽如此,云计算资源同样如此。Token也不会例外。过去,大模型企业最大的价值来自模型本身。谁拥有最先进模型,谁就拥有定价权。但随着模型能力趋同,Token价格持续下降,模型开始从稀缺资源变成基础设施资源。这意味着,价值正在向上层迁移。换句话说,未来用户购买的可能不是Token,而是结果。企业客户不会关心调用多少Token,也不会关心底层模型是谁。他们真正关心的是销售额是否增长、客服成本是否下降、研发效率是否提升。当Token价格足够低时,它将像电力一样被隐藏在后台。没人会因为家里用了多少度电而选择某个品牌的冰箱,同样也没人会因为某个Agent使用了多少Token而决定是否采购。真正产生价值的是应用层,这也是为什么越来越多资本开始从基础模型转向AI Agent、行业应用和企业服务。当前,模型层利润正在被压缩,应用层利润反而开始扩大。过去几年,人们普遍认为基础模型将吞噬产业链利润。但现实可能恰恰相反,基础模型最终可能成为利润率最低的环节。正如云计算巨头赚取的是规模利润,而SaaS企业赚取的是场景利润一样。未来的大模型产业,也许会重演类似故事。当Token足够便宜,模型将退居幕后,应用才会站上舞台中央。

算力投资逻辑动摇,回报周期被迫拉长
如果说应用企业是Token降价的受益者,那么另一端则面临巨大挑战,那就是算力产业。过去两年,全球智算中心建设进入历史高峰期,地方政府、运营商、云服务商和投资机构,都将GPU视为新的战略资产。其核心逻辑非常简单:拥有更多GPU,就能生产更多Token;生产更多Token,就能获得更高收益。但问题在于,收益端正在发生变化,如果Token价格持续下降,那么同样数量GPU创造的收入也会持续下降。这意味着,算力资产的投资回报周期正在被拉长。许多智算中心最初测算商业模型时,假设Token价格能够长期维持较高水平。但现实却是价格每隔几个月就会下降一次,当收入下降速度超过硬件折旧速度时,资产价值就会受到冲击。事实上,类似的情况已经在云计算产业发生过。服务器价格不断下降,云主机价格不断下降,最终导致行业进入规模竞争阶段。今天的GPU产业,同样存在类似风险。未来,衡量一座智算中心价值的标准,可能不再是拥有多少GPU,而是能够以多低成本生产Token。这个变化看似细微,却意味着产业逻辑发生根本转变。过去比拼规模,未来比拼效率;过去卖算力,未来卖Token成本。当Token价格成为核心指标时,整个数据中心产业都将重新定义竞争力。
真正的赢家:不是生产Token的人,而是消耗Token的人
Token降价最有趣的地方在于,它改变了产业利润流向。在工业时代,电价下降推动制造业繁荣;在互联网时代,带宽价格下降推动视频平台崛起;而在AI时代,Token价格下降同样会创造新的产业赢家。
这些赢家未必是模型厂商,甚至未必是算力厂商,更可能是那些能够大规模消耗Token的人。Token越便宜,创新成本越低。过去开发一个AI应用,需要精打细算控制推理成本。而未来,当Token成本趋近于零时,开发者将拥有几乎无限的实验空间。

Agent数量将快速增长,AI搜索将全面普及,AI客服将取代传统呼叫中心,AI数字员工将进入企业运营体系。大量过去因为成本过高无法成立的商业模式,将重新变得可行。这与互联网早期极为相似,真正创造万亿美元市值的企业,并不是光纤制造商,而是利用廉价带宽创造新需求的平台公司。同样道理,未来最大的AI企业,未必是生产Token的企业,而可能是消费Token最多的企业。从这个角度看,Token降价实际上是在释放需求,价格下降不是产业衰退信号,而是产业爆发前夜。只有当资源足够便宜,创新才会大规模发生,而需求爆发之后,又会反过来推动新的基础设施建设。
Token价格趋近于零,AI竞争进入新阶段
如果Token价格最终无限接近于零,会发生什么?很多人认为这意味着模型企业失去商业价值。但历史告诉我们,基础资源价格下降并不意味着产业价值消失。恰恰相反,它往往意味着产业进入更高级阶段。
电力价格下降之后,诞生了现代制造业;存储价格下降之后,催生了大数据和云服务;带宽价格下降之后,催生了视频经济;Token价格下降之后,同样会催生新的经济形态。未来企业竞争的核心,不再是谁拥有最贵的模型,而是谁拥有最多用户、最多场景、最多数据以及最高效的Agent系统。模型能力会逐渐标准化,Token价格会持续透明化,算力资源会逐步商品化。最终,AI行业将像今天的互联网一样,把竞争焦点从基础设施转向生态系统。这或许才是Token降价真正值得关注的地方。它不是一次简单的价格战,也不是模型厂商之间的市场竞争,而是AI产业从“卖算力、卖模型”走向“卖结果、卖价值”的历史拐点。未来几年,Token价格可能还会继续下降。但真正重要的并不是Token会降到多少钱,而是谁能够在Token越来越便宜的时代,找到新的价值创造方式。当Token成为新资产,决定企业命运的将不再是生产多少Token,而是能够利用这些Token创造多少新的商业价值。而这,或许才是AI产业下一轮竞争真正开始的地方。
智算产业顶级盛会来袭!
2026中国智算产业生态发展年会将于6月30日在深圳盛大启幕。本届大会以"AI入场景,Token大时代"为主题,设置主论坛、年度评选、Token闪话、闭门商务配对会、创新成果展等多元环节,汇聚大模型企业、算力基础设施提供商(芯片、服务器等)、算力服务商、行业用户,共同探讨智算产业从建设走向应用、从技术走向生态的关键路径。