Token消耗量呈现惊人的增长,其背后是AI成本的急剧上升,而实际效益却难以匹配。
100万亿,这个以“1”开头的数字后面伴随着14个零,代表着惊人的数量级。这甚至还不足以完全涵盖国内用户每天的Token使用量。到了2026年上半年,从科技中心的硅谷到中关村,企业内部最普遍的讨论已转变为“你今天消耗了多少Token?”。这个数字可能是几十万、几百万,甚至是几千万。对于旁观者而言,这听起来可能像是在夸大其词,甚至让人怀疑对方的理智。然而,这并非虚言,讨论的焦点是Token,而非人民币。
尽管Token与实际货币之间存在巨大的数量差距,但Token数量的飞速增长却是不争的事实。据报道,一家国外企业在为员工批量开通Anthropic的Claude企业版时,未能设置消费上限,结果一个月后收到了一张高达5亿美元(约合34亿元人民币)的账单。
在国内,近期米哈游也曝出了类似的案例。在2026年5月的阿里云峰会上,《崩坏》系列技术团队的负责人郑银河透露,一名工程师在测试多Agent协作功能时,由于未设置熔断机制,导致数十个智能体陷入了无限循环调用,短短13小时内便产生了200万元的Token费用。
尽管Token账单金额巨大,但当被问及AI带来了哪些实际效益时,大多数人可能都感到难以启齿。米哈游工程师那笔200万元的Token费用,足以支付一个小型研发团队一个月的薪资,然而最终的回报却仅仅是一夜之间毫无产出的“AI摸鱼”。
或许,企业中只有人力资源部门完成了裁员的KPI,而企业主则将节省下来的人力成本重新投入到AI建设和Token采购中。
随着单位价值的稀释和消耗规模的指数级增长,投入与产出之间的错位日益明显。Token,作为AI时代的关键要素,正显现出典型的通货膨胀特征,其通胀程度甚至可能比津巴布韦的货币贬值还要迅猛。
那么,究竟是谁在助推这种“Token通胀”?
01 从“用够”到“用好”:使用策略的转变
2026年上半年,一股名为“Tokenmaxxing”(最大化Token使用)的潮流席卷了硅谷。大型科技公司甚至鼓励员工尽可能多地消耗Token,并将Token消耗量与绩效考核直接挂钩。
Meta内部设立了追踪8.5万名员工Token消耗量的排行榜,并为排名靠前的员工颁发“Token传说”、“缓存大师”等称号。亚马逊推出了名为“KiroRank”的内部AI使用排行榜,将Token消耗数据纳入团队的绩效评估体系。
英伟达CEO黄仁勋的言论更是火上浇油:“如果我的工程师消耗的Token价值达不到他们年薪的一半,我会深感担忧。”
国内厂商也迅速跟进。腾讯在2026年3月推出了面向全体员工的AI激励计划,为每位员工提供了年均22万元的Token资源,涵盖Cursor、CodeBuddy等国内外多款工具,公司内部也一度出现了Token消耗排行榜。
不出所料,这些公司的AI账单也随之失控。
在短短30天内,Meta的员工消耗了60.2万亿Token,成本超过1亿美元。Uber仅用了4个月就耗尽了2026年全年的AI预算,管理层不得不紧急出台了限制令,规定每位员工每月AI工具费用不得超过1500美元。亚马逊也开始实施严格的Token限额管理,高级副总裁Dave Treadwell甚至亲自出面呼吁“不要为了使用AI而使用AI”。
就在上个月,腾讯内部也发布了额度调整通知:全员Token配额大幅缩减,核心研发团队的月度额度从之前的宽松状态收紧至7000元,而外包岗位的额度更是被削减至1000元。
从全员敞开使用到实施限额管理,短短三个月内,情况发生了急剧转变。究其原因,无非是飙升的账单让即使是财力雄厚的大公司也感到难以承受。
正如OpenAI首席执行官Sam Altman在近期的一次企业客户活动中所说:“今年年初,AI的运行成本还是一个从未被提及的问题,现在它突然变成了一个巨大的问题。”
这背后是需求的爆炸式增长。国家数据局数据显示,2026年3月,中国日均Token调用量已突破140万亿,而2024年初仅为1000亿,两年时间增长超过千倍。
从全球范围来看,这种增长趋势尚未出现放缓的迹象。高盛近期发布的报告预测,到2030年,全球Token月消耗量将比2026年增长24倍,达到约120千万亿(120 quadrillion)Token/月,其中企业级智能体将是主要的增长动力。
Token账单的失控也带来了另一个负面影响。为了弥补AI的成本缺口,今年第一季度,全球十几家科技巨头裁员超过4万人,其中程序员首当其冲;而在国内,“630”成为了许多互联网从业者的共同“最后一天”。
在Meta,几乎已经没有人手动编写代码;在国内的头部大厂,新增代码中高达90%由AI生成。AI代码生成率的飙升直接导致了人力需求的下降,并引发了随之而来的职场动荡。
02 Token账单飙升之谜
账单费用由“用量”和“价格”两个因素决定。在这看似简单的公式背后,隐藏着两层不透明的推高逻辑,最终叠加导致了指数级的成本膨胀。
许多人存在一种误解:大模型的价格一直在下降,AI不应该越来越便宜吗?实际上,这只说对了一半——价格持续下降的往往是通用型轻量模型,而企业真正刚需的编程、长上下文处理、复杂推理等高价值场景,其价格不仅没有下降,反而呈现出逆势上涨的趋势。
Anthropic推出的安全增强版模型Fable 5,其定价高达每百万Token输入10美元、输出50美元,是同期Opus系列的两倍。
国内的智谱AI也是一个典型例子。据天眼查数据显示,2026年第一季度,智谱AI伴随新模型的迭代连续三次上调了核心API的价格,累计涨幅达到83%。其面向通用场景的GLM-4.7轻量模型,输入价格仅为2-4元/百万Token,输出价格为8-16元;然而,针对编程和Agent场景的GLM-5.2,输入价格上涨至8元,输出价格高达28元,两者价差最高可达4倍。
此外,腾讯云在2026年3月至4月经历了两次调价,混元HY 2.0 Instruct模型的输入价格涨幅高达463%;MiniMax的核心模型价格也有30%-50%的上调。
与此同时,模型厂商的计费模式已从订阅制全面转向按量付费,这意味着厂商的收入直接与Token消耗量挂钩。这就产生了一个结构性矛盾:客户的目标是以最少的Token完成任务,而厂商的商业利益则天然地倾向于让客户消耗更多的Token。
从实际数据来看,近来Token消耗量的增长并非线性,而是呈现指数级增长。
自2025年底至今,AI产业最核心的变化是从对话式AI向智能体(Agent)的跃迁。AI不再是简单的问答式线性交互,而是演变为自主规划、循环调用、多轮纠错的复杂流程,Token消耗也随之从线性增长转变为指数级膨胀。
Agent虽然能力强大,但据腾讯研究院分析,它隐藏着几类典型的低效消耗模式:
这些损耗并非简单的加总,而是相互叠加的乘积效应。一个复杂的多Agent任务,可能近一半的Token被用于内部协调、自我纠错和重复读取,真正用于生成有效内容的比例并不高。对于缺乏技术能力的企业而言,这更是一笔难以看清、无法计算的糊涂账。
03 错失的恐惧
如果说大模型厂商的产品和定价策略是公开的“阳谋”,那么企业内部的Token消费则是一场自上而下的“自我消耗”。
**担心错过AI变革浪潮的企业,纷纷不遗余力地拥抱AI。**这种压力也自然而然地传递到每一位员工身上,尤其是在AI可能取代人类岗位的阴影下,员工普遍将“会用AI、多用AI”视为获得安全感的方式。
许多公司将AI代码生成率、工具使用时长纳入OKR考核,甚至上线全员可见的数据看板,迫使每个人都去“刷”消耗量。明明可以通过搜索引擎或人力在几秒钟内解决的简单邮件回复、基础代码片段、常规数据查询,也要交给大模型处理一遍——反正费用不是自己掏的,用得越多似乎越能体现“拥抱变革”。
企业将Token消耗量与员工绩效挂钩,默认“使用了多少AI”等同于“创造了多少价值”,并愿意为此支付高昂的账单。
有人认为,这是历史的必然。历史上每一次通用技术革命,都走过类似的道路。蒸汽机刚发明时,工厂主计算后发现,使用马匹比蒸汽机更经济;电灯刚问世时,其成本远高于煤气灯。
但不同的是,电力消耗产出的是实实在在、可衡量的工厂效益,而Token换来的“智能”到底创造了多少价值?答案是,目前仍难以量化。
据“晚点LatePost”报道,一位大型互联网科技公司的技术管理者表示,他部门的20多人,一个月消耗了5万元Token,但回顾下来,却未能沉淀出几个可落地的成果。这笔钱相当于10名实习生的月薪,化为无形的Token后,甚至连清晰的产出物都没有。
在许多基础场景中,使用AI反而比人工成本更高。
国内一家人力资源服务商进行过测算:使用AI筛选并初步评估一份简历,Token和系统成本约为1.2元/份,而雇佣兼职人事处理的成本仅为0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答等场景中也普遍存在。
**AI还带来了更隐蔽的成本。**有软件公司的研发负责人反馈,引入AI编程工具后,初级开发人员的效率看似提升了,但高级工程师的评审工作量翻倍,线上故障的返工成本增加了30%以上。总账算下来,反而不划算,而且,员工的工作负担更重了。
这正是Token经济最核心的矛盾所在:Token消耗与价值创造之间,从来都不是简单的线性关系。消耗的Token越多,产出的价值并不一定越大;相反,很多时候消耗的增长恰恰源于无效的循环、冗余的架构和盲目的焦虑。
04 结语
回到最初的问题,谁在推动“Token通货膨胀”?这不是某个AI厂商的恶意营销,也不是少数员工的滥用浪费,而是我们所有人。
从提供底层算力基础设施的GPU和存储供应商,到大模型架构固有的膨胀属性;从每一个担心错过AI浪潮而焦虑的企业,直到每一位担心落伍的员工——所有人,共同推高了Token的消耗,加速了Token的贬值,也催生了那本日益增厚的AI账单。
每个人都在助推Token的通胀,而每个人又在自身推力的作用下步履蹒跚。
2条评论
布兰登·凯利
MK体育平台提供7x24小时不间断服务,无论何时何地,您都能获取所需的体育赛事信息和专业数据支持。