
一位OpenAI的工程师在一周内经由过程公司的AI模型烧掉落了2100亿个Token(相当于33个维基百科全部文本的总和),位居全公司第一。在另一家AI公司Anthropic,一名Claude Code用户在一个月内就产生了跨越15万美元的账单。
这种看似荒诞的攀比并非员工自娱自乐,而是源于老板们的猖狂推许。既然老板迷信AI能提效,猖狂烧钱天然就成了员工保住饭碗的“表演”。在一些科技公司,内部排行榜会及时公开每位员工消费的Token数量;而在Meta和Shopify等巨擘内部,治理层甚至直接将AI对象的应用情况与绩效评估强行挂钩。
业内将这种现象戏称为“Tokenmaxxing(Token最大年夜化)”。
但这笔天价账单真的物有所值吗?企业花重金买回来的,毕竟是能颠覆行业的超等代码,照样员工为了刷榜而让AI猖狂生成的电子垃圾?当烧钱本身成了勤奋的证实,这场合谓的临盆力革命或许只是一场自欺欺人的泡沫。
01 Token:AI时代的硬通货
Token是AI体系处理信息的最小计量单位,大年夜致相当于一个词片段。当用户向AI模型输入文本时,体系会将文字拆解为Token进行处理;当模型生成答复时,同样以Token为单位计算工作量。对于基于文本的AI应用而言,生成750个单词大年夜约须要消费1000个Token。
就在不久之前,即使是重度用户,一天消费数千个Token已属极限。例如,一逻辑学生借助AI完成一篇论文并经由几轮修改,大年夜约用掉落一万个Token(约合7500个单词)。要消费数百万个Token,须要一小我坐在电脑前持续敲击键盘几个小时,而消费数十亿个Token几乎是弗成能的。
然而,跟着所谓智能体编码对象的问世,筹码被加大年夜了。这类对象与传统AI助手的本质差别在于自立性。这些体系可以不受监督地持续工作数小时,只需一个提示词,就能审查和编辑宏大年夜的代码库,甚至编写出完全的软件法度榜样。每个智能体可以生成成百上千个子智能体(subagents)来处理义务的不合部分,每一步操作都在生成数千个Token。一些AI体系(如风行的开源AI助手OpenClaw)甚至被设计为24/7全天候运行,在人类用户睡觉时猖狂消费Token。
AI始创公司Mechanize的结合开创人埃格·埃尔迪尔(Ege Erdil)泄漏:“假如你有几个持续运行的智能体,一个全职智能体一周就能消费7亿个Token。(我估计我本身每周的Token消费量在10亿到100亿之间。)其实根本不须要费什么力量。”
当Token成为衡量AI工作量的通用标尺,它天然而然地演变为一种稀缺资本,甚至成为科技公司人才竞争的新筹码。英伟达CEO黄仁勋在本年GPU技巧大年夜会的主题演讲中明白提出,他筹划在工程师年薪之外,额外供给相当于年薪一半的Token预算。“这如今成了硅谷的雇用手段之一:我的工作附带若干Token?”黄仁勋的这番话,将Token从技巧概念推向了贸易竞争的前台。

OpenAI旗下AI编码办事Codex的工程负责人蒂博·索蒂奥(Thibault Sottiaux)也不雅察到类似趋势。他表示,在求职面试中,越来越多的人开端询问他们能获得若干专属的推理计算资本。Token正在成为继薪酬、奖金、股权之后,科技人才争夺中的第四大年夜构成部分。
02排行榜上的光荣与焦炙
在一些科技公司,Token消费量已不再只是一个技巧指标,而是被付与了强烈的社交属性。在Meta和OpenAI等AI公司,员工们会在内部排行榜上展开竞争,比拼的恰是各自消费的Token数量。排行榜成了新的事迹展示板。大方的Token预算正成为法度榜样员的一项工作福利,就像牙科保险或免费午餐一样。
Shopify则是另一条路径的代表。该公司在一份声明中确认,Token应用只是衡量绩效的指标之一,同时也会考察AI若何改进和放大年夜工作成果。该公司CEO托比·卢特克(Tobi Lütke)已将AI的应用设为一项根本期望,并直接与绩效评估挂钩,那些大年夜量应用AI对象的员工会获得嘉奖,而应用较少或不应用的员工则会受到敲打。
这种氛围催生了一种新的职场焦炙。风险投资家尼昆吉·科塔里(Nikunj Kothari)在他揭橥于Substack的文章中将其称为“Token焦炙”。他不雅察到,科技圈的对话主题正在悄然改变,以前人们会晤时常问“你在构建什么?”,如今变成了“你跑了若干个智能体?”
为了在排行榜上占据一席之地,一些员工开端采取极端策略。一些法度榜样员控制了AI多义务处理的艺术,同时打开多个窗口,一次性将几十个智能体释放到他们的项目中。
更有甚者,应用订阅套餐的马脚,以远低于市场价的成本获取大年夜量Token额度。一位始创公司开创人泄漏,他发明设计始创公司Figma开辟的一款AI对象存在马脚,经由过程每月20美元的账户,就能应用相当于价值7万美元的Claude Token。他应用这个马脚同时构建了六个软件项目,直到该功能在比来几天开端履行AI额度限制。
这种现象在AI公司内部也激发了反思。一位匿名OpenAI员工表示这似乎弗成持续。
然而,没有人愿意随便马虎停下脚步,因为谁也不肯成为那个在AI时代仍重要依附手工编码的人。正如科技通信作者格尔盖利·奥罗斯(Gergely Orosz)所言,在大年夜型科技公司内部,无论产出质量若何,不以加快的办法应用AI正成为一种职业风险。
这种文化在不雅察者眼中已经偏离了工程应有的轨道。有网友评论称,真正的工程寻求效力,用起码的资本换取最优的成果。而当前这种攀比办事器账单的行动,不过是将烧钱误算作临盆力,企业若为草率的实验无控制地买单,毕竟会为此付出价值。

03 Token消费:衡量的是尽力照样成果?
主动化平台制造商Zapier已经开端用一种新的仪表板追踪员工的Token应用情况。其首席AI转型官布兰登·萨穆特(Brandon Sammut)表示,假如发明某个员工的Token用量是错误的五倍,他们会认为好奇,这小我是效力极低,照样真正的超等明星?谜底取决于这些Token毕竟换回了什么。
Vercel公司供给了一个正面案例。一位高等工程师让一组AI智能体在一周内基于一篇研究论文,构建了一套核心基本举措措施的新办事。假如交由人类工程师完成,这项义务须要数周甚至数月。这份工作的账单是1万美元阁下。Vercel的CEO吉列尔莫·劳赫(Guillermo Rauch)认为这笔投入异常值得,他表示这有点像给人们一根喷射燃料的消防水带。他估计,花1万美元换回的一天工作量,可能为公司节俭了数百万美元。
Kumo AI公司则从另一个角度看到了Token投入的价值。结合开创人赫马·拉加万(Hema Raghavan)泄漏,她手下优良的工程师应用AI智能体,就像拥有了一支初级助手大年夜军。有些工程师在周末滑雪时,他们的智能体仍在持续履行义务。更重要的是,拉加万发明,智能体有时能赞助编写出更优的代码,反而降低了公司的整体云成本。
然而,并非所有高消费都能产生如斯积极的回报。一些员工可能只是为了在排行榜上露脸,或者出于用了就是对的的简单逻辑,进行了大年夜量低效、反复甚至无意义的计算。有网友评论指出,这比如只看发卖人员拨打了若干通德律风,却不关怀他最终完成了若干成交。假如企业不区分尽力与成果,鼓励机制就会导向外面劳碌而非本质供献。
更有工程师分享了更精明的应用策略,将天然说话提示词提炼为关键变量,而非将完全段落原封不动地传递给模型。经由过程这种方法,Token应用量可以降低约99%,而后果仍能保存近九成。这位评论者直言:“Tokenmaxxing是在烧钱来假装有临盆力,语义效力才是真正的解锁之道。”

《纽约时报》的凯文·鲁斯(Kevin Roose)在采访了多位重度用户后,提出了一个更为严格的质疑,排行榜不衡量产出质量,这激发了一个显而易见的问题:这些Token最大年夜化者中,有人产出了好器械吗?照样他们只是在原地打转,拼命产出无用的代码并浪费宝贵的处理才能,仅仅为了让本身看起来很忙?
问题回到了治理学的原点。自彼得·德鲁克(Peter Drucker)初次体系阐述常识工作者的临盆力以来,若何有效衡量产出就一向困扰着各类组织。人们老是偏向于衡量最轻易计算的指标,而非最有价值的指标。以前是代码行数、发送邮件数量、工作时长,如今轮到了Token消费量。

04成本账单:谁来为“数字出勤主义”买单?
但对于应用这些对象的企业而言,Token成本的飙升是一个不容忽视的实际。有网友指出,今朝市情上的AI订阅办事,如Claude每月200美元的套餐,其实际资本消费远超订价,背后是AI公司的高额补贴。一旦AI公司须要实现盈利而进步价格,或者企业转向按应用量付费的API模式,Token成本可能上涨数倍甚至更多。届时,那些在排行榜优势光无穷的Token大年夜户,很可能敏捷变成老板眼中的成本黑洞。

这种情况在云计算普及之初就曾上演。很多企业因上云成本掉控而付出沉重价值,如资本闲置、设备过度、缺乏治理,最终导致账单远超预期。
如今,Token成本正在成为新的云成本问题。Exceeds AI开创人马克·赫尔(Mark Hull)称,他比来应用Claude Code开辟了三种工作流对象,总计约30万行代码,Token成本约为2000美元。他决定让公司全部员工都应用这个平台,但48小时内成本就急剧飙升,迫使他不得不设置应用限制。
Vercel的CEO吉列尔莫·劳赫也承认,固然今朝Token消费最多的员工也是表示最好的,但他并不否定将来会出现滥用行动。他直言员工可能把这些Token用在了副业项目上,比如本身的始创公司、兼职赚外快或者任何工作上,肯定会有很多滥用的情况。
有评论引用古德哈特定律来分析这一现象,当一个指标本身成为目标时,它就不再是一个好指标。Token排行榜恰是如斯,它使令员工去攀比消费量,而非寻求真正的成果。
有评论将这种现象称为数字出勤主义(digital presenteeism)在AI时代的翻版。以前,有人把外套挂在椅子上假装在公司,有人在居家办公时用物理鼠标颤抖器(mouse jigglers)保持即时通信对象在线,如今则用Token消费量来证实本身的价值。只是此次,成本不再是免费的演技,而是真金白银。一旦企业开端严格核算投入产出比,这些表演就会变得非分特别刺目刺眼。

FinOps专家凯文·普罗科佩茨(Kevin Prokopetz)指出,不加治理的AI对象采取会导致大年夜量Token被烧掉落,却对实际投资回报率毫无可见性。另一位评论者内特·帕特尔(Nate Patel)说得更为直白:“假如Token消费不克不及与交付成果或节俭的时光挂钩,那就只是在烧钱。”
05回归本源:毕竟应当衡量什么

要懂得这场比赛的本质,起首须要弄清楚Token毕竟是什么。
员工比着用,老板乐得买单,看似双赢。但这里隐蔽着一个经典的治理学难题,Token消费量大年夜,就必定意味着产出高吗?
AI公司本身已经从这股海潮中获益。Anthropic在本年前两个月内将其收入猜测进步了一倍多,重要归功于智能体编码对象的迅猛增长。OpenAI的Codex对象,自岁首年代以来每周活泼用户增长了两倍,以Token衡量的总体应用量增长了五倍。谷歌客岁曾表示,其AI模型每月处理跨越1.3切切亿个Token。
芝加哥大年夜学布斯商学院的研究员布莱恩·贾巴里安(Brian Jabarian)称,公司必须开端衡量Token应用情况,但目标不是为了比较谁用得多,而是为了看清投入产出。
他认为每小我都认为只要应用AI Token临盆力就会进步,然后工作就停止了,但实际要复杂得多。假如一家公司经由过程AI雇用节俭了前期成本,但后期须要消费更多人力或Token去弥补缺点,那么整体就是吃亏的。当一家公司向50万名员工供给AI对象时,这些Token问题就变成了重要问题。
一些企业已经开端摸索更精细化的治理方法。Zapier的萨穆特表示,他们会经由过程分析得出结论,断定某种应用模式是值得在同事中推广的金牌模式,照样须要经由过程指导来摆脱的不和模式。Exceeds AI的赫尔则建议,公司应环绕Token应用制订治理规矩,例如对特定义务可以应用哪些模型设置限制,甚至可以借助AI本身来实现此类选择的主动化。
一位网友分享了他的评估标准,评价一个AI项目标价值,看的不是消费了若干Token,而是每个Token创造了若干持久的价值。假如哪个治理者保持以Token花费额为独一考察标准,他会毫不迟疑地选择分开。
今朝,Token的消费成本大年夜多由企业承担。但跟着应用量的激增,这笔账迟早要被卖力核算。

也许,我们须要的不是更多的Token,而是更聪慧的应用方法。很多公司将最先辈的顶级模型用于所有场景,而很多工作流程中,应用成本更低的模型就足够了。缺乏高低文缓存和糟糕的高低文治理,同样是企业浪费Token的重要原因。

还有人开端摸索让AI加倍节俭、加倍自立,比如用更小范围的模型来完成特定义务。IBM的Granite 4系列模型,其3B和350M参数版本运行成本仅为大年夜型模型的一小部分,甚至可以在树莓派等低功耗设备上运行。
另一位评论者则从技巧架构的角度提出了更根本的思虑。他认为,真正的冲破在于用构造效力代替参数膨胀。用消费数百亿Token的蛮力来解决肯定性逻辑问题,就像开着喷气发念头去酒吧,这是一种巨大年夜的、毫无事理的能源浪费。智能体AI的将来应当是节俭的、自立的、肯定性的,将刚性逻辑卸载给高效的求解器,而不是在软件沙箱中无控制地生成数百个子智能体。
这些不雅点指向了同一个偏向:Token本身不是目标,而是手段。衡量Token消费,最终是为了衡量它换回了什么。
结语
当这股靠燃烧算力来“假装尽力”的歪风刮遍硅谷,治理者们终将面对一个极其冰冷的贸易实际:在这场猖狂的内卷游戏里,还没有真正的超等豪杰。眼下独一的绝对赢家,只有那些躲在幕后的算力供给商。
弗成否定,今天这些猖狂消费额度的“Token成瘾者”,或许在将来真能借此摸索出对象的潜能,进化成传说中的百倍效力工程师。但这同样可能只是一场昂贵的职场行动艺术。一旦企业从新核阅“有效产出”的真正定义,这座用算力吹起的泡沫随时会轰然倾圯。
无论这场荒诞的戏剧最终走向何种终局,有一点是肯定的:将来的世界注定须要更宏大年夜的数据中间。而昔时夜浪淘沙之后,真正能在比赛中胜出的,毫不会是那些陷溺于排行榜数字的“刷榜机械”,而是那些懂得把每一个Token都转化为实际营业价值的组织和人。
不过,在畅想这场临盆力革命的最终成功之前,最好先祷告公司的财务负责人看到下个月的账单时,还能保持情感稳定。

发表评论 取消回复