
新智元报谈
裁剪:元宇
【新智元导读】Meta里面搞了个AI用量排名榜「Claudeonomics」,8.5万职工拼耗尽、冲段位、抢「Token听说」称呼。有东谈主一个月烧掉200万好意思元,有东谈主写外挂冲榜,有东谈主挂着Agent就寝也在跑——硅谷卷Token,仍是卷到走火入魔了。
一个东谈主,30天,烧掉3285亿token!
按Anthropic公开订价粗算,这些烧掉的算力老本接近200万好意思元。
4月初,The Information记者Jyoti Mann在X上初度曝光Meta里面「Claudeonomics」排名榜,30天全公司token总耗尽超60万亿。
张开剩余93%这些猖獗的数字,来自Meta里面一个名叫「Claudeonomics」排名榜的比赛,8.5万东谈主参与的烧token大赛,只展示前250名。
从铜牌、银牌、金牌、铂金、翡翠,一起升到「不灭会话」(Session Immortal),再到最高荣誉「Token听说」(Token Legend)。
没错,烧token齐烧出段位来了。
这笔账到底有多大?The Information特意作念了一个打算器来拆解:
The Information报谈中附带的交互式token老本估算器,按Claude Opus 4.6占86%的模子配比、70%缓存掷中率估算,1万亿token表面老本约550万好意思元。
天然,这仅仅按公开价的估算,但数据量级自己仍是富饶炸裂。
要是放到悉数这个词Meta来看,这个数字更恐怖:最近一个月token总耗尽约60.2万亿。
这是什么宗旨?
The Information作念了一个估算:好意思国国会藏书楼全部藏书折算约2.66万亿token,Meta的Llama 3查考数据是15万亿token,东谈主类历史上悉数出书竹帛加起来估算约20万亿token。
Meta职工30天烧掉的token量,是东谈主类全部出书物的3倍!
这还仅仅初始。一周之后,这个数把柄报谈跳到了73.7万亿。
音讯传开后,业内有名技能博主Gergely Orosz在X上简明扼要隘评述:
Token用量仍是是Meta绩效评估的一部分。智慧东谈主在刷他们以为率领思看的地方,就这样粗浅。
这仍是不是某个工程师在用AI写代码的故事了,而演变成一场超大规模AI耗尽竞赛游戏:
粉饰数万东谈主,有排名、有称呼、有荣誉体系。
曝光后两天
排名榜就消散了
The Information的报谈发出后,Meta里面炸开了锅。
有职工在里面筹商区写谈:
我惨酷民众算算这背后的动力耗尽。要不是简直在发生,我会以为是个见笑。
到了周三,排名榜从Meta内网消散了。
Meta发言东谈主对外的说法是:排名榜是由创建者自行撤下的,不是公司下令。
公司强调,职工评估看的是「推行请托影响」,不主张把个东谈主token数据作为评估绩效的主要神志。
但Meta发出的信号是矛盾的。
据The Information报谈,Meta里面一个名为Checkpoint的AI驱动绩效跟踪系统,如实将token使用量列为数据点之一。
排名榜天然撤了,但公司官方的AI Insights神情盘仍然对悉数职工通达,你随时不错查抄我方和团队的token耗尽。
Meta发言东谈主线路,AI Insights神情盘的办法是匡助公司了解各组织若何向AI原生的使命神志转型,它提供的细察不仅仅token用量,还包括代码联系地方和其他维度。
天然,Meta停掉了排名榜,嘴上说不以token论英杰,但排名榜的逻辑仍然存在,这让不少职工感受到公司开释出的信号并不完全一致。
「代码行数」
披上token新衣
这个排名榜天然只存在了几天,但它仍是催生出了一套「刷分」操作。
据The Information征引匿名职工描述,一些Meta工程师思出了多样办法来膨大我方的AI使用地方。
比如,一些工程师会让AI Agent 生成大齐狭窄蜕变,这些蜕变对功能匡助有限,但每次仍会酿成一次commit,从而举高其AI使用地方。
量上去了,排名天然面子。
还有东谈主树立了转录机器东谈主,挂在会议里自动作念记载。
有的东谈主以至特意饱读舞共事来用我方树立的转录器用,因为只消别东谈主通过你的器用跑token,耗尽量就算在你头上。
访佛的事不单发生在Meta。
亚马逊电商部门昨年也出现过一个案例。
一位司理线路团队应该更多使用AI编程器用Cline。于是团队里有东谈主平直改了代码,让每次和Cline的对话看起来耗尽了10倍的token。
这个团队的AI使用排名飞快冲到了分部前线。
不外到本年年头,亚马逊调遣了系统,这个「舞弊码」失效了。
这些故事看起来有些荒诞,但老到软件行业历史的东谈主一定不生分。
Box CEO Aaron Levie直言:这让他思起了AI出现之前,行业里围绕「用代码行数估计身手员产出」的那些老争论。
代码行数曾经经被行为坐褥力地方。
后果工程师们学会了把一排能写完的逻辑拆成十行:地方涨了,产出没变,以至更差了。
目下,篮球投注相通的故事仅仅换了个计量单元:代码行数变成了token数。刷行数变成了刷commit、挂转录机器东谈主、改系统让数字翻10倍。
地方可量化,又和绩效沾边,就一定可能会「玩坏」。
据The Information报谈,有Meta职工擅自承认,那些token用量低的东谈主,惟恐分会错愕我方看起来「不够AI native」。
同期这位职工也以为,高token用量不应该成为一种身份符号,因为它并不是坐褥力的好地方。
不卷token的公司
何如玩?
既然刷token排名的逻辑缺陷这样彰着,有莫得企业遴荐另外一条路?
法则装备的公司Axon遴荐了把AI激发绑定在业务请托上,而不是耗尽量上。
他们的作念法是团队要是哄骗AI器用逾额完成年度道路图地方15%以上,就能拿到现款奖金。
Axon总裁Josh Isner清晰,本年公司各团队集体的道路图逾额幅度正在跟踪到30%操纵,主要归功于Claude Code和Cursor的使用。
展望本年在AI编程器用上的支拨将达到「数千万好意思元」级别。
Isner以为,当你引入「尽量多用这个器用咱们就付钱」这种探员的时分,风险越来越大:
你何如知谈你获得的是你思要的后果,好像说,到底有莫得任何后果?
Aaron Levie并不饱读舞tokenmaxxing,也不以为它会在硅谷除外的大公司里庸碌流行。
不外他也线路,我方纠合这种冲动,因为面前阶段需要先让工程师充分试用这些器用。
他选了另一种神志:既然AI能让团队更高效,那就把家具地方定得更高。职工能不成完成这些加码后的地方,平直影响薪酬。
但Levie也莫得一刀切地抵赖token耗尽。他以为应该容忍一定进度的token「浪掷」,因为那意味着团队在尝试新东西:
硅谷目下正处于这样一个阶段,你得让工程师去试这些器用。
Levie景象为试错买单,但不肯意把「谁烧得最多」变成一种排名机制。
Axon和Box代表了一种不雅点:token仅仅弹药,你用了几许不迫切,你使用它作念出了什么才迫切。
当油表被当成速率表
Meta的排名榜被撤了,但背后催生它的那股力量依然宏大:
硅谷高管们集体把「多烧token」等同于「高坐褥力」的叙事小数也莫得减轻。
英伟达CEO黄仁勋
英伟达CEO黄仁勋就曾在All-In Podcast上说过一句被庸碌援用的话:
要是一个年薪50万好意思元的工程师,连至少25万好意思元的token齐没用掉,他会「高度警惕」。
他以至设思了一个改日:Token会成为招聘时的标配福利,就像牙科保障和免费午餐一样。工程师口试时会问:「这份使命给我配几许token?」
Meta CTO Andrew Bosworth在本年2月的一次科技会议上提到,要是一个顶级工程师花掉十分于我方年薪的token老本,却能把坐褥力擢升到10倍,这笔钱就好比「白送的钱」,应该赓续投,以至不必设上限。
前OpenAI和特斯拉AI科学家Andrej Karpathy则是再造新词:token耗尽量俨然成了AI期间个东谈主才气的新标尺:
你的token空洞量是几许?你能指引几许token空洞量(Token throughput)?
当行业大佬齐在说「多烧token即是高坐褥力」,民众听到的信号只消一个:不烧即是过时,这种FOMO(Fear of Missing Out,错失怯生生)会飞快从「我要不要多用小数AI」变成「我敢不敢毋庸」。
莫得东谈主思成为团队里阿谁token用量垫底的东谈主,而排名榜仅仅把这种错愕变成了一场公开竞赛。
但问题碰巧在这里。
Token耗尽量之是以被追捧,是因为它是目下最容易量化的AI使用地方。
你很难估计一个工程师「用AI之后请托质料擢升了几许」,但你不错精准地看到他烧了几许token,就它和「代码行数」一样。
但容易量化,不等于值得量化。
代码行数对应的是写代码的动作,并不代表软件质料;Token耗尽量估计的是API调用次数,不等于工程产出。
这就好比油表能告诉你烧了几许油,但它不代表速率和里程。
而AI Agent期间,只会让这个问题更机敏。
NYT近期的报谈描述了一种新表象:
工程师同期开十几个窗口,放出几十个Agent并行跑任务,有些Agent系统被假想成24/7不间隔运行,在东谈主类就寝的时分还在捏续耗尽token。
一个全职Agent一周不错跑掉7亿个token。
当token耗尽不错脱离东谈主类扰乱自动增长的时分,拿耗尽量来估计东谈主的坐褥力,就愈加诞妄了。
天然,Meta的Claudeonomics排名榜仍是下线,但它折射出一个东谈主类在技能接受上的「经典悖论」:
当一个器用的使用量不错被精准计量、不错被公开排名、不错和绩效感知挂钩,它就势必从器用变成扮演。
代码行数是这样,commit次数是这样,专利肯求数、论文援用量、OKR完成率,完全是这样。
每一个曾被行为坐褥力代理地方的数字,最终齐催生出了一套刷分产业。
目下轮到了token。
下一个被异化的地方会是什么?
也许是Agent的并发数目,也许是AI生成代码的统一率,也许是某种咱们今天还思象不到的新数字。
只消企业还分不清「饱读舞用AI」和「探员AI带来的简直产出」,访佛的刷榜游戏就不会停。
参考尊府:
https://www.theinformation.com/articles/tokenmaxxing-tide-may-turning?rc=epv9gi
发布于:北京市九游体育(NineGameSports)官网

备案号: