随着Token在AI的全面应用下渗透社会方方面面,Token到底是什么,围绕Token的经济模式如何发展?已是“AI+”时代下不得不关注的重点议题。
何为Token及Token经济
数据显示,2024年初我国日均Token调用量约为1000亿,到今年3月突破140万亿,两年增长超千倍。3月23日,国家数据局正式将“Token”定名为“词元”。5月22日,国家数据局召开词元经济座谈会,将把推动词元经济发展纳入工作体系,着力推进行业高质量数据集建设、全国一体化算力网建设。
Token的核心定义是大模型处理文本、代码、图像、音频、视频等信息时采用的最小运算单元。简单来说,模型组件Tokenizer(分词器)将原始输入文本转化为一个个Token,并映射为唯一数字ID方便模型计算。计算后,Token反向转为人类可读语言输出。在2次转化中,语言结构、词汇频率、分词算法的差异,使得1个Token对应的字符量不等,比如部分模型是1个Token相当4个英文字符、1至2个汉字,1个标点,总体来说,Token与中英文“字”“词”间没有固定的对应关系,但专业术语、长难句的Token密度往往更高(数量更多)。
此外,对于输入Token,大模型通过并行注意力计算,一次性计算每个词和其他词之间的关系,对于输出Token则采用串行计算,每输出一个字符,都需要回头读前述生成的所有字符,计算量极大。因此,结合计算量、显存开销等,Token输出价格往往比输入价格高数倍。
Token是模型交互过程中的上下文计量单位。上下文窗口(Context Window)是在单轮对话中,大模型一次能够读取、记忆、处理的最大Token总量,也就是模型能“记住”的全部对话内容。比如模型标注“128K 上下文窗口”,代表单次最多可处理128000个Token(包含历史对话、当前提问、模型回复)。
Token是模型调用及AI服务的结算单位。大模型的运行成本(算力、电力、芯片、推理耗时)和处理的信息量强相关,而Token是大模型处理信息的最小单元,能够最直观体现实际资源消耗,因此成为模型服务调用重要的结算单位。
随着Token可计量、可定价、可交易的属性被挖掘,围绕Token生产、调度、消费、治理的新型经济体系逐步形成,即为“Token(词元)经济”,Token从计量单位、结算单位跃升为生产要素与价值载体。
Token经济的主要模式
Token产业链上游包括电力能源、芯片、算力基础设施,中游涵盖模型企业、云厂商、运营商,以及个人或企业经营的AI中转站等,下游包括各个行业领域的AI应用类企业、个人开发者、普通消费者等。其中,电力能源的消耗贯穿Token经济全链路(关于能源的研究,在“算力“上天”:太空AI数据中心的建设之路”有所提及)。
从Token生产到结算环节,除了模型企业的API直售,还有多种盈利模式,比如:
①转售差价:批量采购模型企业或云厂商提供的Token服务,再通过API调用、会员/套餐订阅等形式零售,赚取价差。
②平台服务费:依托统一接口、负载均衡、运维保障等能力,按调用量或固定额度收取服务费用。
③结算计量:提供自动计费、结算、分账、跨境支付等服务,收取服务费用。
④私有化部署和行业解决方案:提供本地化、专属化部署服务,收取实施费及年度运维费;结合场景需求提供定制化服务,形成增值收入。
⑤推理缓存套利:把重复或相似请求的计算结果存储下来,下次复用,从而大幅降低Token成本,获得技术效率红利。
从产业各层来看:
算力层:Token的生产燃料
算力依赖资源有限性实现加价。核心硬件产能有限、供应链集中度高,导致行业整体处于供小于求的状态,算力厂商具备议价权,而硬件稀缺成本逐层向下游传导,体现在Token单位售价上,形成刚性加价。然而,数据显示,2022-2026年间Token单价下降了99.9%。AI算力价格上调,Token价格却反向下降,核心在于“规模降本”。
一是通过算力集群化发展形成规模效应,持续摊薄硬件、能耗、运维等固定成本。二是主动布局Token服务,通过“建用并重、高效运营”提升算力利用率,依托规模化算力优势压降单Token生产成本,以卖Token服务“跑赢”硬件成本上涨。比如2024至2025年,OpenAI整体推理相关支出规模扩张约2.4倍,但GPT-3.5单位推理成本降幅达280倍,以此刺激用户更高频的交互,获得规模效益。
模型层:Token的核心商业环节
模型层是Token的直接经营层,涉及Token的生产到全链路运营,相比钢铁、原油等传统生产要素的价值核心由其物理属性决定,Token价值受到模型推理能力强弱、指令差异、知识库专业程度等影响,使得定价存在明显差距(无统一标准,以厂商定价为准)。目前单一模型企业依托输出内容的智能深度、场景适配能力构建产品溢价;多模型聚合类平台则以接入模型的丰富度、服务稳定性等作为核心竞争力,通过低价采购、加价分销等手段构建起完整的商业闭环。
Token聚合平台普遍可接入几十到几百个模型不等,通过统一接口、智能路由、用量管控、套餐化计费等能力,支持一个平台上对比各模型的质量、价格与响应速度,提供规模化供给;云服务多模型整合服务以MaaS平台为代表,由云厂商等依托自有云底座,接入自研模型和第三方模型,提供一站式大模型模型托管、微调、开发与服务平台,核心是深度绑定云资源生态;AI中转站主要是API经销,基本无自有算力和模型,通过代理方式获益。
运营商正式入局,从卖“流量”开始卖“Token”。借助网络与算力协同、海量用户和信任优势,通过生态组织、普惠式定价等方式快速切入本地Token消费场景。如中国移动计划打造多元异构算力生态,扩大高质量算力供给;建设统一计费、统一结算、统一鉴权等的运营平台等,切入Token生产交易。
应用层:Token的场景转化价值体现
应用层的经济来源于结合私有数据、行业Know-how、合规价值,挖掘单位Token的价值。平台企业、OPC或个人开发者主要获取Token投入与业务产出之间的差价,当Token被转化为影视内容、游戏开发、营销内容、电商应用等可消费内容,即可实现从“技术计量单位”到“生产力”的质变。
各省市发展Token经济的做法
贵阳贵安发布“词元经济发展三年行动方案及若干措施”。算力方面:主要提出推动智算中心扩容与模式转型,构建“词元工厂”集群;完善算力调度平台与词元分发网络,支撑词元高效流通。数据要素方面:做优园区词元服务,完善流通交易体系,推动Token进场交易与动态定价;场景应用落地方面:在政务、民生、商用领域打造标杆应用,推动Token规模化消耗。此外,提出创新Token金融产品、算力出海与Token跨境服务。
具体举措方面,发放“Token券”,降低Token使用成本;依托数智产业园打造Token经济“园中园”;支持建设Token交易服务平台;构建以Token为基础、可量化、可定价的数据集价值体系,引导制定Token交易的计价规则、质量标准、交付规范等团标或地标。
武汉市硚口区发布“促进Token经济和人工智能OPC发展三年行动方案及若干措施”,围绕Token普惠共营,提出依托星火众达Token工厂,对OPC企业算力服务费用按50%补贴,每年免费提供50P以上算力。联合CSDN共建数据资源服务平台,推行数据券机制。
武汉市江岸区发布《江岸区Token经济发展行动方案(2026—2028)》《江岸区大力支持Token经济发展的措施》,核心聚焦一个硬核算力底座、一套Token服务平台、一批标杆应用场景、一片特色产业园区、一支产业发展基金、一众智能体产品,计划每年统筹5000万元专项资金,推出包括Token券在内的“券+资金”组合支持。并且推介首批Token产业园。
综合来看,Token继算力、模型、语料后,成为各地发展AI产业的核心抓手之一。由于Token经济的产业链各层与AI产业深度交融,针对Token、AI产业的政策均从算力、语料、模型供给等角度给予资源和资金组合支持,在载体方面,倾向依托AI、OPC产业园载体布局Token产业园、园中园。从差异化特征来看,聚焦Token生产交易环节,衍生出新的经济增量,包括面向B/C端的交易机制、跨境流通等。
Token经济的发展,意味着从拼算力、拼模型的阶段,进一步转向“算力成本控制、生态运营能力、场景变现效率”的综合较量。
文章作者:赛博研究院智库总监 周雪静
致力于成为面向数字经济时代的战略科技智库、服务数据要素市场的专业咨询机构和汇聚数智安全技术的协同创新平台。
© 2026. All Rights Reserved. 沪ICP备19027819号
沪公网安备31011002006159号