近期,科技行业关于“token工厂”与“token运营”的讨论热度持续攀升,这一新兴概念正逐渐成为市场关注的焦点。尽管相关消息已流传数日,但周末期间仍保持着较高的话题热度。
从概念层面来看,token工厂与token运营呈现出截然不同的商业模式。token工厂采用重资产模式,企业需自建或租用算力基础设施,如同实体工厂一般承担token的生产任务。而token运营则属于轻资产模式,企业可不持有或仅持有少量算力,主要作为聚合平台或分发方,为行业提供技术服务与运营支持。
在商业模式与分成机制方面,token工厂与服务商为模型公司提供算力和部署服务,并按照token调用量进行分成。目前,典型的分成比例为token工厂占70%,模型公司占30%。不过,这一比例并非固定不变,强势的闭源模型可能会将比例调整为60:40,而部分算力紧张的模型方,如智谱,甚至愿意让出80%的分成。
这种分成模式使得token工厂的收入与模型公司的收入紧密相关,且边际成本较低,盈利弹性较高。这也是吸引众多企业布局token工厂领域的重要原因之一。
为何大厂纷纷从算力租赁转向token工厂?合规风险是首要考量因素。在算力租赁业务中,英伟达高端卡受美国禁售限制,若将其放置在大厂机房,将带来较大的合规隐患。而token工厂将算力卡放置在第三方,有效降低了此类风险。
运营省心也是大厂转型的重要动力。大厂无需再投入大量资源自建运维体系,可将平台搭建、优化等工作外包,从而专注于核心业务的发展。
轻资产化趋势也是推动大厂转型的关键因素。将资本支出(Capex)转变为运营支出(Opex),有助于缓解大型科技公司持续攀升的资本开支压力。据悉,海外四大科技公司在2026年的资本开支已占经营性现金流的90%以上。
在盈利能力与关键竞争要素方面,token工厂展现出显著优势。其毛利率可达50%左右,这一数据得到了润建电话会及海外Fireworks、Together AI等公司的证实,远高于算力租赁的毛利率。
值得注意的是,token工厂的核心竞争并非在于算力规模,而在于“每瓦产出token”的效率。推理优化技术,如量化、算子重写、KV cache优化、云调度等,能够显著降低延迟、提升利用率、降低成本。
海外已有成功案例验证了这一观点。Nebius收购AGAI团队后,通过技术优化将延迟降低40 - 60%,利用率翻倍,成本降低40 - 50%。未来,企业要么绑定大厂走规模扩张路线,要么通过深度优化特定芯片获得成本优势。
在行业整体发展态势下,市场参与者呈现出不同的态度。部分较为谨慎的投资者开始担心宏观风险,而部分在这波行情中获利颇丰的投资者则认为仍应积极布局。与此同时,一些投资者开始关注并学习各种新技术和新方向,如SpaceX、机器人、mircoLED/玻璃基板、M10、柔性叠层光伏等领域。















