谷歌首席执行官桑达尔·皮查伊近日宣布,公司人工智能模型处理能力实现显著跃升。通过直接调用应用程序接口(API)的客户使用模式,当前每分钟可处理超过160亿个词元(tokens),较上季度100亿的处理量增长60%。这一数据直观反映出谷歌在生成式人工智能领域的持续投入正转化为实际算力突破。
在最新举办的Google Cloud Next开发者大会上,谷歌正式推出第八代张量处理单元(TPU)系列芯片。其中TPU 8t与TPU 8i两款新型号专为智能体(Agent)开发设计,通过优化内存架构与计算单元布局,可高效应对动态变化的模型参数需求。技术文档显示,新芯片在处理多模态数据流时,能效比前代产品提升40%以上。
据内部预测,到2026年谷歌在机器学习领域的硬件投资将呈现结构性转变,超过半数资金将集中于云业务基础设施。这一战略调整与当前企业级人工智能应用需求激增密切相关,特别是需要实时处理海量数据的智能客服、自动化决策等场景,对底层算力提出更高要求。
谷歌云平台同步升级的配套服务显示,其正着力构建从芯片到算法的全栈解决方案。新发布的芯片组支持从千亿参数到万亿参数级模型的分布式训练,配合优化的冷却系统与供电架构,单集群可部署超过10万张加速卡。这种硬件层面的突破为开发更复杂的认知智能系统奠定了基础。















