华为张迪煊：昇腾算力赋能，携手伙伴共赴AI“能办事”的Agent新时代

发布时间：2026-03-23 03:02 来源：快讯作者：吴婷

在华为中国合作伙伴大会期间，以“与时代共昇腾”为主题的昇腾人工智能伙伴峰会在深圳成功举办。华为昇腾计算业务总裁张迪煊在会上发表了题为《一起昇腾，共赢行业智能化》的演讲，深入探讨了AI技术演进趋势与行业智能化落地的实践路径。

张迪煊指出，2025年是昇腾技术沉淀与开源生态建设的关键一年。自去年8月宣布CANN和Mind系列软件全面开源以来，昇腾已向第三方社区贡献超过11万行代码，并与50多个主流开源项目实现兼容。通过技术解耦与架构创新，昇腾联合科大讯飞开发的大EP技术成功填补多机推理加速领域的空白，相关特性已纳入vLLM社区，显著提升了开发者创新效率。在模型适配方面，智谱基于昇腾架构三个月内完成多模态大模型GLM-Image训练，该模型采用自回归与扩散混合架构，开源后迅速登顶Hugging Face趋势榜首位。

面对行业智能化需求，昇腾构建了覆盖大、中、小算力场景的系列化解决方案。针对大模型预训练与强化学习场景，昇腾384超节点通过48TB统一内存编址技术，实现内存共享效率提升96倍，数据交互效率提高三倍，特别适用于AI Agent等需要低时延、高吞吐的场景。中算力场景聚焦医疗辅助、智慧教学等领域，通过中心模组与刀片服务器组合，伙伴已开发400余款一体机产品，服务2700余家客户，占据国内市场80%份额。小算力场景则面向工业质检、具身智能等边缘计算需求，通过标准模组与板卡开放，助力伙伴打造多样化终端设备。

在推理服务优化方面，昇腾推出超节点+大EP组合方案，提供三种技术路径：支持MindIE成熟方案快速部署、通过插件集成vLLM/SGLang开源引擎、基于CANN深度定制开发。硅基流动等伙伴已据此构建金融领域推理引擎，使手机银行等场景的多轮响应速度提升三倍。针对强化学习后训练场景，昇腾首创异步流式数据引擎TQ技术，通过控制流与数据流解耦，将端到端性能提升40%，相关特性已应用于商业化广告与信贷风控领域。

硬件升级方面，昇腾推出分级产品矩阵：A2标卡支持百亿级模型实现100ms推理时延，单机服务器算力达业界2.3倍，双机超节点可部署万亿级模型并突破20ms低时延。面向推荐、多模态等场景的Atlas 350加速卡，通过mxFP4低精格式与112GB片上内存，使多模态生成性能提升60%，访存效率提高四倍。在行业应用层面，昇腾联合20余家ISV开发金融、能源等领域解决方案，半年内落地十余个场景方案，服务180余家客户。例如在智慧文旅领域，与海天瑞声、陕文投合作的多模态AI伴游助手“小七”，已在陕西景区为400万游客提供个性化服务。

生态建设层面，昇腾CANN实现三大升级：将原有8个组件拆分为29个可独立升级模块，部署效率提升80%；开源PyPTO编程范式，使SoftMax算子代码量减少70%；今年6月将开放2000卡算力资源供开发者使用。为激励生态创新，昇腾设立2000万元首批创新基金，并升级NRE计划投入5000万元支持伙伴开发，优秀成果将通过AI应用市场与伙伴共享收益。目前已有20余家伙伴启动Agent一体机研发，产品将覆盖教育、医疗等核心领域。

更多>同类内容