华为张迪煊:昇腾算力赋能,携手伙伴共赴AI“能办事”的Agent新时代

   发布时间:2026-03-23 03:02 作者:吴婷

在华为中国合作伙伴大会期间,以“与时代 共昇腾”为主题的昇腾人工智能伙伴峰会在深圳成功举办。华为昇腾计算业务总裁张迪煊在会上发表了题为《一起昇腾,共赢行业智能化》的演讲,深入探讨了AI技术演进趋势与行业智能化落地的实践路径。

张迪煊指出,2025年是昇腾技术沉淀与开源生态建设的关键一年。自去年8月宣布CANN和Mind系列软件全面开源以来,昇腾已向第三方社区贡献超过11万行代码,并与50多个主流开源项目实现兼容。通过技术解耦与架构创新,昇腾联合科大讯飞开发的大EP技术成功填补多机推理加速领域的空白,相关特性已纳入vLLM社区,显著提升了开发者创新效率。在模型适配方面,智谱基于昇腾架构三个月内完成多模态大模型GLM-Image训练,该模型采用自回归与扩散混合架构,开源后迅速登顶Hugging Face趋势榜首位。

面对行业智能化需求,昇腾构建了覆盖大、中、小算力场景的系列化解决方案。针对大模型预训练与强化学习场景,昇腾384超节点通过48TB统一内存编址技术,实现内存共享效率提升96倍,数据交互效率提高三倍,特别适用于AI Agent等需要低时延、高吞吐的场景。中算力场景聚焦医疗辅助、智慧教学等领域,通过中心模组与刀片服务器组合,伙伴已开发400余款一体机产品,服务2700余家客户,占据国内市场80%份额。小算力场景则面向工业质检、具身智能等边缘计算需求,通过标准模组与板卡开放,助力伙伴打造多样化终端设备。

在推理服务优化方面,昇腾推出超节点+大EP组合方案,提供三种技术路径:支持MindIE成熟方案快速部署、通过插件集成vLLM/SGLang开源引擎、基于CANN深度定制开发。硅基流动等伙伴已据此构建金融领域推理引擎,使手机银行等场景的多轮响应速度提升三倍。针对强化学习后训练场景,昇腾首创异步流式数据引擎TQ技术,通过控制流与数据流解耦,将端到端性能提升40%,相关特性已应用于商业化广告与信贷风控领域。

硬件升级方面,昇腾推出分级产品矩阵:A2标卡支持百亿级模型实现100ms推理时延,单机服务器算力达业界2.3倍,双机超节点可部署万亿级模型并突破20ms低时延。面向推荐、多模态等场景的Atlas 350加速卡,通过mxFP4低精格式与112GB片上内存,使多模态生成性能提升60%,访存效率提高四倍。在行业应用层面,昇腾联合20余家ISV开发金融、能源等领域解决方案,半年内落地十余个场景方案,服务180余家客户。例如在智慧文旅领域,与海天瑞声、陕文投合作的多模态AI伴游助手“小七”,已在陕西景区为400万游客提供个性化服务。

生态建设层面,昇腾CANN实现三大升级:将原有8个组件拆分为29个可独立升级模块,部署效率提升80%;开源PyPTO编程范式,使SoftMax算子代码量减少70%;今年6月将开放2000卡算力资源供开发者使用。为激励生态创新,昇腾设立2000万元首批创新基金,并升级NRE计划投入5000万元支持伙伴开发,优秀成果将通过AI应用市场与伙伴共享收益。目前已有20余家伙伴启动Agent一体机研发,产品将覆盖教育、医疗等核心领域。

 
 
更多>同类内容
全站最新
热门内容
本栏最新