人生箴言
成熟意味着停止展示自己并隐藏自己
随机文章
- 没车的也要为油价上涨买单!多地驾校培训费上调 C1车型最高涨500元 !
- 当红不让!小鹏P7推出全新车色星曜红:将于3月18日亮相 !
- 不起火不爆炸!比亚迪二代刀片电池通过10倍新国标撞击考验 !
- 摩托司机高速上听DJ蹦迪还疯狂变道!交警:记6分罚400元 !
- 4月发布!OPPO Pad Mini真机亮相:8.8英寸小平板、首发骁龙8 Gen5 !
- 父亲买短途车票上车送女儿感动全网:网友看完泪目 !
- 山姆被曝冷鲜猪肉是数月前屠宰 最新回应:日期异常是系统漏洞 !
- 高铁一等座4元二等座8元 12306回应:票价差异系市场化动态调整 !
- 酒驾被碰瓷遭勒索5万 专门在酒吧门口盯梢!结果碰瓷的进去 !
- 泡澡、桑拿都不怕!一加15T支持IP66/68/69/69K满级防水 小屏旗舰唯一 !
8月10日消息,据国内媒体报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。
据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势。
AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。
当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。
然而,其产能紧张和美国出口限制倒逼国内厂商探索Chiplet封装、低参数模型优化等替代方案。


