人生箴言
成熟意味着停止展示自己并隐藏自己
随机文章
- 价格没优势 HDD还有存在必要吗?2023硬盘实测故障率:SSD比机械硬盘更可靠 !
- 中国游客亲历曼谷枪击:非常混乱,曾听到多声枪响,很多人在逃跑 !
- 女子就医发现五脏六腑全长反 !医生:是罕见的“镜面人” ,发生率仅为百万分之一 !
- 我国科考队首次登顶世界第六高峰:距珠穆朗玛峰约30公里 !
- 工资5000元国庆随份子近3000元遭吐槽:喜事都在假期扎堆!
- 黄山游客被大学生志愿者热情投喂 !网友:安徽人的热情已经瞒不住了!
- NASA局长称相信地球外存在生命:美国防部推出相应解密报告网站 !
- 山东烟台一新郎开迈巴赫扮猪八戒接新娘 ! 网友调侃道: 起猛了!到高老庄了吗?
- 华为发布会新品曝光 共7款产品 Mate60 RS或压轴亮相 !
- 肿瘤专家回应假期回老家义诊:为邻里乡亲们看片子也是举手之劳 !
8月10日消息,据国内媒体报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。
据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势。
AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。
当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。
然而,其产能紧张和美国出口限制倒逼国内厂商探索Chiplet封装、低参数模型优化等替代方案。


