手机浏览器扫描二维码访问
在当下人工智能飞速发展的时代,芯片就如同AI的“心脏”,为各种智能应用提供着不可或缺的算力支持。华为的昇腾芯片,作为国产AI芯片的杰出代表,备受瞩目。今天,咱们就用最通俗易懂的大白话,来深入了解一下昇腾芯片到底是怎么一回事。
一、昇腾芯片诞生的背景
这几年,人工智能火得一塌糊涂,到处都在搞AI大模型,像ChatGPT这类的应用更是让大家看到了AI的巨大潜力。AI大模型的训练和各种AI应用的落地,都需要巨量的计算能力,这就离不开AI芯片。
以前,在AI芯片领域,英伟达的GPU那是占据着主导地位。但是呢,由于众所周知的原因,英伟达的GPU对我们进行了禁售,连阉割版的H20都不卖给我们了。这就好比做饭突然没了锅,AI发展面临着算力短缺的困境。就在这个时候,华为的昇腾芯片挺身而出,成为了国产AI芯片的希望之光,发挥了重要的替代作用,也迎来了巨大的市场机遇。
二、昇腾芯片的家族成员
昇腾芯片是一个庞大的系列,主要包括昇腾310和昇腾910两个子系列 ,它们有着各自不同的特点和用途。
(一)昇腾310:小巧灵活的边缘“助手”
昇腾310是SoC小芯片,就跟我们手机芯片差不多大,只有指甲盖那么点儿大 ,功耗也特别低,仅有8W,特别省电。它麻雀虽小,五脏俱全,集成了多个运算单元,包括8个ARM A55 Core的CPU、AI Core、数字视觉预处理子系统等。
它主要面向边缘计算与低功耗终端,就像是一个灵活的小助手,在边缘端帮助完成AI推理任务。比如说,在智能安防摄像头里,昇腾310就能实时对采集到的视频图像进行分析,看看有没有异常行为,而且因为它功耗低,摄像头也不用担心太费电。它的AI Core采用了华为自研的达芬奇架构,就像一个高效的计算小能手,能够复杂执行矩阵、向量、标量计算的算子任务,而CPU则负责非矩阵类复杂计算。根据海思官网的披露,昇腾310的FP16算力为8TOPS,INT8算力为16TOPS,采用12nm工艺制造。
(二)昇腾910:云端的强大“算力担当”
昇腾910可就大多了,和我们的掌心差不多大 ,功耗在300W以上 ,是个“大力士”,主要面向云端高性能计算。它的算力特别强,既能用于AI推理任务,也能用于AI训练任务,是云端的“算力担当”。
华为早期发布的昇腾910,其实应该算是910A 。当时华为还没被完全禁售,所以910A采用了台积电的7nm增强版EUV工艺 。芯片内建了32颗达芬奇Max核心(达芬奇核心分为Max/Lite/Tiny三种,Max最完整),支持混合精度计算(FP16/FP32/INT8),FP16算力为256TFOPs,最大功耗350W(一开始说是350W,后来变成了310W )。
2020年华为被列入实体清单后,台积电那边的先进工艺用不了了。于是,华为就与中芯国际(SMIC)合作,采用他们的N+1工艺(等效7nm),推出了910B 。910B优化了架构设计,提升了能效比,芯片尺寸为21.32mm×31.22mm,FP16算力约320TFLOPS,INT8算力约640TOPS 。显存为64GB HBM2e,显存带宽400GB/s 。910B也分为B1/B2/B3 。910B3引入了HBM3e内存,带宽提升至1.2TB/s,支持万亿参数模型训练。
最近这两年,华为又推出了昇腾910C 。昇腾910C采用中芯国际的7nm(N+2)工艺,晶体管数量达到530亿 。910C采用了类似B200的双die封装设计,就是把两颗独立的芯片die分别放置在各自的中介层,再通过有机基板将两个中介层连接起来 。通过把两颗昇腾910B整合到一起,实现了性能的提升。这种封装方式虽然在芯片间互联带宽上可能低于英伟达的先进封装方案,但好处是成本更低、良率更高,量产速度也更快。
业界估测,910C在FP16精度下的单卡算力能达到800TFLOPS左右,大概是英伟达H100芯片(2022年推出)的80% 。不过,910C的芯片逻辑面积大约比H100多60% 。这也意味着910C在架构效率和设计优化方面,和H100还是存在一定差距的。910C的HBM高带宽内存仍然来自海外厂商(国内DRAM制造商长鑫存储HBM2e相关技术还需要再等等),但芯片的整体国产化比例据说已经达到90%以上 。
关于910C的消息比较神秘,根据网络上不太确定的信息,910C于2024年四季度推出样片,2025年一季度开始量产,目前已经处于大规模出货阶段,全年销量大概在70 - 80万颗 。也有消息说,2024年910B的出货量约四十万张,今年910B出货量可能与去年持平或略低(约30万张),而910C的出货量预计可能超过40万张 。因此,华为今年910B + 910C的整体出货量可能是70 - 100万张 。出货量和产能也有很大关系,中芯国际N+2工艺良率去年只有20%,今年据说已经达到40 - 50% ,分配给910C的产能貌似是2.6万片晶圆/月(数据不太确定,仅供参考)。价格方面,910B的均价据说大约是11万/片,910C可能是18 - 20万/片 。网上很多文章说910C价格是1800美元,感觉不太靠谱。相比之下,英伟达H100的市场价格,大约是2.5 - 3万美元/张 。
本小章还未完,请点击下一页继续阅读后面精彩内容!
对了,华为前段时间推出的CloudMatrix 384超节点,由384颗昇腾910C芯片构建,系统性能比英伟达的GB200 NVL72更强 。这就像是“群殴”模式,虽然单芯片的性能比不过人家,但通过系统层面的创新,组成更大规模的集群,也能在一定程度上弥补差距,满足算力需求。
在连接方面,华为自研的HCCS高速互连接口也很厉害。昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,可以灵活高效地实现横向扩展和纵向扩展 。HCCS对标的是英伟达的NVLINK,能够给内核、设备、集群提供系统内存的一致访问 。在单一链路的单向/双向互联带宽上,HCCS有显着优势,可以有效提升多个Al芯片协同训练的能力。
诡者,妖魔鬼怪也;异者,神秘诡谲也。这里有食人影子的食影,有以梦杀人的梦魇,有以吓唬小孩为乐的猫儿爷,有乘之可穿梭阴阳的阴马车,有只杀人不救人的杀生佛,有只可死人听不可活人看的诡京剧,有行走于街头巷尾卖人肉馄饨的混沌婆婆,有以寿命为买卖的三生当铺……一本神秘的《诡录》,将苏逸带进了这个光怪陆离、神秘莫测的世界。...
附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!夏未央(连城VIP手打完结)作者:日月青冥内容简介我知道,你我之间这一切不过是一场交易;可我以为,如果有一天你要做出选择,至少,你一定会选择我。直到你笑着挽起她的手头也不回,我才终于明白,原来从头到尾,不过是我自欺欺人的一厢情愿。可这份对你的爱依旧梗在胸口隐隐作痛...
隆安帝二十七年,少年将军周鹤鸣大挫朔北十二部,得胜回朝,被迫成亲。 对方恰好是他心上人……的亲哥哥。 * 周鹤鸣幼时曾到宁州,机缘巧合,惊鸿一遇,单恋抚南侯郁涟许多年,自然知道对方有个怎样糟糕的兄长。 郁濯此人,在宁州坏名远扬,人人嫌恶。 二人大婚当日,郁濯春风得意,周鹤鸣万念俱灰,唯恐避之不及,郁濯却偏要来招惹他。 周鹤鸣如临大敌,誓要为心上人守身如玉,好歹将对方制服,却听见郁濯饶有兴趣地问: “我究竟哪里不如舍弟?” “你说出来,我定分毫不改。” * 恰逢战事又起,周鹤鸣马不停蹄赶回青州,却先等来了自己的白月光郁涟。 郁涟为公事而来,周鹤鸣知此生无缘,但求尽心护其左右。 护着护着,他发现了不对劲。 自己的白月光,怎么私下里行事作风同他的可恶兄长一模一样? 周鹤鸣如遭雷劈,艰难说服自己接受了白月光性情大变的可能性,对方却出其不意地掉了马。 “怎么了小将军?猜到我即是他、他即是我之后,你就不爱笑了。” 【鬼话连篇·钓系混邪美人受x前期纯情忠犬·后期狼狗攻】 周攻郁受,不拆不逆 可怜的周鹤鸣,被郁濯玩弄于股掌之中。 小剧场: 后来青州城外,绯色蔓延,白鼎山四野自阖为笼,并不许他人窥见半分。周鹤鸣一手环人,一手勒马绳,穿行于猎猎夜风。 郁濯仰头看他,开口时吐息潮热:“怎么好话赖话软话硬话都听不得?云野,是只想听我的真心话么?” 笑意层层染上了他的眼,眼下明晃晃露着颗小痣,像是天真未凿、漫不经心。 ——却分明是蓄谋已久的引诱。 周鹤鸣勒住缰绳,郁濯在突然的变速里微微后仰,露点半节修长脖颈,被一口咬住了喉结,周鹤鸣的声音嘶哑着响在耳边。 “你分明知道,我都会信的。” 【食用指南】 1.架空不考究,私设同性可婚 2.1v1,HE,正文主受,有群像,先婚后爱,24K纯甜文(信我 3.年下,攻为成长型人设 4.文名取自贺铸的词,封面是郁濯 5.不控攻/受,一切为故事本身服务...
——无系统,猥琐流——詹姆斯抱怨道:“我从来没有在超级球队待过。”而陈极会说:“对的,我很幸运,我去的每一支球队都是超级球队,不夺冠就失败的那种。”顺便问詹姆斯哈登一句:“登哥要总冠军戒指吗?”......
(本文有CP,男女主都不是完美人设,成长型,一定程度上自私,男主是莽夫!且配角不会莫名其妙降智,非无脑爽文。)‘道虽险阻,吾心甚坚’江上弦一朝穿越,勤勤恳恳在长安摆摊卖卤羊肉半年攒钱,准备给大唐餐饮业来一波震撼。凭空出现的神秘来信打乱了所有计划。“什么?这玩意儿还有任务?”“直爹贼!老娘就知道!你大爷的穿越还带业绩......
他是权势滔天的帝国总裁,强势霸道,狂妄不可一世。性情高冷禁欲的他,一时兴起将她禁锢在身边,渐渐地护她成了习惯,宠她成了执念,深入骨血的痴恋让她逃无可逃。他说:“我允许你任性,但你必须在我允许的范围内任性。当初你把自己当生日礼物送给我了,这辈子你就是我的!从头到脚都是我的!一根头发丝也是我!”......