英伟达下代7纳米制程产品,黄仁勳:台积电仍会取得大多数订单

英伟达下代7纳米制程产品,黄仁勳:台积电仍会取得大多数订单

韩国媒体曾报导,英伟达高层表示,公司新一代GPU绘图芯片将转单给韩国三星,并采用内含极紫外光刻技术(EUV)的7纳米制程技术打造,舍去原本长期合作对象台积电。英伟达创办人黄仁勳日前接受媒体访问时澄清,未来还是会将大多数7纳米制程产品订单交由台积电生产,三星只会获得少量订单。

英伟达创办人黄仁勳在苏州举行的GTC大会,回答媒体询问市场转单传闻,表示英伟达下一代7纳米制程产品订单,大多数仍交给台积电生产,只有少量订单交由三星代工。分配状况是基于技术发展的整体考量。整体说来,7纳米制程产品订单分配比例上,还是台积电一家独大。

之前有消息表示英伟达下一代7纳米制程产品,除了台积电,也将三星纳入代工来源,也是因为与黄仁勳交情甚好的台积电创办人张忠谋退休后,可较无顾虑增加更多代工厂,以获得较好的代工价格。黄仁勳反驳了此说法。

黄仁勳表示,他与台积电董事长刘德音、总裁魏哲家一直是好朋友,且合作关系也非常紧密。英伟达靠着台积电12纳米制程技术打造的Turing系列绘图芯片,就比对手7纳米制程产品的性能更佳。未来7纳米制程的产品,英伟达也会有优秀效能,可说没有台积电,英伟达就不会这么成功,所以台积电是英伟达非常重要的合作伙伴。

最后,竞争对手2019年也推出采用台积电7纳米制程的Navi绘图芯片,且处理器龙头英特尔也预计2020年加入独立显卡竞争行列,推出Xe绘图芯片,可预见的未来,全球绘图芯片市场的竞争将会超越2019年。至于大家关心英伟达的7纳米制程产品究竟何时推出,黄仁勳的回答是,相关时程不方便透露。

Nvidia新SoC芯片速度快七倍,助车厂开发2022年出厂智慧车

Nvidia新SoC芯片速度快七倍,助车厂开发2022年出厂智慧车

Nvidia昨日(12/18)宣布Nvidia DRIVE AGX Orin自驾车和机器软件定义平台,背后的SoC芯片Orin宣称比起前一代,有7倍速度的效能跳跃,为世界上最先进的自驾车和机器芯片。

Nvidia在GTC China大会亮相新的软件定义平台和SoC芯片,整合Nvidia GPU架构与Arm Hercules CPU核心,效能部分能够达成每秒200万亿次深度学习或是电脑视觉识别相关运算,比起前一代的Xavier SoC芯片快7倍。

另外除了效能大提升外,Nvidia也采用系统化的安全准则ISO 26262 ASIL-D,确保训练过程中遵循规范。

Nvidia说DRIVE AGX Orin平台能够为合作伙伴提供从Level 2到Level 5的自驾车AI模型训练,也都能透过CUDA和TensorRT的APIs和函式库,撰写程式更动Orin或是Xavier SoC的功能。

Nvidia CEO黄仁勳指出,采用像是Orin可扩充、可程式化、软件定义的AI平台,将能大大提升研发的速度,解决自驾车研究带来的复杂问题。

Nvidia Research首席研究分析师Sam Abuelsamid说,Nvidia长期投入交通运输产业,运用先进平台和工具,造就如今看来相当丰富的生态系,Orin的推出问世将进一步改进现有技术,催生下一轮的自驾车新成就。

英伟达辟谣 7纳米合作对象仍是台积电

英伟达辟谣 7纳米合作对象仍是台积电

近期,半导体产业最热门的消息,就是传出台积电与多年合作伙伴英伟达(NVIDIA)拆夥,将新一代7纳米制程绘图芯片(GPU)交由三星来代工,对市场投下震撼弹,又对台积电的股价造成冲击。不过,7日NVIDIA声明表示,否认7纳米制程处理器将交给三星代工,合作对象仍是台积电。

韩国媒体日前报导,韩国NVIDIA的高层宣布,公司新一代的绘图芯片生产将下单给三星,尤其下内含极紫外光(EUV)技术的7纳米制程来代工,等于过去多年来台积电与NVIDIA在先进制程上的合作拆伙。

此消息一出,不但震撼了全球半导体产业界,也冲击了后来台积电在台股的股价表现。

不过,根据NVIDIA在7日所发出的声明指出,NVIDIA营运部执行副总裁Debora Shoquist表示:“NVIDIA下一代绘图处理器仍会由台积电生产,近日传闻并不正确。NVIDIA先前就和台积电与三星两间公司合作,未来也是。”等于正式打脸韩国媒体报导。

早在一个多月前市场就传出三星抢单NVIDIA 7纳米绘图芯片消息,三星以台积电售价60%低价抢单,使得目前营状况陷入瓶颈的NVIDIA欣然接受,答应由台积电转单三星生产。直到近日,韩国媒体再度引述NVIDIA韩国高层的说法,表示证实NVIDIA转单传闻。

而对于NVIDIA转单的消息,市场上引起极大波澜。不过,外资机构大摩(摩根士丹利,Morgan Stanley)及小摩(摩根大通,JPMorgan)都在消息传出后力挺台积电,表示NVIDIA的7纳米制程产品仍是会由台积电生产。

大摩表示,NVIDIA和台积电有紧密的伙伴关系,因此若真的下单给三星,也会以台积电为主要供应商,三星扮演第二供货商的方式,指出NVIDIA转单三星的报导太夸大。而小摩则是表示,就性能分析,三星虽急起直追,与台积电同样切入7纳米EUV,但代工成果还是台积电胜出。

英伟达辟谣 7纳米合作对象仍是台积电

英伟达辟谣 7纳米合作对象仍是台积电

近期,半导体产业最热门的消息,就是传出台积电与多年合作伙伴英伟达(NVIDIA)拆夥,将新一代7纳米制程绘图芯片(GPU)交由三星来代工,对市场投下震撼弹,又对台积电的股价造成冲击。不过,7日NVIDIA声明表示,否认7纳米制程处理器将交给三星代工,合作对象仍是台积电。

韩国媒体日前报导,韩国NVIDIA的高层宣布,公司新一代的绘图芯片生产将下单给三星,尤其下内含极紫外光(EUV)技术的7纳米制程来代工,等于过去多年来台积电与NVIDIA在先进制程上的合作拆伙。

此消息一出,不但震撼了全球半导体产业界,也冲击了后来台积电在台股的股价表现。

不过,根据NVIDIA在7日所发出的声明指出,NVIDIA营运部执行副总裁Debora Shoquist表示:“NVIDIA下一代绘图处理器仍会由台积电生产,近日传闻并不正确。NVIDIA先前就和台积电与三星两间公司合作,未来也是。”等于正式打脸韩国媒体报导。

早在一个多月前市场就传出三星抢单NVIDIA 7纳米绘图芯片消息,三星以台积电售价60%低价抢单,使得目前营状况陷入瓶颈的NVIDIA欣然接受,答应由台积电转单三星生产。直到近日,韩国媒体再度引述NVIDIA韩国高层的说法,表示证实NVIDIA转单传闻。

而对于NVIDIA转单的消息,市场上引起极大波澜。不过,外资机构大摩(摩根士丹利,Morgan Stanley)及小摩(摩根大通,JPMorgan)都在消息传出后力挺台积电,表示NVIDIA的7纳米制程产品仍是会由台积电生产。

大摩表示,NVIDIA和台积电有紧密的伙伴关系,因此若真的下单给三星,也会以台积电为主要供应商,三星扮演第二供货商的方式,指出NVIDIA转单三星的报导太夸大。而小摩则是表示,就性能分析,三星虽急起直追,与台积电同样切入7纳米EUV,但代工成果还是台积电胜出。

英伟达Arm携手布局 超算功耗难题将破?

英伟达Arm携手布局 超算功耗难题将破?

个人电脑图形芯片知名厂商英伟达与智能手机/平板电脑IP设计巨头Arm再度携手。日前,英伟达宣布,其芯片加速平台将兼容Arm处理器,共同开拓超级计算机市场。据了解,英伟达与Arm公司已是“老交情”。在此之前,两家公司在自动驾驶汽车、机器人、嵌入式芯片以及便携式游戏等诸多领域已有近十年的合作基础。目前,英伟达发布的超级计算机DGX SuperPOD位列全球最快超级计算机第22名,主要用于自动驾驶汽车AI训练。

英伟达携手Arm布局超算

国际超级计算大会ISC 2019落下帷幕。在此期间,芯片巨头公司英伟达推出了全球速度排名第22位的超级计算机DGX SuperPOD,其AI基础设施可满足自动驾驶车辆的算力要求。据英伟达官方披露,DGX SuperPOD的运算能力可以达到每秒9.4千万亿次浮点运算,主要工作为在自动驾驶车辆训练数据中收集可用于道路规则训练算法的内容。

在发布超级计算机DGX SuperPOD的同时,英伟达表示,其超级计算机的加速平台将在今年年底前与Arm处理器兼容。英伟达加速计算部门副总裁伊恩·巴克认为,Arm能够为超级计算提供开放架构是促成此次合作的原因之一。

一直以来,英伟达深耕电脑图形芯片,并在该市场具备强大优势。Arm则注重为手机芯片提供底层处理技术,受其技术授权,多家知名厂商用其架构制造芯片。此次两家联手,英伟达将于2019年底前,向Arm生态系统提供全堆栈的AI和高性能计算集群HPC软件。双方在深入合作后,英伟达将能为包括x86、POWER和Arm在内的所有主流CPU架构提供加速。

英伟达创始人兼首席执行官黄仁勋表示,英伟达选择与Arm合作,其可加速计算的运算平台CUDA和Arm的高能效CPU架构相结合,将助力高性能计算集群HPC实现大幅提升,以达到百万兆级的算力。黄仁勋认为,未来超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。据了解,目前英伟达运算平台CUDA已用于英特尔、IBM等公司的处理器中,协助CPU完成大规模计算的加速任务。英伟达副总裁兼加速计算总经理Ian Buck表示,英伟达在融合Arm产品后,使用者可以完成大量的高性能计算集群HPC仿真和AI所需的繁重计算,并且Arm可以使用快速单线程来执行CPU。

Arm首席执行官Simon Segars表示,基于Arm的SoC正在完成前所未有的计算性能提升,实现百万兆级的算力。目前高性能计算集群HPC已经部署了Arm技术。“通过与英伟达合作,将CUDA加速引入Arm架构,这一举措对于HPC社区来说,可谓是一大重要里程碑。”Simon Segars说。

“Arm作为全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了Arm的芯片架构。英伟达一直是Arm的客户。此次合作,是英伟达联合Arm这一生态合作伙伴,构筑自身在人工智能芯片等领域的生态系统、提高自身核心竞争力的重要的一步。”分析师李振说。

Arm获得超算门票

与Arm合作,并不是英伟达在超级计算机上唯一的布局。早在今年年初,英伟达以69亿美元的价格收购以色列芯片制造商Mellanox,每股支付125美元现金。Mellanox主要生产高速网络芯片,可将小型计算机连接成大型计算机,一些功能最强大的超级计算机中也使用这种芯片。英伟达收购的因素之一,便是Mellanox可以在大型计算、网络和存储堆栈中优化大规模数据中心。专家称这一收购是英伟达持续整合芯片制造商的举措之一,因为超级计算机制造芯片商正是云服务时代下关键的一环。

英特尔也曾对Mellanox感兴趣,据传现金报价已达到以约60亿美元。作为芯片大厂,英特尔一直在服务器数据中心领域独占鳌头。然而,Arm从未放弃过英特尔垄断的市场。早在数年前,Arm就发誓,将在2021年拿下服务器领域25%的市场份额,随后AMD、高通、Marvell等重量级元老先后开始采用Arm架构,开发服务器CPU,但效果惨不忍睹。现今,AMD和Marvell相继退出;高通Falkor Arm服务器架构设计的灵魂人物Bhandarkar离职,团队解散。剩下的其他几家采用Arm架构的公司,在英特尔的围剿下苦苦支撑。在服务器数据中心的战场上,Arm进展缓慢,“25%的市场份额”——这一目标实现似乎颇具难度。

与英伟达在超级计算机市场的合作,为Arm提供了发展机遇。一直以来,Arm在终端设备的主流芯片架构领域极具份量。但是在超级计算机领域,与英特尔相比,Arm并没有很大的影响力。在多次进军服务器领域失利后,英伟达与Arm的此次合作,或将为Arm提供迈入超级计算机领域的门票。“毕竟,英伟达在超级计算机领域还具有一定的影响力,再加上Arm架构的开放性,势必将推动高性能计算产业的进步。”李振说。

英伟达有望实现超算最低功耗

一直以来,在数据中心市场上,英伟达及其产品扮演着重要角色,但其重心依旧围绕在游戏和图形领域的处理器。在此领域之外,英特尔和Arm的处理器非常具有代表性。在全球微处理器指令架构中,英特尔x86和Arm架构主宰了半壁江山。英特尔x86主要以PC、服务器等高算力市场为主,Arm则专注于手机、物联网等低功耗市场。

在PC领域,Arm再次跃跃欲试。2017年,高通、微软、惠普、华硕等多家厂商共同合作推出了基于Arm架构的Win10笔记本电脑。在此之前,由于Arm架构处理器难以兼容Windows应用,因此微软、惠普、华硕等笔记本厂商一直犹豫不决。高通的加入为Arm献上了“临门一脚”,高通Arm架构的骁龙芯片,目前可以搭载微软的完整版Windows,这在很大程度上解决了Arm架构芯片笔记本兼容Windows应用的问题。而此次英伟达与Arm的合作,目的在于“打造超级计算机”,而且是百万兆级AI超级计算机。

“多年来,英伟达一直在布局于高性能计算机产业,此次合作,英伟达将在高性能软件等多领域,支持英国半导体设计公司Arm设计的处理器。此次合作将为英伟达这一产业巨头,在超级计算机功率这一主要性能强化方面助力赋能。同时,这也是高性能计算产业的一次重大技术进步。”李振说。

对于超级计算机来说,目前面对的最大问题便是功耗,如何在支持强大的算力性能的同时,做到低功耗,是包括英特尔、IBM、英伟达等在内的众多企业考量的重要因素之一,而此次英伟达与Arm的合作,或将为行业带来一些突破。“对于Arm来说,英伟达是其重要下游客户。此次合作,将推动超级计算机在功耗方面向前迈进一大步。英伟达携手Arm推出的超级计算机产品,有望在功耗上完成了业内最节约的标准。”李振说。

传英伟达转向三星 哪些要素影响芯片巨头对代工厂的抉择?

传英伟达转向三星 哪些要素影响芯片巨头对代工厂的抉择?

近日有消息传出英伟达将新一代GPU订单交由三星代工,使台积电损失英伟达这位重要客户,究其原因在于三星提供较低报价,进一步使英伟达转换代工伙伴,同时抵御AMD以7nm GPU产品线的强势进攻。

从英伟达 GPU架构与技术发展,看英伟达与台积电合作状况

单以英伟达 GPU架构发展脉络来看,Pascal、Volta与Turing等三代架构担纲英伟达旗下如NB、桌上型计算机、车用与服务器等产品线的重要基础。其产品线主要由台积电负责代工,三星则针对Pascal架构的GP107、GP108芯片进行代工。

但三星代工的Pascal GPU仅涵盖部份桌上型计算机与NB市场,在资料中心与服务器市场所需的Tesla P100则由台积电负责,甚至该技术也动用到台积电CoWoS封装技术;而进入Volta与Turing时代,完全由台积电负责量产。

事实上,英伟达技术发展不光GPU架构有相当幅度进展,自Pascal时代,就针对资料中心与服务器应用同时导入NVLink与HBM技术,试图强化服务器整体系统的运算表现,因此不难发现,从GPU到NVLink的导入都出自台积电之手,更遑论台积电也拥有HBM技术实力。

三星抢下英伟达订单恐待商榷

回到三星代工英伟达新一代GPU产品线的议题上,单以目前英伟达在Turing GPU的产品线规划,并未见到HBM与NVLink等技术导入,这也可以看出英伟达在HPC与资料中心市场的态度采取按兵不动,但HBM与NVLink技术仍是英伟达产品策略的重要一环;换言之,英伟达极有机会在下一代GPU产品线导入其技术,以巩固HPC等市场应用。

三星若要单以低价抢得英伟达订单,就必须在NVLink与HBM等技术上满足英伟达需求,才能提高取得订单代工机率。

再者,即便英伟达受到库存过高所累,自2017年开始其财务表现相当出色,英伟达是否会因为三星低价抢单而有所动摇,恐怕还有待商榷。

若英伟达真的投向三星怀抱,唯一可能就是台积电产能有限,迫使英伟达在无奈下转向三星。由于2019~2020年全球智能型手机市场需求不振,使智能型手机处理器订单减少,空出来的产能应能填补其他客户如英伟达需求。

NVIDIA收购Mellanox,牵动与英特尔的竞合关系变化

NVIDIA收购Mellanox,牵动与英特尔的竞合关系变化

NVIDIA 确定以 69 亿美元收购端对端乙太网络与 InfiniBand 解决方案供应商 Mellanox,预计 2019 年底前结束,据 NVIDIA 官方表示,收购案结束后,将可提升 NVIDIA 在 Non-GAAP 的毛利率、每股收益与现金流等表现。

Mellanox毛利率表现优异,有助 NVIDIA 财报表现

就双方营收与毛利率表现来看,NVIDIA 营收表现远高于 Mellanox,前者 2018 年单季财年营收(含 OEM / IP 业务)至少都是 30 亿美元以上,而 Mellanox 2018 年单季营收,大约介于 2.5 亿至 2.9 亿美元。以营收面来看,收购完成后短期内有助整体营收成长率写下亮眼表现;在毛利率方面,NVIDIA 近期毛利率约落在 56%~64%,而 Mellanox 近 2 年毛利率至少都维持 69% 以上水平,这也是为何 NVIDIA 官方释出的讯息,一开始就提到双方合并将有助 NVIDIA 财报表现。

▲ Mellanox 2017~2018 年季营收与毛利率表现。(Source:Mellanox;拓墣产业研究院整理,2019.3)

▲ NVIDIA 2018~2019 年财会年度营收与毛利率表现。(Source:NVIDIA;拓墣产业研究院整理,2019.3)

英特尔与 NVIDIA 关系更形微妙,AMD 拓展资料中心市场恐不易

单以 Mellanox 解决方案来看,不只是一家单纯网通芯片供应商,Mellanox 旗下亦有板卡、网络交换器与网通软件方案,主要客户群除了服务器还有资料中心厂商外,例如腾讯、Netflix 与百度等,都是重要指标客户群,某种程度上,也可解释为何 Mellanox 能拥有如此高毛利表现,与其说 Mellanox 是芯片供应商,用网通方案供应商来形容或许更贴切。其次,NVIDIA 也开始提供系统层级产品,象是服务器相关的 HGX 与 DGX 系列,车用领域则有针对自驾车专用的 Pegasus 系统,这也显示 NVIDIA 有意强化垂直应用的纵深布局。

此次收购对于 NVIDIA,一来可强化和既有客户如 Dell、HPE 与百度等合作关系,其次也可强化在资料中心市场的话语权。

资料中心基本上仍是服务器的处理器最关键,所以在该市场还是以英特尔马首是瞻,其生态系统也以英特尔为核心展开,这也是为何 Arm 阵营常年无法攻克该市场的首要原因。然资料中心另一关键,就是资料中心与服务器间的资料交换速度能否有效提升,藉此发挥整体综效,强化服务业者的服务质量。

▲ Mellanox 在各领域的重要指标客户。(Source:Mellanox,2019.3)

事实上,英特尔的确也具备资料中心所需的连网解决方案,倘若英特尔收购 Mellanox,就能摇身一变成为资料中心连网方案的龙头供应商,但 NVIDIA 此次收购,反而让 NVIDIA 与英特尔关系更加微妙。由于英特尔与 NVIDIA 的核心竞争力分属 CPU 与 GPU,处于「合作」大于「竞争」的共存关系,尽管这几年 AI 议题发酵,使得双方颇有竞争味道在,但就系统层面来看,双方的解决方案还是可以共存。但 Mellanox 与英特尔在资料中心连网领域本是竞争关系,因此当 NVIDIA 完成收购后,英特尔与 NVIDIA 在 2020 年的互动关系,将是值得关注的重点。

至于已在资料中心市场颇有斩获的 AMD,目前仍聚焦在 CPU 与 GPU 的方案提供,NVIDIA 确定收购 Mellanox 后,在英特尔与 NVIDIA 夹击下,AMD 即便能杀出血路,但就市场影响力来看,恐怕仍远不及英特尔与 NVIDIA。

英伟达与英特尔的资料中心争夺战:相互牵制,胜负难分

英伟达与英特尔的资料中心争夺战:相互牵制,胜负难分

随着英伟达确定收购Mellanox,英特尔官方几乎在同一时间宣布成立CXL (Computing Express Link)联盟。CXL是英特尔提出的最新资料传输技术,旨在提高效能,进一步消除运算密集工作负载中的瓶颈。

目前该联盟成员有:阿里巴巴、Cisco、Dell EMC、Facebook、Google、HPE、华为与Microsoft,就英特尔官方信息来看,该技术应是英特尔领军,协同联盟成员进行开发与商用,将该技术成为业界共通标准,且首发版本预计2021年在英特尔资料中心平台出现,涵盖Xeon处理器、FPGA、GPU与SmartNIC等产品。

英伟达递出NVLink共创双赢,无奈英特尔不予理会

谈到资料总线技术发展,业界普遍以PCIe作为主要规格,在资料中心与通讯基础建设市场等,都是不可或缺的重要角色,事实上英特尔除了在运算领域居龙头地位外,在PCIe规格制定上也有相当大的话语权,加上过去和Microsoft已有相当密切合作,无怪乎英特尔在资料中心市场生态系统中的地位难以撼动。

就运算特性来说,针对图像运算或游戏执行,乃至极为大量的资料运算工作负载,CPU运算能力仍远不及GPU,这也是英伟达这几年能快速在资料中心市场窜升的主要原因。

但英伟达也意识到,若要全面提升资料中心的性能表现,光是GPU运算性能还远远不够,若能在资料搬运速度有进一步提升,透过两者相辅相成,将为资料中心发展带来革命性突破,因此英伟达在2014年提出NVLink技术,试图提升CPU与GPU间的资料传输速度,NVLink传输速度相较于PCIe Gen3,约莫有3~5倍的性能表现,在发表初期英伟达也携手IBM,希望能广获市场认同。

不过如前所提,在英特尔资料中心市场地位仍无可撼动的情况下,即便英伟达推出NVLink,若英特尔不买单且未释出善意对接该技术,NVLink仍旧无法有效推广,深入到各大OEM与服务器代工厂商上,最后英伟达只能唱独角戏,让NVLink在HGX-1等服务器相关产品上发扬光大。

英特尔成立CXL联盟,牵制英伟达发展动能

英特尔成立CXL联盟,显然是想挟自身在资料中心市场的影响力,从资料总线市场的领导地位,进一步跃升为共主地位,将CXL转成业界共通标准。随着AI、云端运算抑或近期兴起的边缘运算等技术,如何有效提升整体系统乃至资料中心综效,成了产业能否进一步发展的当务之急,因此基于此前提下的三大必备要素:高速运算、资料总线与网络速度,就成为芯片商必然的布局重点。

综上所述,观察目前英特尔与英伟达在资料中心市场发展情况,前者挟其CPU绝对优势使自身供应商地位不变外,更拥有FPGA、乙太网络芯片方案,以及PCIe技术规格制定的话语权;后者如未遭各国政府阻挠,也将确定收购Mellanox,但英特尔提出CXL策略联盟,无疑要牵制英伟达近期在资料中心的快速兴起,才会选择此时发布该消息,因此接下来资料中心市场发展,英特尔与英伟达间的角力恐将逐渐升温。

英伟达:不急推7纳米绘图芯片

英伟达:不急推7纳米绘图芯片

绘图芯片大厂英伟达(NVIDIA)在今年的绘图处理器技术大会(GTC)中,并没有宣布新一代7纳米绘图芯片Ampere(安培)的任何讯息,就连NVIDIA何时可能采用7纳米制程也没有任何时间表。然而NVIDIA总裁暨执行长黄仁勋说,选择12纳米是因为这是对NVIDIA最好的制程,未来会聚焦在运算效率及架构上,并不急于进入7纳米世代。

业界人士指出,NVIDIA已透露在目前主流的绘图芯片Turing(图灵)之后的下一代绘图芯片会是Ampere,预期推出的时间应会落在明(2020)年之后,并且会采用届时已经十分成熟的7纳米制程。也就是说,NVIDIA今年内不会是台积电7纳米量产客户。

超微在今年全面转进7纳米,包括Zen 2架构处理器采用台积电7纳米生产,Vega绘图芯片也导入台积电7纳米制程。根据超微技术蓝图,新一代Navi绘图芯片会再度采用7纳米制程,而且明年开始包括新一代Zen 3架构处理器及Arcturus绘图芯片,会再进行制程微缩,直接采用台积电支援极紫外光(EUV)的7+纳米制程投片。

超微在7纳米及更先进制程的推进积极,但NVIDIA自去年以来一直没有跨入7纳米制程的动作。事实上,NVIDIA去年推出的Turing架构绘图芯片,采用台积电优化后的12纳米制程量产,至于新一代Ampere绘图芯片虽传出可能导入7纳米,但NVIDIA至今并没有推出时间表。也因此,市场十分好奇NVIDIA在先进制程的策略是否出现变化。

黄仁勋对此表示,台积电等晶圆代工厂提供7纳米晶圆制程服务,是开放给他所有的客户使用,要做7纳米制程并不难,但NVIDIA要的是让自家产品更具价值及竞争力,而并不是采用最先进制程就会让芯片效能及效率最佳化。就好像对手新产品没有光线追踪,用7纳米只能勉强追上NVIDIA脚步。

黄仁勋指出,NVIDIA有许多优秀的工程师及员工,Turing绘图芯片功能强大,在人工智能(AI)应用上有许多突出表现,现在采用12纳米的选择,对NVIDIA来说是最好的。绘图芯片应用已进入AI及资料科技的新时代,NVIDIA未来会持续聚焦在提供更好的运算效率及架构。也就是说,现在不急着进入7纳米。

黄仁勋:数据中心将成为巨无霸,但 AI 加速计算才是未来

黄仁勋:数据中心将成为巨无霸,但 AI 加速计算才是未来

相对于前两年英伟达举办的 GTC(GPU Technology Conference) 来说,今年 GTC 在 GPU 技术架构和硬件创新的进展并不明显。在 Keynote 环节,英伟达创始人兼 CEO 黄仁勋发布了一款定价 99 美元的 Jetson Nano——除此之外,并没有此前预想中的新架构,或者“大核弹”。

尽管如此,在现场见证了 Keynote 之后,感受到了黄仁勋的激情,以及他在打造基于现有的 GPU 技术的应用生态方面的努力。无论是基于图灵架构和 RTX 技术的 Nvidia Omniverse 和 NVIDIA RTX Servers 服务器,还是七家世界级的厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器,都让人体会到英伟达在技术应用生态方面的着力。

实际上,黄仁勋依旧在强调这句话:买的(GPU)越多,省的(Money)越多。

黄仁勋:数据中心将成为巨无霸,但 AI 加速计算才是未来

在 GTC 大会正式举行的第二天,黄仁勋出现在媒体参与的 Q&A 环节,他首先重点强调了本次 GTC 的两个核心关键词——Ray-Tracing 和 Data Science,随后回答了众多外界关注的关键问题,比如说未来的 GPU 技术路线、对以色列公司 Mellanox 的收购,数据中心的未来、摩尔定律的终结等。

笔者也针对本次 Q&A 的关键内容进行了提取。

一、关于英伟达对于 Mellanox 的收购

在本次 GTC 正式开幕前一周,英伟达宣布了对以色列科技公司收购,这是英伟达历史上以来最大的一笔收购。对此,黄仁勋提到了以下几点:

在摩尔定律放缓的时期,网络软件堆栈必须尽可能转移到架构上,为 CPU 减负;现在,CPU 是一种有限的资源,所以必须尽可能地把工作从 CPU 中减负出来。Mellanox 是 CPU 减负领域的一流企业。

在数据中心中,计算架构不再停留在节点上,而是将扩展到网络。整个网络都将涉及英伟达的 GPU。英伟达有能力与第一大互联技术公司 Mellanox 紧密合作,整个行业非常欢迎它。

英伟达对 Mellanox 收购一案获得监管部门的批准表示乐观,这将使得英伟达加速创新并推进技术发展,以更好地服务于客户。因为我们缺乏网络技术,而我们的目标是推进网络技术,为数据中心节省成本。而英伟达的客户普遍表示支持并乐见其成。

英伟达并不经常收购公司,因为它喜欢与别人合作,而英伟达也是一个开放的平台(比如说 CUDA、DGX),同时英伟达的业务模式必须是开放的。但是之所以收购 Mellanox,是因为双方之间长达 10 年的合作,而英伟达认为 Mellanox 在高速、高性能计算和网络设计方面非常擅长。

英伟达为什么愿意以如此高价进行收购呢?因为 Mellanox 值这个价——这不是成本的问题,而是价值的问题。

二、关于 3D 和堆叠技术、7nm 技术

本次 GTC 上,英伟达没有推出此前被广泛预测的 7nm GPU 架构,这也引起外界的质疑:在处理技术放缓的情况下,英伟达将如何看待 3D 和堆叠技术?而面的 AMD 已经推出的 7nm CPU,英伟达会否会在 7nm 方面有所动作?

对此,黄仁勋表示:

Tesla V100 已经是处理量最大的 3D 封装硅片,而英伟达也是台积电最大的芯片堆叠客户。事实上,3D 堆叠已经有 5 年的历史了,有些人甚至用它来堆叠手机芯片,这样可以降低封装高度。这种技术已经存在一段时间了,它不是新东西。

但是对于英伟达来说,不仅需要 3D 堆叠,也需要 2D 堆叠。而英伟达实现 2D 堆叠的方法就是 NVLink。英伟达也需要一定规模的数据中心,这不再是为了 2D 堆叠,而是为了提升处理量。为此,英伟达需要通过 Mellanox 来实现,将多个 GPU 与大型计算引擎相连。

未来,数据中心将成为一个巨大的计算引擎,而且数据中心的体积也要不断减小,而计算效果却非常惊人——这需要具备高性能技术方面的专长,也是 Mellanox 擅长的。

而针对外界关注的 7nm 技术和下一代 GPU 的发展,黄仁勋表示:

实际上 7nm 技术已经公开发售,台积电也希望能够卖给我们;我要想买它也非常容易。但是对于英伟达来说,我要考虑的问题是,购买 7nm 的要义和益处是什么?对 NVIDIA 来说,从台积电购买 7nm 处理器技术,并不会让我们成为一家好公司,只会让台积电变得更好。而英伟达的与众不同之处在于,我们在任何时候都能开发最具能效的 GPU,而且利用的是最具成本效益的技术。实际上,我们的工程师也是架构师,他们必须开发最具能效的 GPU,比如 Turing;我们的贡献是兼顾效率与最佳架构——我们为 Turing 选择了最佳的技术,即 12 nm。

三、关于软硬件关系、RTX 的技术应用

对于本次 GTC 来说,最新发布的 CUDA-X 加速库成为一个亮点,同时数据中心和 RTX 技术成为重中之重,GPU 硬件被提及的次数很明显少了很多。当被问及为什么硬件在 GTC 2019 的角色被相对弱化时, 黄仁勋表示:

你之所以会听到很多关于软件的内容,是因为:如果我们不为硬件开发软件,那么硬件将没有用武之地;(正是因为有相应的)软件存在,才使硬件变得出色。如果我们不自己开发软件,那么市场上将只有适用于 CPU 的软件。英伟达的业务是向新市场销售计算机平台,如果我们想这样做,我们必须打造新的软件架构(比如说 CUDA-X)。在这方面没人会帮我们,我必须亲力亲为。

而面对外界对于基于图灵架构的 RTX 市场销售和技术应用情况的质疑,黄仁勋回应称:

RTX 在最初八周内的增长几乎比 Pascal 快50%。然而,人们为什么会觉得 RTX的应用放缓?这是因为当我们首次向市场推出该产品时,我们有加密产品的库存,我们不能推出整个系列——我想这样做,但是不能。现在,我们已推出了整个系列,它们都表现得很出色。

另外,伴随着 RTX 服务器的推出,外界也开始关心 RTX 技术何时能够纳入到 Geforce Now(简称为 GFN)中去并面向公众开放,对此,黄仁勋回应了如下要点:

目前新制造的 GFN 服务器都采用了光线追踪技术。

目前 GFN 的等待名单里有 300000 玩家和 100 万用户。首要挑战是要确保能大规模、高质量地提供这项服务,其次就是必须降低成本,以便减低客户成本,让他们去玩免费的游戏。另外,第三个挑战就是确保 GFN 能够覆盖全球更多的国家,而不仅仅是西方国家。

预计光线追踪将在 2019 年第三第四季度开放。

四、关于摩尔定律的终结和数据中心的未来

在本次 GTC 上,以数据中心为载体的数据科学(Date Science)也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时,黄仁勋表示:

首先我认为英特尔也认识到了加速计算是未来的发展方向。整个行业不再认为 CPU 和 GPU 是互斥的,这当然是件好事,因为那条路已经走不通了。我们要承认,我们需要新的方法去引领行业向前发展。其次,我们仅占全球 HPC 总量的一小部分在全球超级计算机企业(500 强企业)中,英特尔有充分理由占据非常大的份额。英特尔是一家竞争力很强的公司。我期待他们奋勇向前,我们也将积极面对挑战,最后受益的将是全世界的用户和研究人员。第三,我不太确定,英特尔最新架构是设计本身的成功,还是原有技术的延展。但我认为非常好的是,英特尔这个声明基本是在讨论加速计算;它是在说:“来点真格的吧,加速我们的堆栈”。

而关于目前数据中心发展所受的限制,黄仁勋最后表示:

其实很简单,目前对数据中心的唯一限制就是:摩尔定律的终结。我们深知,未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了,唯一的方式将是构建更多的数据中心。我相信,将来的趋势是增加数据中心的工作负荷,这样,数据中心的计算能力将会以 10 倍的速度提升,其结果是:软件创新将会突飞猛涨,计算能力将进一步增强,而这会推动更多的创新。