收购Arm,推出80G超级A100:英伟达还有一招没出
机器之心原创
作者:泽南400 亿美元收购 Arm,把业界顶级显卡性能一次提升 20 倍,市值超越英特尔成为第一大芯片公司……2020 年的科技界大新闻,英伟达一家就占了好几条。
说起英伟达,很多人都知道这家公司最新推出的消费级显卡 RTX 3080,以及它一卡难求的火爆景象。实际上,由于 GPU 在高性能计算、AI 等领域的大规模应用,英伟达出品已经成为了很多工作中不可或缺的一部分。
英伟达快速发展的技术,为人们带来了近乎无穷的算力,也让其自身业绩节节攀升。在过去 20 个季度中,英伟达已有 18 个季度的财务业绩超过了华尔街分析师们的预期。
当然不断的成功并没有让英伟达放缓推出新卡的步伐。
今年英伟达发布的新显卡,几乎都是由黄仁勋自家烤炉中「出炉」的。
就在自家消费级 GPU RTX 3080 显卡抢占「最强 AI 计算芯片」的名头后不久,11 月份英伟达又为旗下的最强 AI 训练计算卡 A100 系列进行了升级。
回想今年五月份,英伟达在 GTC 大会上发布了 7nm 安培架构(NVIDIA Ampere)的 A100 GPU 产品,其中 40GB,带宽为 1.6TB/s 的 HBM2 显存令人印象深刻。11 月 16 日,竞争对手 AMD 带来了 7nm CDNA 架构的 MI100 加速卡,英伟达继续出招,推出了 A100 80GB GPU,显存翻倍,性能大幅提升。
时隔仅半年,英伟达推出的新卡有哪些具体的提升?首先在芯片的计算性能上,A100 80GB 的数据没有变化,依然采用了基于 7nm 工艺的安培架构,集成 542 亿晶体管、6912 个 CUDA 核心、加速频率 1.41GHz,FP32 性能 19.5TFLOPS,FP64 性能 9.7TFLOPS,INT8 性能 624TOPS,额定功耗 400W。
A100 搭载了英伟达特有的第三代 Tensor Core 人工智能计算单元,对稀疏张量运算进行了特别加速,执行速度提高了一倍,也支持 FP64、 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速。通过全新的 TF32,A100 将上一代 Volta 架构的 AI 吞吐量提高多达 20 倍。
新款 A100 计算卡的主要升级之处在于 HBM2 显存:从之前的 40GB 直接翻倍达到 80GB,显存类型升级为更先进的 HBM2e。同时显存频率从之前的 2.4Gbps 提升到 3.2Gbps,带宽也从 1.6TB/s 提升到史无前例的 2TB/s。通过配合英伟达多实例 GPU(MIG)技术,每个实例在训练时获得的内存可以增加一倍,单卡最多可提供七个 MIG(每个 10 GB)。
英伟达最新几代 AI 训练卡性能的对比,图片来自 AnandTech。
在 A100 上应用的技术还包括第三代 NVLink 和 NVSwitch 功能,相比上代,它们提供了两倍的 GPU 到 GPU 带宽,并将数据密集型工作负载到 GPU 的数据传输加速到每秒 600 GB。
通过硬件与软件的优化提升,A100 80G 可以在大型仿真系统中提供相比六个月前刚刚发布的 A100「标准版」1.8 倍性能的提升。在材料模拟软件 Quantum Espresso 上,单节点 A100 80GB 也实现了近 2 倍的吞吐量提升。
这使得数据可以快速传输到全球最快的数据中心 GPU A100 上,使研究人员能够更快地加速其应用,处理最大规模的模型和数据集,如类似 GPT-3 这样的大规模预训练模型,很大程度上避免了对于数据或模型并行架构的需求。
在深度学习等很多领域中,研究人员对于 AI 算力的需求几乎是无止境的,据英伟达在今年 5 月的统计,自 2017 年底发布 V100 之后,训练业界机器学习模型的算力需求增长了 3000 倍。在五月底 Open AI 的 GPT-3 推出以后,这一数字再次被抬高了不少。
机器学习先驱 Richard S. Sutton 在《苦涩的教训》中曾表示,70 年的人工智能研究史告诉我们,利用计算能力的一般方法最终是最有效的方法。
这种思想获得了很多人的赞同,也引来了争议。虽然一直有人认为,找到与人类思考方式类似的因果推理范式才能真正地通往强人工智能,但基于深度学习的方法在近年来已掌握了国际象棋、围棋,实现了不少人类专家也难以企及的能力。除了前沿探索之外,更多的深度学习应用正在路上。
与此同时,英伟达还发布了「全球唯一」的千万亿次级工作组服务器 NVIDIA DGX Station A100,其配备四块新款 A100 GPU,具有高达 320GB 的 GPU 内存,输出算力 2.5 petaflops。在执行 BERT 等大模型时,新一代设备的效率相比过去提高了三倍。
虽然有超算级别的能力,但 DGX Station A100 无需配备数据中心级电源或散热系统,而且年底即开始供货。搭载 A100 80GB 的第三方成套系统则预计会在 2021 年上半年出货。
通过新计算卡和与之配合的架构,英伟达可以向更广泛的人群输出以往仅存在于超级计算机的 AI 算力。而说到超级计算机,英伟达也是目前业内的领先者,在 11 月全球超算大会 SC2020 公布的 TOP500 榜单数据来看,近 70%的机器(包括排在前 10 名中的 8 台)均采用了英伟达技术。
GPU 在高性能计算领域能有如今的覆盖率,显然是因为有很大需求:在 SC2020 大会上,有超算界诺贝尔奖美称的「戈登 · 贝尔奖」颁给了由 UC Berkeley、北京大学、普林斯顿大学组成的研究团队,他们的研究被认为是当今计算科学中最令人兴奋领域的重大进展。
研究团队引入基于机器学习的分子动力学方法模拟原子运动,每天能够模拟 1 亿原子超过 1 纳秒的轨迹。该研究是在美国橡树岭国家实验室的前世界第一超算 Summit 两万八千块英伟达 V100 上完成的。
戈登贝尔奖旨在表彰研究者们在高性能计算方面的成就,入围者必须证明他们提出的算法可以在世界上最强大的超级计算机上高效运行。中美获奖团队开发了一系列高度优化的代码(GPU Deep MD-Kit)并在 Summit 超算上顺利运行,在双精度下实现了 91 PFLOPS 的速度,在混合单 / 半精度下实现了 162/275 PFLOPS 的速度。
将人工智能算法引入到 HPC 领域,并将边界拓展至数据中心之外,是高性能计算领域里正在进行的一项重大变革。而在这个过程中,英伟达将会继续扮演举足轻重的角色。
今年 5 月份的 GTC 2020 大会上,黄仁勋发布了 7nm 安培架构和 A100;9 月份的 GTC 大会上,又为我们揭晓了「PC 游戏领域自 1999 年以来最大突破」——RTX 30 系列显卡。
韩国未来资产收购安邦旗下15间美国奢华酒店资产组合
中国网地产讯 据市场消息,韩国未来资产环球投资今日宣布,已与安邦保险集团(Anbang Insurance Group Co.;以下简称:安邦)签订最终协议,收购后者旗下包含15家美国奢华酒店的一项资产组合。这将成为韩国企业迄今最大规模的跨境房地产投资交易,并将巩固未来资产在美国房地产市场的地位。
据了解,该资产组合原为安邦于2016年向黑石集团所收购,由占据市场领先地位的奢华酒店和度假村组成,这些不动产位于进入门槛较高且供应增长有限的城市及度假村市场。此资产组合中包括约720,000平方英尺(约6万7千平方米)的会议空间和6912间客房,将继续受益于安邦自2016年以来投资的约4亿美元的资本支出。
这15家标志性的豪华酒店包括纽约艾塞克斯豪斯JW万豪酒店(JW Marriott Essex House)、位于旧金山的半月湾丽思卡尔顿酒店(Ritz-Carlton Half Moon Bay)和圣弗朗西斯威斯汀酒店(Westin St. Francis)、位于加州南部的蒙太奇拉古纳海滩酒店(Montage Laguna Beach)、硅谷四季酒店(Four Seasons Silicon Valley)、位于亚利桑那州的斯科特斯德费尔蒙公主酒店(Fairmont Scottsdale Princess)和北特伦斯科茨代尔四季度假酒店(Four Seasons Scottsdale)、位于怀俄明州的杰克逊霍尔四季度假酒店(Four Seasons Jackson Hole)以及位于芝加哥和迈阿密的洲际酒店(InterContinental Hotels in Chicago and Miami)。
未来资产房地产业务负责人Choi Chang-hoon表示:“这一项目是未来资产自2003年以来持续投入海外房地产市场的成果。我们将继续竭力为投资者提供多元化投资组合的机会,包括位于全球主要市场的核心房地产资产。”
仲量联行(纽交所代码:JLL)酒店及旅游地产投资咨询部是此次交易中代表未来资产的买方估值和融资顾问,而美银美林(Bank of America Merrill Lynch)则为安邦担任出售投资组合的唯一财务顾问。
在过去五年中,仲量联行酒店及旅游地产投资咨询部完成的交易数量超过其他任何酒店及旅游地产顾问公司,全球总交易额超过632亿美元。其遍布全球20多个国家的350名酒店专家共计万成了超过5420项咨询、估值和资产管理任务,帮助众多酒店投资者、业主和运营商获得高资产回报,在全球房地产顾问公司中遥遥领先。
相关问答
...gethereightepisodes(集),allabouthistoryandculture_作业帮[回答]41.D.根据语境Morethan300typesoffoodarecoveredinthedocumentary(纪录片).可知300多种食物.故选:D.42.B.根据语境Mor...
anindividualmustbeabletoperformeachessentialdutysatisf...[回答]为了成功完成此项工作,一个人必须能够执行各重要职责令人满意.下面列出的要求是知识,技能的代表,和能力的需要.(在特殊情况下,要具有灵活的应变能力...
从印度购买AZD9291泰瑞沙(英文名称为:TAGASSO),然后可以...[回答]可以的海关放行的原则是个人自用、合理数量,收件人最好是患者本人,万一被扣凭收件人身份证和病例就可以要回,泰瑞...
MayIhaveyourattention,please?Ihaveanannouncementtomake.[回答]Dearcomrades,MayIhaveyourattention,please?Ihaveanannouncementtomake.Tomorrowmorningw...
笔吧里上船 是什么 意思,神州的笔记本不好吗?-ZOL问答1610246506anan上船的意思就是买神州电脑,现在的神州是大毛病没有,小毛病多,出的这些小毛病只要要懂些电脑知识就能解决,但大部分去笔吧问买电脑的都是些小白...
孩子背着家长玩游戏充值的钱,要不回来,怎么办?_找法网必须是法定代理人,即父母代表孩子有效。无效意味着交易从头到尾都不存在。如果孩子已经充值,游戏平台将全额退还;2、8岁以上,18岁以下的孩子是限制行为能力的人...
AnsewerinEnglish.Doyoumindlivingwithyourparentsafteryoug...[回答]sometimes,Imind.Inchina,parentslovetheirchildrenmorethanamerican.tothem,childisalwaysac...
西城男孩唱的MY LOVE 的旋律 是什么 ? - 159****0415 的回答 -...AnemptystreetAnemptyhouseAholeinsidemyheartI'mallaloneTheroomsaregettingsmallerIwonderhowIwonder...
DNF强化+15魔剑-阿波菲斯值多少YXB?RMB?-ZOL问答6人讨论6912次围观关注问题写回答讨论回答(6)chaoandan+16的已经是10WRMB了,+15你说看,是多少呢?有用(0)回复dsijsznqtojd最少5w人民币,难道...
请问戴尔笔记本开机遇到 nobootabledevicesfound怎么处理-ZOL...1.开机按F2键进入该BIOS设置界面,选择高级BIOS设置:AdvancedBIOSFeatures;2.高级BIOS设置(AdvancedBIOSFeatures)界面,首先选择硬盘启动...