在拉斯维加斯正在进行的 AWS re:Invent 大会上,AWS 推出了针对高性能 AI 工作负载的下一代Trainium 和 Graviton 芯片。根据 AWS 的说法,Graviton4 比 Graviton3 提供明显更好的性能、更多的内核和更多的内存带宽。Graviton 是专为云工作负载构建的人工智能芯片系列。

第二个芯片 Trainium2 是一款高性能芯片,旨在在 Amazon Elastic Compute Cloud (EC2) “UltraClusters”中大规模部署100,000 个独立芯片。这些 EC2 Ultracluster 旨在满足使用云的计算能力的可扩展需求。
根据GitHub 上的 AWS 官方技术指南,该阵容中之前的芯片也以高效率和高性能为目标。例如,Graviton3E 由针对云原生工作负载优化的可扩展 Arm Neoverse V1 CPU 提供支持。Neoverse V1使用可扩展矢量扩展SVE,使Graviton3E能够适应不同的工作负载。与传统的单指令多数据 (SIMD) 架构相比,SVE 允许处理器在运行时而不是编译时适应不同的向量长度。
向量可以被认为是并行处理的元素的集合。传统 SIMD 架构中向量处理指令的一个示例是Intel x86 指令 _mm256_add_ps 指令。该指令适用于固定大小的 256 位向量。或者,使用 SVE,计算中使用的向量的大小是在运行时动态确定的。对于需要较小计算的工作负载,可以使用较小的向量来提高能源效率。因此,AWS 称赞 Graviton 3E 的矢量处理性能提高了 35%,也就不足为奇了。
AWS 创建 Graviton4是为了进一步提高 Graviton3E 的性能和可扩展性。Graviton4 由 Arm Neoverse V2 CPU 提供支持,Arm 表示该 CPU 可以使 Graviton3E 中使用的 Neoverse V1 的性能提高一倍。
Graviton4还具有增强的安全功能。Neoverse V2 CPU底层采用ArmV9,由于其保密的计算架构,本质上比其前辈更加安全。除了拥有更大的 2 MB 二级缓存外,Graviton4 还实现了分支目标识别 (BTI),这是底层 Arm CPU 架构的另一个功能。这可以防止由于间接分支而执行不需要的指令,从而增强代码安全性。AWS 表示,Graviton4 的数据库速度提高了 40%,Web 应用程序速度提高了 30%,同时仍然强调安全性和可扩展性。
人工智能或机器学习技术最重要的一个方面是训练,即使用一组数据“教授”人工智能的过程。AWS Trainium 专门针对通过云进行高性能训练计算基础设施。
Trainium AI 加速器使用AWS NeuronCore 架构,每个加速器具有 32 GB 的带宽内内存,并提供高达 190 TFLOP 的计算能力。NeuronCore 具有用于张量多维数组计算、矢量处理和标量处理的独立引擎。
AWS 表示,通过部署在 EC2 UltraCluster 中,Trainium2 的训练基础模型 (FM) 和大型语言模型 (LLM) 的速度比以前快四倍。AWS 还允许访问其他令人垂涎的人工智能芯片,例如 Nvidia GPU。一些 Nvidia 芯片,例如 GH200 Superchips,将可以通过 EC2 服务访问。
相关文章:
什么是usb调试模式?华为/小米/Oppo/Vivo/手机usb调试在哪
网线插座怎么接?墙壁网线插座接法
人工智能和内存安全是物联网安全的真正威胁
buck电路是什么意思?buck电路图及其工作原理
Neuchips 在2024 年消费电子展上展示面向个人电脑的低功耗人工智能升级产品
Alps Alpine推出了具有32 位 RISC CPU 的电容式传感器IC
ESIM卡是什么意思?esim卡和sim卡有什么区别
电脑文件夹怎么设置密码?3分钟教会你如何给文件夹设置密码
什么是熔断器?熔断器的作用与符号?
Microchip的四款航空航天和军用级MEMS振荡器
二极管符号是什么?二极管符号怎么看方向?二极管符号正负极判断
东芝电子扩展了其公司指定的“智能功率器件”(IPD) 范围
Synaptics的SYN43711芯片集成了WiFi6E 和蓝牙 5.3
英飞凌推出采用PQFN封装的15V沟槽型功率MOSFET
什么是raid卡?raid卡是干什么的?有什么作用?
什么是UHD?UHD和FHD的区别
混合信号IP行业公司声称推出“世界首款”800G 以太网 DSP
ad620是什么电子元件?ad620的参数/工作原理/引脚图及功能等中文资料
2024年半导体行业会进入一个上升的周期吗?
Nicomatic 为所有DMM连接器引入了新的插接前锁定机制
巩固专业专注优势 加速产品产业创新
Rambus 推出首款 Gen4 DDR5 RCD,内存带宽增加了 50%
什么是热传递?热传递的条件与三种方式
Ampere首席产品官:云计算和人工智能需求,需要新的更高性能处理器
Arbe 发布 48 RX x 48 TX 量产雷达处理器
固态光继电器应对高频、ATE 信号切换的方法
什么是节流阀?节流阀工作原理与作用
电感单位是什么?电感单位换算公式与关系
英特尔推出互联物流平台,有效预防运输隐患
适用于 AI PC 的英特尔 Core Ultra 芯片介绍
TDK超声波 ToF 传感器工作距离可达5米
TDK、LEM 开发基于TMR的电流传感器
什么是双向可控硅?双向可控硅工作原理与作用
MPa是什么单位?PSI是什么单位?压力单位换算表一览
关于雷达和智能物联网的 11 个误解
什么是SOC?SOC是什么意思?
什么是lightning接口?lightning接口和typec接口的区别
TI为小型电源转换器加入 GaN FET 晶体管
研华宣布量产灵活的原生AI模块SOM-6884
Arm推出其最小且最节能的,且具备AI功能的 Cortex-M CPU
美光新的低功耗内存为元宇宙而生
什么是arp攻击?arp攻击原理以及arp断网攻击解决方法
固态硬盘和机械硬盘的区别详解
发烧友使用 AMD Ryzen 的 3D V-Cache 来生产微型、超快的伪 SSD
EMI屏蔽和光学粘合在先进医疗、国防显示技术中有双重作用
芯时光乔迁仪式
成像技术在电子产品质量控制中的作用
金刚石半导体器件具有最高的击穿电压
晶达光电即将推出 EN 50155 平板电脑
SiC 是新型组串式逆变器的关键