solidot新版网站常见问题,请点击这里查看。
AMD 在数据中心大会上公布了 Instinct MI300 系列加速器的最新产品。AMD 在去年宣布了数据中心 APU MI300,在今年初的 CES 展会上公布了更多信息:MI300A 是第一款数据中心/HPC 级 APU 产品,有 1460 亿个晶体管,MI300 包含了 24 个 Zen 4 CPU 核心,CDNA 3 GPU 核心,以及 128GB HBM3 内存。AMD 最新的 MI300 系列加速器 MI300X 是纯 GPU,去掉了 CPU 核心,片上内存增加到 192GB HBM,是专门针对需要大量内存的大语言模型设计的,其内存带宽 5.2 TB/s,晶体管 1530 亿个。AMD 称,128GB MI300A APU 已经开始向客户提供样品,而 192GB MI300X GPU 则要等到第三季度。

AMD 披露了一个 99.99% 的用户都体会不到的处理器 bug:EPYC Rome 芯片会在连续运行 1044 天后崩溃。EPYC Rome 是 2019 年发布的基于 Zen 2 架构的第二代 EPYC 处理器,目前最新的 EPYC 处理器是第四代 Genoa。对于该 bug AMD 表示它无意去修复。该 bug 与处理器核心未能退出 CC6 睡眠状态有关,故障的确切触发时间与扩频和 REFCLK 频率有关。解决该问题有两种,其一是在连续运行 1044 天前重启下,其二是禁用 CC6 睡眠状态。今天的内核补丁可以在不重启的情况下打上,但固件更新等仍然需要强制性重启,因此连续运行 1044 天是极其罕见的情况。

在 CES 2023 上,AMD 宣布了第一款专门配备 AI 引擎的 Ryzen 7040 系列移动处理器。在台北电脑展上,AMD 演示了 Ryzen XDNA AI 引擎。AMD 演示的笔记本是华硕 Strix Scar 17,配备 Ryzen 9 7940HS 处理器,集成 Radeon 780M GPU 核心。XDNA AI 引擎是专用加速器,与 CPU 核心在同一块芯片上,用于执行低强度的 AI 推理工作负荷,如音频、照片、视频处理,其功耗要低于 CPU 和 GPU,比在线服务响应更快,因此能提高性能和节省电池电力。在 Windows 的设备管理器中,XDNA AI 引擎的名字叫 AMD IPU Device。AMD 声称,它的 AI 引擎比苹果 M2 的神经引擎更快。

在最近举行的 Open Compute Project 地区峰会上,AMD 披露用开源的 Open-Source Silicon Initialization Library (openSIL) 取代 AMD Generic Encapsulated Software Architecture (AGESA)固件的计划。新固件将经历四个阶段的开发周期到 2026 年做好投产准备。固件对现代计算机系统至关重要,在 AMD 平台上 AGESA 固件被用于初始化多个子系统,其中包括处理器核心、芯片组和内存。它需要持续更新以支持新硬件和修复 bug。但固件也可能成为网络攻击的一个薄弱环节。AMD 提议的新固件 openSIL 通过将开发、架构和验证开源以增强安全性。它旨在设计成为一种轻量级、简单、透明、安全和易扩展的开源固件。openSIL 不是为了取代 UEFI,而是与其它主机固件如 coreboot 整合,用标准工业语言编写,允许静态链接到主机固件。AMD 计划到 2026 年用 openSIL 淘汰 AGESA。

AMD 公布了 2023 年第一季度的财报,营收 53.53 亿美元,同比下滑 9%,运营利润 25.14 亿美元,同比下滑 29%,净亏损 1.39 亿美元,同比下滑 118%。其中以 CPU 为主的客户事业部亏损最大,一季度营收 7.39 亿美元,同比暴跌 65.2%,营业亏损 1.72 亿美元;游戏事业部营收 17.57 亿美元,同比下降 6.3%,运营利润 3.14 亿美元,同比下降 12.3%;数据中心事业部营收 12.95 亿美元,同比增长 1.5%,运营利润为 1.48 亿美元,同比下降 65.3%;嵌入式事业部营收 15.62 亿美元,运营利润 7.98 亿美元。AMD 预测二季度营收 53 亿美元,误差 3 亿美元。

AMD 正式宣布了用于掌机的芯片 Ryzen Z1 和 Z1 Extreme。华硕的 Windows 11 掌机 ROG Ally 是第一款使用 Z1 系列芯片的产品(暂时是独家使用)。Z1 系列使用 4 纳米工艺制造,其中 Ryzen Z1 Extreme 配备了 8 个 Zen 4 CPU 核心和 12 个 RDNA 3 核心,缓存 24MB,图形性能 8.6 teraflops,接近索尼 PS5 的 10.28 teraflops,远超 Steam Deck 的 1.6 teraflops。Ryzen Z1 配备了 6 个 Zen 4 CPU 核心和 4 个 RDNA 3 核心,缓存 24MB,图形性能 2.8 teraflops。Z1 的原始性能是 Z1 Extreme 的三分之一,但更低的功耗对掌机更有利,而由于带宽和功耗限制,Z1 Extreme 的实际性能达不到 Z1 的两倍以上。

过去几天 Reddit 和 YouTube 用户开始讨论 AMD 最新 Ryzen 7000X3D 系列处理器可能会在电压过高的情况下烧毁的问题。相比标准的 7000 系列,7000X3D 系列 CPU 增加了额外的 3D 缓存,它能显著提升对缓存敏感的计算任务如游戏的性能。但 3D 缓存的一个缺陷是它会增加积热,因此 7000X3D 系列相比标准版默认电压更低,在略微降低单核性能的情况下显著改善了能耗,因此也更省电。7000X3D 系列加压超频的能力要低于标准版。过去几天用户报告的 7000X3D 系列问题被认为与高电压相关。主板制造商微星释出了新 BIOS,限制了增加电压的超频能力,防止处理器出现问题。

桌面平台对内存带宽不特别敏感。桌面办公软件、浏览器甚至游戏,对内存延迟比内存性能更敏感,这是为什么 AMD 认为其 3D V-缓存技术能在游戏上带来巨大收益。服务器和高性能计算任务则极端渴求内存带宽。那么如何提高内存带宽?可以提高时钟频率但有限制,可以在 CPU 上增加更多内存通道但会增加复杂度。可以引入新的内存标准,放宽延迟提高带宽,就像从 DDR2 到 DDR5。还有一种更聪明的方法,发明一种新方式去访问已有的内存——AMD 提出了 HBDIMM,而英特尔提出了 MCR-DIMMs。行业标准组织 JEDEC 已经和 AMD 合作将 HBDIMM 标准化为 MRDIMM。通过在内存和 CPU 之间放置一个多路复用器,MRDIMM 能同时访问两个内存条将数据传输率提高一倍,代价是增加了少许延迟。AMD 公布的一张幻灯片显示,MRDIMMs 能将传输率提高到 17,600 MT/s。

根据从事计算机定制业务的 Puget Systems 提供的数据,2022 年英特尔在 CPU 消费端拿下了逾七成的份额,然而在工作站市场 AMD 占据了 95% 的份额。AMD 在 2021 年是丰收的一年,英特尔的 11 代酷睿处理器无法与 Zen 3 处理器竞争,在消费端 AMD 的市场份额超过了七成。但 2022 年英特尔的 12 代酷睿处理器逐渐收复了消费端的市场,AMD 推出 Zen 4 处理器并没有改变这一趋势,而英特尔也发布了 13 代酷睿。但在工作站市场英特尔的至强处理器对 AMD 的 Threadripper Pro 完全无法构成挑战,两者的销售比接近 1:20。

Zen 2 对于 AMD 而言具有重要意义,它代表着十几年来其 CPU 的单线程性能首次能与英特尔最好的产品不相上下。Zen 2 也开创了桌面 CPU 能最高有 16 个核心的潮流,消费者无需购买 HEDT 平台就能拥有强大的多线程性能。Zen 2 也非常灵活,能满足低功耗需求,以至于 AMD 在发布 Zen 3 后的 2021 年还推出了使用 Zen 2 核心的产品如 Ryzen 7 5700U。梵高 APU 是另一个例子,它是一款独一无二的产品,集成了四个 Zen 2 核心和 RDNA 2 GPU。梵高 APU 不是通用的笔记本芯片,它只用于 Valve 的掌机 Steam Deck,它也没有专有名字,而是自称 AMD Custom APU 0405。Chipsandcheese 发表文章详解了梵高 APU,解释了为什么它的 CPU 性能显著低于同类产品——为了在有限的功率范围内最大化 RDNA 2 GPU 的性能而牺牲了 CPU 性能。

分析师称,索尼是 AMD 公司去年最大的客户,16% 的收入来自于索尼的 PS5 游戏机销售。如果将赛灵思排除在外,那么来自索尼的收入占到了 AMD 总收入的五分之一。AMD 的游戏业务占比最大,它向索尼出售了价值 37.76 亿美元的芯片。而索尼在今年一月的 CES 展会上证实它售出了逾 3000 万台 PS5 游戏机,过去近两个月内可能还售出大约 177 万台。 微软的 Xbox Series X|S 游戏机销量远不如索尼,估计至今出货量 2068 万台。 AMD 过去一年的游戏业务收入 68.05 亿美元,利润 9.53 亿美元,今年游戏机的销量可能会下降,来自索尼和微软的芯片收入预计也会下降。AMD 去年数据中心业务 60.43 亿美元,今年有望成为最大的收入来源。

AMD CEO 苏姿丰(Lisa Su)在 IEEE ISSCC 会议上指出,未来十年计算机领域的最重要挑战将是能效。摩尔定律预测的芯片性能增长速度虽然放缓了,但今天的芯片计算能力仍然能每两年半翻一番,超算翻倍所需的时间更短。然而计算机的能效并没有跟上这一步伐,十年后未来的超算可能需要多达 500 兆瓦的电力。她说,没人真正知道如何实现下一个运算千倍增长的 zetta 级超算,这必定需要全面的改进效率,不仅包括改进芯片的能效,还需要高效的芯片间通信和低功耗的内存访问。苏姿丰谈论了 AMD 在数据中心 APU MI300 上采取的改进能效的众多措施。

AMD 在 2022 年第四季度的财报中披露它的客户端业务(包括桌面 CPU 和 GPU)下降 51%,但相比竞争对手英特尔出现罕见的巨额亏损,AMD 仍然设法获得了少量利润。AMD CEO 苏姿丰(Lisa Su)在投资者电话会议上表示,过去两个季度该公司有意的减少了供应以平衡供需。此举并非是为了部分人所谓的“抬高价格”。AMD 去年第二季度的净利润率是 7%,第三季度只有 2%。AMD 在发布 Zen4 处理器一个多月后就大幅降低了价格。减少供应是为了减少库存,库存的贬值速度要快于实际销售的产品。在疫情结束之后和通货膨胀高涨的情况下,购买 CPU 和 GPU 的人要少得多。减少供应可以避免价格的暴跌利润的消失。

AMD 公布了 2022 年第四季度的财报,净利润大幅下降。截至 2022 年 12 月 31 日的第四季度,AMD 营收为 55.99 亿美元,去年同期为 48.26 亿美元,同比增长 16%;净利润 2100 万美元,去年同期为 9.74 亿美元,同比下降 98%。出现亏损的主要是 PC 客户端业务。数据中心业务营收 16.55 亿美元,同比增长 42%;客户端业务营收 9.03 亿美元,同比下降 51%,运营亏损 1.52 亿美元;游戏业务营收 16.44 亿美元,同比下降 7%; 嵌入式业务因包含最近完成收购的赛灵思,营收 13.97 亿美元同比增长 1868%。AMD 2022 年全年营收 236.01 亿美元,同比增长 44%,净利润 13.20 亿美元,同比下降 58%。

在 CES 2023 上,AMD 演示了一个庞然大物:专为数据中心设计的 APU MI300。AMD 此前的 APU 产品主要是针对消费级,如笔记本电脑和游戏机。MI300 是第一款数据中心/HPC 级 APU 产品,有 1460 亿个晶体管,是 AMD 至今构建的最大最复杂芯片——相比下英特尔 Xeon Max GPU 有 1000 亿晶体管,英伟达 GH100 GPU 有 800 亿晶体管。MI300 包含了 24 个 Zen 4 CPU 核心,未披露数量的 CDNA 3 架构 CU,以及 128GB HBM3 内存。MI300 在 4 个 6 纳米小芯片(chiplets)之上堆了 9 个 5 纳米小芯片。相比 MI250X,MI300 的 AI 训练性能是其 8 倍以上,产品将在今年下半年上市。

在 CES 2023 上,AMD 宣布了第一款专门配备 AI 引擎的 Ryzen 7040 系列移动处理器。该 AI 引擎来自于 AMD 前不久收购的 FPGA 开发商赛灵思公司。AI 引擎是一种可为不同应用配置的加速器。7040 系列芯片使用 4 纳米工艺制造,晶体管数量逾 250 亿,电池续航超过 30 小时。首款配备该处理器的笔记本电脑预计将今年 3 月上市。

在 CES 2023 上 AMD 宣布了三款采用 3D 缓存的 Ryzen 7000 系列处理器。AMD 的第一代 3D 缓存处理器是基于 Zen3 架构的 Ryzen 7 5800X3D,它证明在对高缓存需求的游戏上具有卓越的表现。第二代则是基于 Zen4,包括:Ryzen 9 7950X3D、Ryzen 9 7900X3D 和 Ryzen 7 7800X3D。其中 7950X3D 的 L3 缓存 128MB,L2 和 L3 缓存共 144MB;7900X3D 的 L3 缓存 128MB,L2 和 L3 缓存共 140 MB;7800X3D 的 L3 缓存 96 MB,L2 和 L3 缓存共 104 MB。AMD 的测试显示,7800X3D 相比上一代的 5800X3D,游戏性能至少提升 21%。三款产品预计将在 2 月份发售,具体时间尚未宣布。

AMD 开源了它的 Radeon 开源光线追踪分析器 Radeon Raytracing Analyzer (RRA),该工具旨在帮助开发者改进光线追踪性能。AMD 是在今年夏天宣布了 RRA,但 RRA 1.0 最初发布时只提供了二进制包,现在正式公布了其代码,源代码托管在 GitHub 上,采用 MIT 许可证,支持 Windows 和 Linux,其中 Linux 主要针对的是 Ubuntu 发行版。构建 RRA 需要 Qt 5.15。

AMD 宣布了第四代 EPYC Genoa 服务器处理器,英特尔的同类新产品还要到明年初才宣布。Genoa 采用 5nm 工艺制造,核心数最多可达 96 个,支持 12 通道 DDR5 内存,支持 PCIe 5.0,支持 CXL,支持 AVX-512。Genoa 的性能提升至上一代的 1.9 倍。AMD 将英特尔第三代至强 8380 40 核处理器作为参照基准,96 核 EPYC 9654 的云计算性能是其 3 倍。Phoronix 测试了 EPYC 9554 和 EPYC 9654 在 Linux 下的性能。

AMD 新发布的 Ryzen 7000 系列处理器在性价比上明显落后于竞争对手英特尔的 13 代酷睿处理器,而且 7000 系列处理器还需要新一代的主板和 DDR5 内存条,13 代酷睿可以沿用上一代的主板和 DDR4 内存条。在电商平台京东上,Ryzen 7000 系列大幅降价,其中最高端的 7950X 最高降价 1500 元,从原来的 5499 元降至 3999 元,暂时不清楚是永久性降价还只是双 11 购物节活动。如果用户此前在京东上以原价购买 7000 系列处理器,可以获得保价,获得退款。这一保价可能不适用于其它渠道购买的消费者。