Notebookcheck Logo

采访 | "我们的大中核比他们的小核更出色",AMD 的 Ben Conrad 谈论了 Ryzen AI APU 背后的一些设计决策,以及 Strix Halo 的优势所在。

AMD 的 Ben Conrad 深入探讨了全新 Ryzen AI 300 系列 APU 的几个关键方面。(图片来自 LinkedIn)
AMD 的 Ben Conrad 深入探讨了全新 Ryzen AI 300 系列 APU 的几个关键方面。(图片来自 LinkedIn)
AMD 在 CES 2025 上发布了多款全新 Ryzen AI APU,涵盖 Strix Point、Kraken Point、Fire Range HX3D 和 Strix Halo 产品线。我们采访了 AMD 的 Ben Conrad,讨论了这些 APU、它们的设计初衷,以及它们对 AMD、OEM 合作伙伴和 2025 年笔记本电脑买家的意义。
AMD Ryzen (Zen) Zen 5 Laptop / Notebook

AMD 在 2025 年的 CES 上发布了一系列新硬件,忙得不亦乐乎。其中包括 Ryzen 9 9950X3D台式机 CPU、 Ryzen 9 9955HX3D 和其他 Fire 系列 APU,抢先体验 RDNA 4、全新 Ryzen AI 300 和 200 系列 APU 以及旗舰产品 Ryzen AI Max Strix Halo.

在活动间隙,Notebookcheck 的 Vaidyanathan Subramaniam(VS)采访了 AMD 高级移动客户端产品管理总监 Ben Conrad,讨论了新 Ryzen APU 的发布、它们对 AMD 相对于竞争对手的意义,以及移动市场未来可能的发展方向。

简要说明:AMD 通过 Strix Point 和 Strix Halo 展示乐观精神

以下是我们从与本的互动中获得的信息摘要。访谈全文如下:

  • Ryzen AI 300 系列为各种需求的用户提供了完整的产品组合。
  • 所有 Ryzen AI 300 系列和 Ryzen AI 200 系列都与之前发布的 Strix Point 兼容。
  • 没有将 Ryzen AI 300 和 200 系列引入 Chromebook 的计划。
  • AMD 采用 Zen 5 和 Zen 5c 内核的 "大中间 "实现方式比竞争对手的 P 核/E 核方式更有优势,几乎没有调度方面的损失。
  • Strix Halo Ryzen AI Max 采用了与台式机 Ryzen 9000 和 Fire Range HX 3D 部件相同的 "经典 "Zen 5 核心。
  • Strix Halo 源自台式机,采用 AVX-512,但采用了不同的互连技术,针对功耗进行了优化。
  • Strix Halo 的 RDNA 3.5 提供与 RTX 4070 相当的内存带宽和 32 MB Infinity Cache。有意识地决定不选择封装内存。
  • Ryzen AI APU 使用更好的 SmartShift 算法,针对功耗预算进行了优化。
  • Strix Halo 不支持 dGPU,CPU 只有 12 条 PCIe Gen 4 通道。也将应用于迷你 PC。
  • Ryzen AI Max 将内存速度提高一倍,达到 LPDDR5-8000,并提供与 RTX 4070 相似的带宽。
  • 目前没有 Dragon Range Refresh 的计划,但不排除未来 Fire Range Refresh 的可能性。
  • RDNA 4 将只专注于台式机,但未来的移动 dGPU 和 APU 肯定是有可能的。
  • 随着时间的推移,还计划将 NPU 功能带到更低的价位。

Ryzen AI 的明显优势

VS:感谢您抽出时间,Ben。首先,让我们谈谈 AMD 如何看待自己发布的新产品、他们的市场定位以及对竞争对手的看法,尤其是在笔记本电脑领域。

Ben:总体而言,AMD 具有巨大的潜力。我们已经推出了 Ryzen AI 300,并将其扩展到 Ryzen AI 7 和 Ryzen AI 5 SKU。我们还有面向高端游戏和工作站(笔记本电脑)的 Ryzen 9 9955HX3D。此外,我们还推出了颠覆性的 Ryzen AI Max,用于轻薄型游戏机和轻薄型工作站--可谓是集万千宠爱于一身。

与我们的竞争对手相比,Ryzen AI 300 系列就像一把瑞士军刀。它附带 dGPU,因此支持轻薄游戏。如果你看重系统更换或添加内存的能力,它支持 DDR5 扩展,而这正是竞争对手所缺乏的。最后,在游戏系统中,它还提供 Copilot+。

所有这些都使它独一无二。我们的竞争对手不得不推出多款产品来覆盖同一领域,而我们的 300 系列却能做到这一切。在此基础上,我们还推出了 Ryzen AI Max 等超酷、超炫的产品。

对于我们的笔记本电脑 OEM 客户来说,我们还有一个兼容性包。所有的 300 系列,包括我们在夏天推出的 Strix Point 和现在推出的 Kraken Point,都是套装兼容的,可以在同一系统中提供。所有基于 Hawk Point Zen 4 的 Ryzen 200 系列也都是套装兼容的。

AMD Fire Range HX3D。(图片来源:AMD)
AMD Strix Point Ryzen AI 7 和 Ryzen AI 5(图片来源:AMD)
AMD Kraken Point Ryzen 200 系列。(图片来源:AMD)

因此,我们提供了多种价位的系统--具有强大图形处理能力的 Copilot+ 和 AI,一直到 N 减去一个仍然很棒、在市场上仍有相当竞争力的产品。

如果购买者看重该平台的机箱功能,并希望价格(更低),我们有 200 系列;如果购买者希望获得 AI 的未来功能和 300 系列的所有功能,我们也有 300 系列。这就是灵活性。

VS:你们是否会像我们看到的 Ryzen 7020C 系列那样,为基于这些平台的 Chromebook 提供任何精简产品?

Ben:我们没有计划在 Chromebook 中使用 300 系列。

VS:那 200 系列呢?

:我认为我们也没有 200 系列(Chromebook)的计划。

AMD 通过 Zen 5 和 Zen 5c 实现大中间方案

VS:高端 SKU 是混合使用 Zen 5 和 Zen 5c 还是全部使用 Zen 5?这些内核之间的根本区别是什么?

Ben:这是一个很好的问题。300 系列中的许多 SKU 都混合使用了 Zen 5 "经典 "和 Zen 5 "紧凑"。我们的竞争对手在很多系统中都采用了 "小核心大军法",以获得多线程基准。

因此,你有很多小核,但这些小核可能与 ISA 不兼容,当你需要在核之间移动进程时,可能需要进行一些转换。这就是 ARM 所说的 big.LITTLE。我将我们的方法称为 "大中间"。我们的紧凑型内核使用相同的指令集,性能远远高于其他的超低内核。

因此,在功耗受限的平台上,一个线程的最高提升频率是有限的。你不可能让几乎每台笔记本电脑上的每个内核都同时以最高频率运行。因此,这些紧凑型内核的最高频率通常会稍低一些。但这几乎不会造成任何损失,因为如果是单线程情况,你可以提升其中一个经典内核的频率。

这些紧凑型内核处于安全区域,因此我们可以利用其他 IP 做一些有趣的事情。在我们希望采用低功耗内核的情况下,它们还能提供不同的性能曲线。

这些(紧凑型内核)的关键在于,它们在较低频率下的性能几乎与经典内核相同,而且,你知道,它们不会扩展到较高的频率,这不会对系统产生真正的影响,因为你已经在经典内核中实现了单线程扩展。

Ryzen AI 7 和 Ryzen AI 5 规格。(图片来源:AMD)
AMD Zen 5 和 Zen 5c 缩放。(图片来源:AMD)

英特尔线程总监与 AMD 想法的比较

VS: 所以,你是说操作系统基本上不把它们视为不同的 ISA。这意味着,至少在理论上,很多潜在的调度问题应该可以得到缓解?

Ben:操作系统的确会把它们视为异构内核,但调度不完善的惩罚要低得多。

VS:好的。关于调度方面,或者说你如何确定线程在哪个内核上的优先级,用户能否有一个前端来控制它?我只是想给你提供一些背景信息,你的竞争对手有一种叫做线程总监(Thread Director)的东西。这里的逻辑由 CPU 决定。但很多时候,我们发现如果将某个游戏或基准测试放在 E 核上,分数就会下降,除非你能用第三方工具手动覆盖这一点。

AMD 是否有计划在 BIOS 或 Ryzen Master 中为希望控制线程的专业用户提供控制?我相信处理器将始终提供基本的线程控制。但如果是像 Discord 这样的程序,我只想把它推到 Zen 5c 内核上,这可能吗?

Ben:我们的竞争对手需要 Thread Director,因为内核之间存在巨大差异。因此,如果你不能很好地运行,就会有非常糟糕的体验。实际上,有些游戏会检测有多少个大内核,并只为这些内核生成线程,因为绕过所有其他内核会受到惩罚。有几款游戏会根据系统评估的大核数量生成不同数量的线程。

英特尔月湖中的线程总监。(图片来源:英特尔)
英特尔称 AMD 没有类似的产品。(图片来源:英特尔)

在 AMD 上发生这种情况的几率要低得多。我相信你确实有一些设置线程亲和性的功能,可以帮助你解决这个问题。我并不了解我们可以进行定制的所有软件功能。如果我们能找到一位内部软件产品经理为您提供最佳答案,我们可能会重新回复。

英特尔在解释 Thread Director 是怎么回事时,对 AMD 缺乏类似的机制进行了猛烈抨击。

VS:在目前已公布的产品组合中,是否有高端 SKU 采用 Zen 5c?我相信Ryzen AI Max都是Zen 5?

它还采用了 AVX-512,所以这是 Ryzen AI Max 中的服务器级功能,采用了所有经典内核。这已经是最大值了;我们把所有的东西都用在了这上面,所以性能达到了最大值,你知道,同样的 16 个经典内核在 9950X3D 和 Fire Range 9955HX3D 中都有。现在,同样的性能被扩展到这些平台所能达到的外形尺寸中。

VS:Fire Range 本质上是否只是将台式机部件封装到笔记本电脑芯片中,还是有其他针对移动设备的增强功能?我相信 9955HX3D 的功耗是 140 瓦,而 9950X3D 则高达 170 瓦?

Ben:是的,这是相同的芯片,所以你是对的。这是分档、软件、调整、不同的封装--这些都是区别产品的不同之处,但它使用的是与台式机上的 9950 相同的基础。

AMD Ryzen AI Max 规格。(图片来源:AMD)
AMD Ryzen 9000HX3D Fire Range 规格。(图片来源:AMD)

Strix Halo Ryzen AI Max 背后的设计决策

VS:我相信 Fire 系列笔记本电脑不会使用 Copilot+ 品牌,因为上面没有宣传的 NPU?在台式机方面,如果我没记错的话,Lisa Su 博士在主题演讲中说我们有 AVX-512,它可以加速人工智能工作负载,但台式机上没有专用的 NPU。

:台式机和 Fire Range 都没有专用的 NPU。我们绝对相信 NPU 是未来的趋势。我预计 AMD 和业内其他厂商都会将 NPU 带到这些功能中。但就目前而言,台式机和 Fire Range 的一个特点是,它们基本上 100% 采用 dGPU。因此,dGPU 中包含了大量的人工智能。

我们首先将 NPU 专注于 UMA 平台。或者说,那些混合了功耗受限的笔记本电脑的平台。因此,我们的 NPU 种类繁多,我想这是所有供应商中最好的。

VS:这提醒了我,说到 UMA,你认为与Apple 硅相比,256 GB/s 的内存带宽是否足够?这个带宽是否足以在 IP 之间来回推动数据?另外,为什么没有封装内存?

Ben:Ryzen AI Max 使用的 LPDDR5 芯片是 Ryzen 300 系列或我们竞争对手 128 位总线芯片的两倍。因此,这是个大芯片,封装也会变得巨大。我们从客户那里听到的是,他们喜欢购买内存的灵活性,喜欢自己做决定,而不是我们说你有两个选择,要么这样,要么那样。因此,我们在设计时决定不在封装上包含内存。

至于带宽,由于我们将总线宽度增加了一倍,因此以 LPDDR5-8000 的速度计算,每秒可达 256G。这与 RTX 4070 完全相同。在我们要完成的地方,我们的带宽完全相同,所以绝对是的。如果我们只是在 APU 上安装了更多显卡,而没有将内存带宽翻倍,那么它将受到极大限制。

所以,我们的架构师不会只看一个 IP,就把这里的数字提高。你必须着眼于整个系统,确保拥有足够的带宽和功率。我们确实有 32 MB 的 Infinity 高速缓存,有点像芯片上的 4 级高速缓存。这与 Radeon 图形处理器的 Infinity Cache 非常相似。

VS: Infinity Cache 位于 Radeon 8060S 和 CCD 之间?

Ben:缓存位于芯片的其他部分和内存接口之间。因此,它基本上是最后一级缓存,类似于我们 dGPU 上的 Infinity Cache 机制,它位于 GPU 和 GDDR6 内存之间。

VS:你认为 Strix Halo 还能采用其他外形尺寸吗,比如迷你 PC?

Ben:当然可以。我们(在 CES 上)有几款小型台式机。让我感到惊讶的是,有这么多人和原始设备制造商都对这种小尺寸台式机感到兴奋。

AMD Strix Halo Ryzen AI Max。(图片来源:AMD)

VS:在 Ryzen AI Max 中,CPU 和 RDNA 3.5 GPU 之间有什么样的互连?我们有类似 Infinity fabric 和 SmartShift 的东西吗?

Ben:我们内部称其为 DDR SSP。我得搞清楚这个内部品牌是否与台式机芯片中使用的品牌不同,因为我们对该互连进行了功耗优化。当你拿起 Strix Halo 芯片时,你会发现 CCD 非常靠近 I/O 芯片。正因为如此,我们能够节省多瓦特的功耗,这也是我们打造 Strix Halo 的初衷,即真正的低功耗高性能。因此,这是一种不同的互连方式,与我们的台式机芯片的 CCD 硅片并不相同。

有了 SmartShift,你就有了 APU 和 dGPU 这两个独立的芯片,功率在两者之间来回切换。当感觉到 dGPU 的功率已经达到极限时,它就会说,让我们把这些功率分配给它吧。APU 已经使用了 SmartShift - 我们的 SmartShift 技术是基于软件的,它处于这两个芯片之间的固件层。

我们的 APU 可以有效地实现智能平移,在硬件层面的 IP 之间共享功率,因为它们是一个封装。我们的 APU 一直拥有更好、更快的思维,每秒多次决定电能的去向。

因此,是的,实际上我们还没有在 Ryzen AI Max 中将其命名为 SmartShift,但 APU 硬件的固有特性已经实现了这一点。

VS:这会渗透到堆栈中的所有 APU 中吗?

Ben:当然。每个 APU 都会根据需要分配功率。如果 dGPU 和内核都有需求,它就会查看哪个需求更大,然后分配给哪个。

VS:关于这一点,OEM 厂商是否可以在使用 Ryzen AI Max 的同时提供 dGPU,比如 Radeon dGPU?

Ben:Ryzen AI Max 不支持附加 dGPU。既然我们已经有了 dGPU 级 APU,那就真的没有理由了。你知道,你不能让它们交火,所以没有必要同时打开它们。老实说,为什么原始设备制造商会购买这种解决方案,然后再安装一个 dGPU,因为现在你的外形与现有的游戏机外形相同。

VS:在这种情况下,如何充分利用 CPU 的 PCIe 通道?我相信很多通道都是空闲的,因为大多数(超薄)设计几乎都没有一到两个固态硬盘,而且原始设备制造商往往不会在这些机箱中提供存储扩展空间,所以你并没有充分利用 PCIe 带宽。

Ben:这些芯片上有 PCIe Gen 4。Ryzen AI Max 提供 12 条 PCIe Gen 4 通道,而我们一般的 APU(附加 dGPU)有 16 到 20 条通道。因此,我们将其削减的原因是,dGPU 通常使用 8 条通道。由于我们没有附加 dGPU,20-8 就变成了 12。我们确实希望能够支持双固态硬盘和其他一些 I/O,我认为我们的一些工作站客户会利用这一点。

VS:那么,一种可能性是,你能否将 USB4 连接到该芯片组,而不是芯片组?

:我得确认一下。通常在这种小型机中,你知道,没有 PCIe 桥接芯片或任何东西。你只想使用 APU 来获得这种尺寸。

产品命名和未来展望

VS:是否还有新的 Dragon Range Refresh 芯片?

Ben:我认为不太可能。我认为我们目前不会宣布 Dragon Range 系列的任何新产品。

VS:这是否意味着你们仍将继续销售去年销售的芯片?

:当然。即使APU不在我们目前的路线图中,如果OEM厂商仍在使用以前的设计构建系统,那也是绝对的。多年来,销售现有产品的故事由来已久。这并不像设计一个新的系统,但是,嘿,这个系统卖得很好,所以它做得很好,而且会继续下去。

VS:这意味着,虽然不是官方说法,但你并不完全排除我们可能会看到采用新命名方案或类似方案的更新版芯片?

:你知道,在我们的命名方案中,我们希望让客户很容易做出决定。有时,我们会看到像 200 系列这样的更新产品。这在很大程度上是一个更新的产品系列。这不是全新的产品。但原因是,如果客户拥有一个 300 系列和一个 8000 系列,他们会觉得很奇怪......等等,8000 比 300 少,这不合理!这就是部分原因。

在这一代产品中,我们希望品牌能够保持一致并易于理解。现在的品牌基本上都是三位数,数字越大越好。所以,200 是 Hawk,然后,你知道,到了 300,你就会看到 Strix Point 和 Kraken,还有最上面的 Max。这就是一贯的品牌战略。我认为,在 Fire Range 发布会上,我们也会在这一领域有所作为。

VS:我的意思是,诚然,"Ryzen.AI.9.300.Max.Plus "这个芯片的全名并不总是那么容易发音!

:我想我们中的一些人,你知道,让我说说在 AMD 领域,我们有这么多产品,所以这很难。我们希望产品保持一致,与众不同,让消费者知道。所以,老实说,当消费者走进零售店,我认为他们看到的是 Copilot+,看到的是 9、7、5、3。他们看的不是确切的型号。

我们都是(指发烧友)非常内行的人,对吧?你想知道每一个细节,所以我认为这就是差异的一部分。

VS:你认为 RDNA 4 笔记本电脑的前景如何?不幸的是,基于 AMD dGPU 的笔记本电脑 SKU 数量一直很低迷。

Ben:我们目前的图形战略重点是 RDNA 4 的台式机市场。当然,RDNA 4 和未来的图形技术将进入移动市场,无论是 APU 还是未来的产品。

VS:这可能是未来派的说法,但我们听说 RDNA 和 CDNA 将结合在一起。

Ben:是的,所以这是一个将两者统一起来的长期项目,实际上我个人对此非常兴奋,因为 ML 的重点实际上是客户市场的长期发展方向。因此,大家都朝着同一个方向前进,我认为这将是非常积极的。

VS:好的,最后一个问题,这也是我最讨厌的问题之一。在低端市场,我认为还有很大的发展空间,因为并不是每个人都需要非常高端的芯片。像基本的 1080p 编辑,现在大多数芯片都能做到。为什么 AMD 不把重点放在 Ryzen 3 上,因为你知道,你提供的是整个堆栈的 50 TOPS NPU。为什么不在 GPU 方面也这样做呢?或者利用 NPU 本身的优势,为我们提供一款入门级产品,让我们可以在上面完成基本的内容创作等工作。

或者可以做得更低。就像你知道的,有一款名为 Ryzen Embedded R1606G,我们在一两款迷你 PC 中看到过它。

:所以,我们确实有计划随着时间的推移,将 NPU 带到市场上更好的价位。我认为业界也正朝着这个方向发展。因此,我们绝对希望为每一位消费者提供 Copilot+ PC、支持 NPU 的人工智能体验。你只需看看这些产品的经济性和价位,这只是一个芯片领域,好吧,我们能在上面放什么。

比如,我们可以把内存接口降到 64 位。但这会对系统的其他部分产生什么影响?这种性能至少需要多少个内核?我想,在过去的两年里,NPU 已经不再是一个附属品。它是我们需要重点关注的三大 IP 之一。因此,我们绝对会努力在所有分部中合理调整这三者的规模。

资料来源

拥有

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 01 > "我们的大中核比他们的小核更出色",AMD 的 Ben Conrad 谈论了 Ryzen AI APU 背后的一些设计决策,以及 Strix Halo 的优势所在。
Vaidyanathan Subramaniam, 2025-01-26 (Update: 2025-01-26)