Entrevista | "Ben Conrad, da AMD, fala sobre algumas das decisões de design por trás das APUs Ryzen AI e o que faz a Strix Halo funcionar
A AMD teve uma CES 2025 movimentada, com uma série de anúncios de novos hardwares. Isso inclui o Ryzen 9 9950X3D cPU para desktop, Ryzen 9 9955HX3D e outras APUs da linha Firee uma prévia do RDNA 4as novas APUs Ryzen AI 300 e 200 Series, e o carro-chefe Ryzen AI Max Strix Halo.
Paralelamente ao evento, Vaidyanathan Subramaniam (VS), da Notebookcheck, conversou com Ben Conrad, diretor de gerenciamento de produtos para clientes móveis premium da AMD, para falar sobre os novos lançamentos de APUs Ryzen e o que eles significam para a AMD em relação à concorrência, e a direção que o mercado móvel provavelmente tomará nos próximos dias.
TL;DR: A AMD exala otimismo com a Strix Point e a Strix Halo
Aqui está um resumo rápido do que obtivemos de nossa interação com Ben. A entrevista completa segue abaixo:
- O Ryzen AI 300 Series oferece um portfólio completo para usuários de todos os requisitos.
- Todos os Ryzen AI 300 Series e os Ryzen AI 200 Series são compatíveis com os pacotes dos lançamentos anteriores do Strix Point.
- Não há planos de levar as séries Ryzen AI 300 e 200 para Chromebooks.
- A implementação "big Middle" da AMD com núcleos Zen 5 e Zen 5c é uma aposta melhor do que a abordagem P-core/E-core da concorrência, com pouca ou nenhuma penalidade de agendamento.
- O Strix Halo Ryzen AI Max usa os mesmos núcleos Zen 5 "clássicos" das peças Ryzen 9000 e Fire Range HX 3D para desktop.
- O Strix Halo é derivado do desktop e apresenta o AVX-512, mas conta com diferentes interconexões otimizadas para energia.
- O RDNA 3.5 da Strix Halo oferece largura de banda de memória equivalente a uma RTX 4070, juntamente com 32 MB de Infinity Cache. Decisão consciente de não optar pela memória on-package.
- As APUs Ryzen AI usam um algoritmo SmartShift melhor, otimizado para orçamentos de energia.
- A Strix Halo não é compatível com dGPUs e apresenta apenas 12 pistas PCIe Gen 4 da CPU. Também estará disponível para mini PCs.
- O Ryzen AI Max dobra as velocidades de memória para LPDDR5-8000 e oferece largura de banda semelhante à da RTX 4070.
- No momento, não há previsão de atualização da linha Dragon, mas não se descarta uma futura atualização da linha Fire.
- O RDNA 4 se concentrará apenas no desktop, mas futuras dGPUs e APUs móveis são uma possibilidade definitiva.
- Há planos de levar os recursos de NPU para faixas de preço mais baixas ao longo do tempo.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros
A aparente vantagem da IA do Ryzen
VS: Obrigado pelo seu tempo, Ben. Vamos começar falando sobre como a AMD se vê com os novos anúncios, seu posicionamento no mercado e suas ideias sobre a concorrência, especialmente no segmento de laptops.
Ben: O quadro geral é de grande potencial. Temos o Ryzen AI 300, que estamos expandindo para os SKUs Ryzen AI 7 e Ryzen AI 5. Também temos o Ryzen 9 9955HX3D para jogos e estações de trabalho (laptops) de ponta. Depois, temos o revolucionário Ryzen AI Max para jogos leves e finos e estações de trabalho leves e finas - uma espécie de sistema com o melhor de tudo.
Em comparação com nossos concorrentes, o Ryzen AI 300 Series é um canivete suíço. Ele tem dGPU acoplada, portanto, é compatível com jogos finos e leves. Se o senhor valoriza a capacidade de substituir ou adicionar memória ao seu sistema, ele suporta a expansão DDR5 que falta aos concorrentes. Por fim, nos sistemas de jogos, ele também oferece o Copilot+.
Todos esses aspectos o tornam único. Nossos concorrentes estão tendo que lançar vários produtos para cobrir a mesma área, enquanto nós conseguimos fazer tudo isso com a série 300. E, além disso, fazemos coisas legais e malucas como o Ryzen AI Max.
Uma outra contribuição para nossos clientes OEM em laptops é que temos uma história de compatibilidade de pacotes. Todas as séries 300, incluindo a Strix Point, que lançamos no verão, e a Kraken Point, que estamos lançando agora, são compatíveis com pacotes e podem ser oferecidas no mesmo sistema. Todos os Ryzen 200 Series que são baseados no Hawk Point Zen 4 também são compatíveis com pacotes.
Assim, oferecemos um sistema em várias faixas de preço - Copilot+ e AI com enormes recursos gráficos, até o N menos um produto que ainda é excelente e ainda compete muito bem no mercado.
Se o comprador valorizar os recursos de chassi dessa plataforma e quiser um preço (mais baixo), temos a Série 200 e, se ele quiser a proteção futura da IA e todos os recursos da Série 300, também temos isso. Há flexibilidade.
VS: O senhor está oferecendo algum produto destilado para Chromebooks com base nesses produtos, como o que vimos com a série Ryzen 7020C?
Ben: Não temos planos para a série 300 em Chromebooks.
VS: E quanto à série 200?
Ben: Acho que também não temos planos para a 200 (para Chromebooks).
A abordagem Big Middle da AMD com o Zen 5 e o Zen 5c
VS: Os SKUs de ponta vêm com uma mistura de Zen 5 e Zen 5c ou é tudo Zen 5? Qual seria a diferença fundamental entre esses núcleos?
Ben: Essa é uma ótima pergunta. Muitas das SKUs da série 300 oferecem uma combinação de Zen 5 "clássico" e Zen 5 "compacto". Nossos concorrentes estão usando a "abordagem do exército de pequenos núcleos" em muitos de seus sistemas para obter um benchmark multi-threading.
Portanto, o senhor tem vários núcleos minúsculos que podem não ser compatíveis com ISA, ou seja, pode haver alguma tradução quando for necessário mover o processo entre os núcleos. Vamos chamar isso que a ARM chama de big.LITTLE. Eu chamaria nossa abordagem de "big Middle". Os núcleos compactos que temos usam o mesmo conjunto de instruções e um desempenho muito mais alto do que os núcleos super, super baixos dos outros.
Assim, em uma plataforma com limitação de energia, o senhor tem uma frequência máxima de aumento para um thread. O senhor não pode executar todos os núcleos em quase todos os laptops nessa frequência máxima ao mesmo tempo. Portanto, esses núcleos compactos geralmente têm uma frequência máxima um pouco menor. Mas quase não há penalidade porque, se o senhor estiver em um cenário de um thread, poderá aumentar um dos núcleos clássicos.
Esses núcleos compactos estão em uma área segura, portanto, podemos fazer coisas interessantes com outros IPs. Eles também oferecem uma curva de desempenho diferente nos casos em que queremos que o processo esteja em um núcleo de menor potência, mas essa é essencialmente a história.
Não é uma tradução muito grande para e entre eles, e o principal aspecto desses (núcleos compactos) é que eles funcionam quase como um núcleo clássico em frequências mais baixas e, então, o senhor sabe, eles não escalam para as frequências mais altas, o que realmente não afeta o sistema porque o senhor tem o escalonamento de um thread nos núcleos clássicos.
Intel Thread Director em relação à ideia da AMD
VS: Então, o senhor está dizendo que o sistema operacional essencialmente não os vê como um ISA diferente. Isso significa que, em teoria, pelo menos, muitos dos possíveis problemas de agendamento devem ser atenuados?
Ben: O sistema operacional os vê como núcleos hetero, mas as penalidades por não ser perfeito no agendamento são muito menores.
VS: Certo. Com relação ao aspecto do agendamento ou à forma como o senhor prioriza o thread em relação ao núcleo a ser utilizado, o usuário pode ter um frontend para controlar isso? Só para dar ao senhor um pouco de contexto, seu concorrente tem algo chamado Thread Director. O que acontece aqui é que a lógica é decidida pela CPU. Mas, muitas vezes, descobrimos que, se ele estaciona um determinado jogo ou um benchmark nos núcleos E, as pontuações caem, a menos que o senhor possa substituir isso manualmente com ferramentas de terceiros.
A AMD tem algum plano para dar controle aos usuários profissionais que gostariam de brincar com os threads, seja no BIOS ou com o Ryzen Master? Acredito que um controle de thread básico sempre estará presente no processador. Mas se for um programa como, por exemplo, o Discord, e eu quiser apenas empurrá-lo para o núcleo do Zen 5c, isso seria possível?
Ben: Nosso concorrente precisa do Thread Director por causa da enorme diferença entre os núcleos. Portanto, se o senhor não tiver isso funcionando bem, terá uma experiência muito ruim. Na verdade, existem jogos que detectam quantos núcleos grandes existem e só geram threads para esses núcleos devido à penalidade de contornar todos os outros núcleos. Há vários jogos no mercado que geram diferentes números de threads com base na contagem de núcleos grandes que eles avaliam no sistema.
A penalidade novamente na AMD é muito menor se isso acontecer. Acredito que o senhor tenha alguns recursos para definir a afinidade de thread para ajudar onde ela está. Não estou realmente atualizado sobre todos os recursos de software que temos para fazer a personalização. Provavelmente teremos que reverter a situação se pudermos tentar encontrar um gerente de produto de software interno que possa lhe dar a melhor resposta.
Para fins de contextualização, a Intel criticou a falta de um mecanismo semelhante da AMD ao explicar o que é o Thread Director.
VS: No portfólio que foi anunciado agora, temos o Zen 5c em alguma das SKUs de ponta? O Ryzen AI Max, acredito, é todo Zen 5?
Ben: Certo, o Max é todo Zen 5. Ele também tem AVX-512, portanto, esse é um recurso de nível de servidor que está no Ryzen AI Max com todos os núcleos clássicos. Esse é o máximo; colocamos tudo o que tínhamos nele, portanto, o desempenho máximo, o senhor sabe, os mesmos 16 núcleos clássicos estão disponíveis no 9950X3D e no Fire Range 9955HX3D. Essa mesma capacidade agora é dimensionada em fatores de forma que essas plataformas podem atingir.
VS: O Fire Range é essencialmente apenas uma peça de desktop colocada em um chip de laptop ou há outros aprimoramentos específicos para dispositivos móveis? Acredito que o 9955HX3D tem 140 W, enquanto o 9950X3D tem até 170 W?
Ben: Sim, é o mesmo silício, e o senhor está certo. É o binning, há software, há ajuste, há um pacote diferente - essas são as diferenças que diferenciam esse produto, mas ele usa a mesma base que alimenta o 9950 no desktop.
Decisões de design por trás do Strix Halo Ryzen AI Max
VS: Os laptops Fire Range não receberão a marca Copilot+, acredito, porque não há NPU sendo anunciada neles? Em relação aos desktops, se me lembro bem, a Dra. Lisa Su disse durante a apresentação que temos o AVX-512, que deve acelerar as cargas de trabalho de IA, mas não há NPU dedicada como tal no desktop.
Ben: Nem os desktops nem o Fire Range têm NPUs dedicadas. Acreditamos absolutamente que a NPU está no futuro. Eu esperaria que as tendências da AMD e de outras empresas do setor trouxessem NPUs para esses recursos. Mas, até o momento, uma característica do desktop e do Fire Range é que eles têm basicamente 100% de dGPU conectada. Portanto, o senhor tem uma enorme quantidade de IA na dGPU.
Primeiramente, concentramos nossa NPU em plataformas UMA. Ou o senhor sabe, plataformas que têm uma mistura de laptops com restrição de energia. Esse foi o motivo, e temos uma enorme variedade de NPUs, acho que a melhor de todos os fornecedores.
VS: O que me faz lembrar, falando em UMA, o senhor acha que 256 GB/s deve ser uma largura de banda de memória suficiente em comparação com, digamos, o silício Apple? Essa largura de banda é suficiente para realmente empurrar os dados para frente e para trás entre os IPs? E, como um adendo, por que o senhor não tem memória no pacote para esses dispositivos?
Ben: Então, o Ryzen AI Max usa literalmente o dobro de chips LPDDR5 da série Ryzen 300 ou de nossos concorrentes com um barramento de 128 bits. Portanto, são chips grandes e o pacote seria gigantesco. O que ouvimos de nossos clientes é que eles gostam da flexibilidade de poder comprar memória e tomar suas próprias decisões, e não de nós dizermos que o senhor tem duas opções, que tem isso ou aquilo. Portanto, essa foi uma decisão de design de não incluir a memória no pacote.
Quanto à largura de banda, já que dobramos a largura do barramento, em velocidades LPDDR5-8000, ela é de 256 gigas por segundo. E isso é idêntico ao da RTX 4070. No local em que estamos tentando completar, temos exatamente a mesma largura de banda, portanto, com certeza. Se tivéssemos colocado muito mais gráficos na APU e não tivéssemos dobrado a largura de banda da memória, ela seria extremamente limitada.
Portanto, o senhor sabe, nossos arquitetos não analisam apenas um IP e aumentam o número aqui. O senhor precisa analisar todo o sistema e certificar-se de que tem a largura de banda e a potência. Temos 32 MB de Infinity Cache, uma espécie de cache de nível 4 no chip. Isso é muito semelhante ao Infinity Cache dos gráficos Radeon.
VS: Esse Infinity Cache está entre o Radeon 8060S e o CCD?
Ben: Esse cache fica entre o restante do chip e a interface de memória. Portanto, é basicamente um cache de último nível semelhante ao mecanismo do Infinity Cache em nossas dGPUs, onde fica entre a GPU e a memória GDDR6.
VS: O senhor acha que a Strix Halo também pode ser usada em outros formatos, como um mini PC?
Ben: Com certeza. Temos alguns desktops de formato pequeno aqui (na CES). Estou surpreso com a quantidade de pessoas e OEMs que estão entusiasmados com esse formato pequeno.
VS: Que tipo de interconexão existe entre a CPU e a GPU RDNA 3.5 no Ryzen AI Max? Temos algo parecido com o Infinity fabric e o SmartShift?
Ben: A interconexão, internamente, é chamada de DDR SSP. Tenho que descobrir se essa marca interna é diferente da usada no chip para desktop, porque otimizamos essa interconexão para obter energia. Quando o senhor segura a matriz da Strix Halo, descobre que os CCDs estão muito próximos da matriz de E/S. E, por isso, conseguimos otimizar a potência dessa interconexão. E, por isso, conseguimos economizar vários watts de energia, que é o objetivo da construção da Strix Halo como sendo de baixo consumo de energia para alto desempenho. Portanto, trata-se de uma interconexão diferente e não é o silício CCD idêntico ao dos nossos chips para desktop.
Com o SmartShift, o senhor tem uma APU e uma dGPU como chips separados, que oscilam a energia entre os dois. Ao perceber que a dGPU está realmente atingindo o limite máximo, ele diz: vamos alocar essa energia para ela. As APUs têm usado o SmartShift - nossa tecnologia SmartShift é baseada em software e está no nível do firmware entre esses dois chips.
Nossas APUs fazem efetivamente o SmartShift, compartilhando a potência entre os IPs no nível do hardware porque são um único pacote. Nossas APUs sempre tiveram, o senhor sabe, algo ainda melhor, um raciocínio ainda mais rápido, tomando essa decisão muitas vezes mais por segundo sobre para onde a energia deve ir.
Então, sim, efetivamente não marcamos isso (como SmartShift) no Ryzen AI Max, mas apenas inerente ao hardware de uma APU, isso já aconteceu.
VS: E isso se estende a todas as APUs da pilha?
Ben: Com certeza. Cada APU está alocando energia para o que é necessário. Se houver demanda tanto na dGPU quanto nos núcleos, ela analisa o que tem mais demanda e aloca para ele.
VS: Sobre esse aspecto, um OEM pode usar o Ryzen AI Max e ainda oferecer uma dGPU, digamos, uma Radeon dGPU?
Ben: O Ryzen AI Max não suporta dGPU acoplada. Como já temos uma APU da classe dGPU, não há motivo para isso. O senhor não pode, sabe, fazer CrossFire, então não faz sentido ligá-los ao mesmo tempo. Sinceramente, por que um OEM compraria essa solução e depois tentaria instalar uma dGPU, já que agora o senhor tem o mesmo formato de um fator de forma para jogos existente?
VS: Nesse caso, como o senhor utilizaria melhor as pistas PCIe da CPU? Acredito que muitas pistas estariam livres, já que a maioria dos designs (slim) dificilmente tem um ou dois SSDs e os OEMs tendem a não oferecer espaço para expansão de armazenamento nesses chassis de qualquer forma, então o senhor não está utilizando toda a largura de banda PCIe.
Ben: Há PCIe Gen 4 nesses chips. O Ryzen AI Max oferece 12 pistas de PCIe Gen 4, e nossas APUs típicas que têm uma dGPU conectada têm de 16 a 20 pistas. Portanto, a razão pela qual reduzimos esse número é que o senhor geralmente usa cerca de oito pistas para a dGPU. Como não temos uma dGPU conectada, o senhor sabe, 20-8 fica em 12. Queremos ser capazes de suportar SSDs duplos e algumas outras E/Ss, e acredito que alguns de nossos clientes de estações de trabalho vão tirar proveito disso.
VS: Então, uma possibilidade seria que o senhor pudesse rotear o USB4 para isso em vez de ir para o chipset?
Ben: Teria que verificar isso. Normalmente, nesse formato pequeno, o senhor sabe, não há chip de ponte PCIe nem nada. O senhor só quer usar a APU para obter esse tamanho.
Nomenclatura do produto e perspectivas futuras
VS: O senhor também está lançando novos chips Dragon Range Refresh?
Ben: Acho que isso é improvável. Acho que não estamos anunciando nada na família Dragon Range neste momento.
VS: Isso significa que o senhor ainda continuará a vender os chips que vendeu no ano passado?
Ben: Com certeza. Mesmo que uma APU não esteja em nosso roteiro atual, se os OEMs ainda estiverem criando sistemas com os designs anteriores, com certeza. Há uma longa história de venda de produtos existentes há vários anos. Não é como projetar um novo sistema com isso, mas, ei, o sistema está vendendo muito bem, então está indo bem e continuará.
VS: Isso implicaria que, embora não seja oficial, o senhor não está descartando totalmente a possibilidade de vermos chips atualizados com um novo esquema de nomenclatura ou algo assim?
Ben: O senhor sabe, em nossos esquemas de nomes, queremos facilitar a decisão dos clientes. Às vezes, olhamos para uma atualização como a Série 200. Essa é, em grande parte, uma atualização da linha de produtos. Não é totalmente nova. Mas o motivo é que é muito estranho para um cliente ter uma série 300, uma série 8000, e se perguntar... espera, 8000 é menor que 300, isso não faz sentido! Então, esse é parte do motivo.
Na geração atual, queremos que a marca seja consistente e de fácil compreensão. Agora é basicamente essa marca inteira de três dígitos, quanto maior o número, melhor. Então, 200 é Hawk e, depois, em 300, o senhor tem Strix Point e Kraken, e o Max no topo. Essa é uma estratégia de marca consistente. Acho que também faremos algo nesse sentido para o lançamento do Fire Range.
VS: Quero dizer, é certo que nem sempre é fácil pronunciar o nome completo do chip de uma só vez "Ryzen.AI.9.300.Max.Plus"!
Ben: Acho que muitos de nós, o senhor sabe, bem, deixe-me dizer que no domínio da AMD temos muitos produtos, então é difícil. Queremos que algo seja consistente, queremos que seja diferenciado, queremos que os consumidores saibam. Então, honestamente, quando um consumidor entra no varejo, acho que ele vê o Copilot+ e vê 9, 7, 5, 3. Isso provavelmente... é o suficiente. Eles não estão olhando para o número exato do modelo.
Todos nós (referindo-se aos entusiastas) gostamos de estar por dentro de tudo, certo? O senhor quer saber todos os detalhes, então acho que isso faz parte das diferenças.
VS: E o senhor vê perspectivas para os notebooks RDNA 4 daqui para frente? Infelizmente, o número de SKUs de laptops baseados em dGPU da AMD tem sido bastante anêmico.
Ben: Nossa estratégia gráfica atual está focada no mercado de desktops com o RDNA 4. Portanto, acho que o senhor verá esses tipos de produtos primeiro no futuro. Certamente, o RDNA 4 e as futuras tecnologias gráficas chegarão aos dispositivos móveis, seja em APUs ou em produtos futuros.
VS: Provavelmente isso é futurista, mas ouvimos que coisas como RDNA e CDNA estariam se combinando.
Ben: Sim, esse é um projeto de longo prazo para unificar os dois e, pessoalmente, estou muito empolgado com isso, porque o foco do ML é, na verdade, para onde o mercado de clientes irá a longo prazo. Então, se todos seguirem na mesma direção, o senhor sabe, acho que seria muito positivo.
VS: Certo, então uma última pergunta, e essa também é uma das minhas irritações. No nível mais baixo, acho que há muito espaço, pois nem todo mundo quer um chip de última geração para suas necessidades. Coisas como edição básica de 1080p, a maioria dos chips pode fazer isso agora. Por que a AMD não se concentra em, digamos, um Ryzen 3, já que está oferecendo uma NPU de 50 TOPS em toda a pilha? Por que não fazer o mesmo com a GPU? Ou talvez aproveitar a própria NPU e nos oferecer um produto de nível básico no qual o senhor possa fazer criação de conteúdo básico e outras coisas.
Ou pode ser ainda mais simples. Como o senhor sabe, havia algo chamado Ryzen Embedded R1606Gque vimos em um ou dois mini PCs.
Ben: Portanto, temos planos de levar a NPU a pontos de preço melhores no mercado ao longo do tempo. Acho que o setor também está indo nessa direção. Então, com certeza, queremos oferecer a todos os consumidores um PC Copilot+, uma experiência habilitada para IA com NPU. O senhor só precisa olhar para a economia e os preços que esses produtos oferecem, e é apenas uma área de silício, ok, o que podemos colocar lá.
Por exemplo, poderíamos reduzir a interface de memória para 64 bits. Mas o que isso faz com o restante do sistema? Quantos núcleos são o mínimo para esse tipo de desempenho? Acho que diria que, nos últimos dois anos, a NPU não se tornou um acessório. Ela é uma das três trindades dos IPs em que precisamos nos concentrar. Portanto, estamos absolutamente tentando dimensionar esses três aspectos em todos os segmentos.
Fonte(s)
Próprio