Intel hat neue Prozessoren mit High-Bandwidth-Memory (HBM) angekündigt, die auf High-Performance-Computing (HPC), Supercomputing und künstliche Intelligenz (AI) ausgerichtet sind.
Diese Produkte werden als Xeon CPU Max-Serie und GPU Max-Serie bezeichnet. Die Chips basieren auf bestehender Technologie. Bei der CPU handelt es sich um die vierte Generation von Xeon Scalable, auch bekannt als Sapphire Rapids, und bei der GPU um Ponte Vecchio, die Rechenzentrumsversion der Xe-GPU-Technologie von Intel.
Der Unterschied besteht darin, dass diese beiden Prozessoren mit HBM auf dem Prozessorchip ausgestattet sind und nicht nur auf Standard-DRAM zurückgreifen. HBM ist viel schneller als DDR4- oder DDR5-Speicher und befindet sich auf dem Prozessorchip neben dem CPU/GPU-Kern mit einer Hochgeschwindigkeitsverbindung und nicht auf einem Speicherstick wie DDR-Speicher.
"Wenn man sich die allgemeinen Arbeitslasten im HPC- und KI-Bereich ansieht, gibt es eine große Vielfalt", sagte Jeff McVeigh, Vice President und General Manager für Supercomputing bei Intel. "Traditionell gibt es zwei Wege an die Spitze. Die eine ist die CPU-Route und die zweite ist die GPU-Route, die beide ihre eigenen Hindernisse haben. Unser Ziel ist es, wirklich voranzukommen und diese Probleme umfassend zu lösen."
Der Schwerpunkt von CPU Max und GPU Max liegt auf der Maximierung der Bandbreite, der Maximierung der Rechenleistung und der Maximierung der Fähigkeiten und Möglichkeiten, die sie bieten, um die Breite der Arbeitslasten zu bewältigen, so McVeigh.

CPU max.
CPU Max ist in drei Serverkonfigurationen erhältlich. Die erste ist, dass es keinen DRAM gibt, so dass der einzige Speicher im System der 64GB HBM auf dem CPU Max Chip ist. So funktioniert der japanische Supercomputer Fugaku, einst einer der schnellsten Supercomputer der Welt. In einem System mit zwei Sockeln sind das 128 GB Arbeitsspeicher, was laut McVeigh "mehr als genug für viele Anwendungen und Arbeitslasten" ist. In diesem Nutzungsszenario kann die Anwendung so laufen, wie sie ist.
Die zweite Konfiguration, HBM Planar Mode genannt, kombiniert HBM im CPU-Gehäuse mit einem Standard-DDR5-Speicherstick im System. Sowohl die HBM- als auch die DDR-Software müssen optimiert werden, um Daten zwischen diesen verschiedenen Speicherbereichen zu übertragen.
Die dritte Konfiguration ist der HBM-Cache-Modus, bei dem HBM als Cache für den DDR-Speicher im System fungiert. In diesem Modus sind keine Änderungen am Softwarecode erforderlich. "Sie möchten vielleicht einige Anpassungen vornehmen, um die Vorteile der sehr großen Caches zu nutzen, die Sie jetzt haben, aber Sie müssen das nicht tun, wenn Sie einen unmittelbaren Nutzen daraus ziehen", sagte McVeigh.
Grafikkarte maximal
GPU Max ist auch in drei Konfigurationen erhältlich: 1100, 1350 und 1550 Modelle. Die 1100 ist eine 300-Watt-PCIe-Karte mit doppelter Breite, 56 Xe-Kernen und 48 GB HBM2e-Speicher. Mehrere Karten können über die Intel Xe Link Bridge verbunden werden.
Die beiden anderen Konfigurationen verfügen über ein Open Compute Project (OCP)-Beschleunigungsmodul, genannt OAM, das eine schnellere alternative Schnittstelle zu PCIe-Karten darstellt.
Die 1350 GPU ist ein 450-Watt-OAM-Modul mit 112 Xe-Kernen und 96 GB HBM. Die 1550 GPU ist ein 600-Watt-OAM-Modul mit 128 Xe-Kernen und 128 GB HBM.
PCI-Express-Karten eignen sich gut für den Einsatz in Standard-Servern und sogar Workstation-Systemen, aber OAM-Module sind wirklich auf Umgebungen mit höherer Dichte ausgerichtet, sagte McVeigh. Er sagte, dass Intel viele von OEMs und Systemlösungsanbietern entwickelte Systemdesigns erhalten hat und ab 2023 Server mit OAM auf den Markt bringen wird.
Intel baut einen Supercomputer für das Argonne National Laboratory, der mit CPU Max- und GPU Max-Prozessoren ausgestattet ist und bei seiner Inbetriebnahme im Jahr 2023 eine Leistung von mehr als 2 exaFLOPs erreichen wird. Das ist doppelt so schnell wie Frontier, der derzeitige Spitzenreiter unter den Supercomputern. Möglich wird dies durch die Kombination der beiden Prozessoren, so McVeigh.
"Sie würden argumentieren, dass wir alles auf die GPU verlagert haben und nicht die beste CPU benötigen, richtig? Wir brauchen keinen HBM-Speicher, richtig? Falsch. Wenn wir den in die CPU integrierten HBM-Speicher aktivieren, können wir erhebliche Leistungssteigerungen erzielen, weil immer noch eine Menge Code auf der CPU läuft, obwohl wir einige der größeren Kerne auf die GPU verlagert haben", sagte er.
Die neuen Prozessoren wurden bereits an erste Kunden ausgeliefert, darunter auch Argonne. Die Max-Serie soll im Januar 2023 auf den Markt kommen.