Auf der internationalen Supercomputing Conference hat Intel heute Details zur nächsten Generation der Intel® Xeon Phi™ Prozessoren (Codename Knights Landing) bekanntgegeben. Diese ist zum Code bisheriger Anwendungen abwärtskompatibel und enthält die neue High Speed Interconnect-Technologie Intel® Omni Scale Fabric. Hinzu kommt ein integrierter Speicher mit sehr hoher Bandbreite. Die Kombination aus den genannten Komponenten beschleunigt Anwendungen in der wissenschaftlichen Forschung maßgeblich. Derzeit sind Speicher und Fabrics für Server nur als diskrete Komponenten verfügbar, was die Leistung und Packungsdichte von Supercomputern bis dato begrenzt.
Die neuen Intel Xeon Phi Prozessoren – Unübertroffene Integration
Die neuen Intel Xeon Phi Prozessoren werden in zwei Versionen erhältlich sein: als eigenständiger Prozessor, der direkt auf dem Mainboard-Socket installiert wird, und als PCIe Card-basierter Co-Prozessor. Mit der Socket-Option entfallen die Komplexität beim Programmieren sowie Bandbreiten-Engpässe bei der Datenübertragung über PCIe – dies ist ein wesentlicher Unterschied zu aktuellen GPU- und Accelerator-Lösungen. Die neue Prozessorgeneration enthält zudem einen auf dem Package integrierten Speicher von bis zu 16 GB, den Intel gemeinsam mit Micron* entwickelte. Dieser bietet bis zu fünffach höhere Bandbreite im Vergleich zu DDR4-Speichern1, fünf Mal bessere Energieeffizienz2 und bis zu dreimal höhere Packungsdichte als aktuelle GDDR-basierte Speicher2. In Verbindung mit der Intel Omni Scale Fabric Technologie können die Prozessoren als eigenständiger Rechenbaustein installiert werden. Das spart Platz und Energie, da sich dadurch die Zahl der Komponenten reduziert.
Die neue Prozessorgeneration besteht aus über 60 Prozessorkernen basierend auf der Silvermont-Architektur und für HPC-Anwendungen optimiert ist. Sie bietet mehr als 3 TFLOP/s Leistung3 in doppelter Genauigkeit (Double Precision) und im Vergleich zur aktuellen Generation die dreifache Single Thread Performance4. Als eigenständiger Server-Prozessor unterstützt sie DDR4-Systemspeicher und ist in Kapazität und Bandbreite mit Intel Xeon-basierten Plattformen vergleichbar. So werden Anwendungen mit sehr hohem Speicherbedarf ermöglicht. Da die neuen Prozessoren zu den Intel® Xeon® Prozessoren5 binär-kompatibel sind, können Software-Entwickler ihren bestehenden Code verwenden.
Intel Omni Scale Fabric liefert hohe Bandbreite
Die neue Interconnect-Technologie wird in die nächste Generation der Intel Xeon Phi Prozessoren sowie in künftige Intel Xeon Prozessoren, die im 14nm Herstellungsverfahren gefertigt werden, integriert. Sie trägt den hohen Anforderungen künftiger High Performance Computing (HPC)-Systeme in punkto Leistung, Skalierbarkeit, Zuverlässigkeit, Stromverbrauch und Packungsdichte Rechnung. Ziel ist es, ein ausgeglichenes Preis-/Leistungs-Verhältnis für unterschiedlichste System-Varianten zu erreichen, von der Entry-Level-Implementierung bis hin zu Systemen mit hoher Skalierung.
Darüber hinaus werden traditionelle elektrische Transceiver in den aktuellen Director-Switches durch Intel® Silicon Photonics-basierte Lösungen ersetzt, die Komponenten optisch mit hohen Bandbreiten vernetzen. Das erhöht die Zahl der Ports, vereinfacht die Verkabelung und senkt die Kosten6. Derartige Kabel- und Transceiver-Lösungen lassen sich auch mit Intel Omni Scale-basierten Prozessoren, Adapter-Karten und Edge-Switches verwenden.
Verfügbarkeit der neuen Intel Xeon Phi Prozessoren
Für Kunden, die diskrete Komponenten und ein schnelles Upgrade bevorzugen, sind die Controller von Knights Landing und Intel Omni Scale Fabric als separate, PCIe-basierte Add-on-Karten verfügbar. Die Anwendungen der aktuellen Intel® True Scale Fabric sind mit der künftigen Intel Omni Scale Fabric kompatibel. Für Kunden, die heute Intel True Scale Fabric erwerben, wird in Zukunft ein Upgrade-Programm für Intel Omni Scale Fabric bereitgestellt.
Die nächste Generation der Intel Xeon Phi Prozessoren wird voraussichtlich in der zweiten Jahreshälfte 2015 verfügbar sein. Eine größere Installation wird beispielsweise ab 2016 im National Energy Research Scientific Computing Center (NERSC) in Oakland/Kalifornien zum Einsatz kommen. Das „Cori“ genannte System besteht aus mehr als 9.300 Knights Landing-Prozessoren und soll mehr als 5.000 Wissenschaftler bei etwa 700 rechenintensiven Forschungs-Projekten unterstützen.
Top 500 Liste: Intel setzt Erfolgskurs fort
Der derzeit weltweit schnellste Supercomputer „Milky Way 2“ in China mit einer maximalen Rechenleistung von 35 PetaFLOP/s (Billiarden Rechenoperationen pro Sekunde) basiert auf aktuellen Intel Xeon Prozessoren und Intel Xeon Phi Co-Prozessoren. Die Intel Xeon Phi Co-Prozessoren sind derzeit global in mehr als 200 OEM-Designs verfügbar.
85 Prozent der Supercomputer der heute vorgestellten 43. Ausgabe der TOP500-Liste werden von Intel Prozessoren angetrieben, darunter 97 Prozent der Neuzugänge. Nur 18 Monate nach ihrer Einführung machen Intel Xeon Phi Coprozessor-basierte Systeme bereits 18 Prozent der gesamten Leistung aller Top-500-Supercomputer aus.
1 Das Ergebnis basiert auf internen Analysen von Intel mit dem STREAM-Benchmark. Dabei wurde ein Knights Landing Prozessor mit 16 GB hoher Bandbreite mit einem System mit DDR4-Speicher auf allen Channels verglichen.
2 Das Ergebnis basiert auf internen Analysen von Intel beim Vergleich von Knights Landing integriertem MCDRAM-Speicher mit GDDR5-Speicher des Vorgängers Knights Corner.
3 Interne und vorläufige Prognosen zur theoretischen Double-Precision-Leistung auf Basis von Linpack-Messungen. Grundlage bilden die aktuelle Core-Zahl, Taktfrequenz und Fließkommaoperationen pro Zyklus von Knights Landing.
4 Hochgerechnete theoretische Single-Thread-Höchstleistung im Vergleich zur ersten Generation des Intel ® Xeon Phi™ 7120P Coprozessors (Codename Knights Corner)
5 Binär-kompatibel mit Intel Xeon Prozessoren durch den Einsatz des Haswell Instruction Set (außer TSX Transactional Synchronization Extensions)
6 Die hier beschriebene Schätzung der Gesamtkosten (TCO) oder andere Szenarien zur Kostensenkung dienen dem besseren Verständnis, wie der Kauf eines Intel-Produkts in Verbindung mit mehreren situationsspezifischen Variablen künftige Kosten beeinflussen kann. Die Umstände können sich ändern, bislang nicht eingerechnete Kosten können beim Einsatz eines Produkts entstehen. Daher sollte dieses Dokument weder als Versprechen noch als Vertrag für ein bestimmtes Kostenniveau interpretiert werden.