India Memilih Arm’s Neoverse untuk Dorongan Desain Chip Nasional Baca Sekarang

Diposting pada

India Pusat Pengembangan Komputasi Lanjut (C-DAC) minggu ini diumumkan[PDF] CPU High Performance Computing (HPC) yang dirancang sendiri pertama di negara itu. Dinamakan Aum, chip pertama India adalah desain chiplet yang dapat menskalakan hingga 96 inti dan didasarkan pada desain Arm’s v8.4 “Zeus” Neoverse V1 (yang sama yang digunakan AWS di Graviton3-nya), dan diperkirakan akan memasuki pasar sebagai awal tahun 2024 pada proses 5 nm TSMC.

Aum dikembangkan sebagai bagian dari National Supercomputing Mission, sebuah program yang bertujuan untuk mengurangi paparan India terhadap kemungkinan pembatasan ekspor. Untuk itu, tujuannya adalah menerapkan arsitektur prosesor yang dikembangkan secara nasional. Mungkin yang mengkhawatirkan bagi Intel dan AMD, bagaimanapun, tujuannya adalah agar Aum dapat digunakan baik dalam skenario komputasi performa tinggi maupun chip komputasi personal. Dan di mana Aum ada, pasarnya lebih kecil.

Alasannya sederhana: jika India memiliki kemampuan untuk merancang chip (apakah itu berarti mencampur dan mencocokkan potongan-potongan dari portofolio tangan terbuka Arm atau membimbing implementasi khusus untuk desain akhir yang dapat diproduksi), kemungkinan pembatasan ekspor teknologi bisa sedikit berkurang. Pada saat yang sama, Misi Komputasi Nasional juga bertujuan untuk meningkatkan keamanan terhadap pintu belakang; penyedia desain netral seperti Arm secara alami cocok dengan masalah tersebut. Dan meskipun mengontrol proses desain itu sendiri tidak sepenuhnya berhasil (tidak ketika pintu belakang dapat diterapkan di lantai pabrik oleh musuh yang mau dan mampu), ini adalah awal yang kuat. Penggunaan terencana perangkat lunak open source untuk menopang ekosistem perangkat lunak khusus juga menggambarkan masa depan perangkat lunak yang lebih beragam, sehingga perangkat keras bukanlah satu-satunya segmen yang cenderung terfragmentasi, dengan waktu yang cukup.

Materi presentasi chip C-DAC AUM

Paket Aum dan desain chiplet A48Z individual. (Kredit gambar: C-DAC)

Chiplet A48Z di jantung chip Aum 96-core masing-masing menampilkan 48 inti Arm Zeus (basis 3 GHz, Turbo 3,5 GHz), didukung oleh 96 MB cache L2 akses langsung dan lapisan cache 96 MB lainnya yang menyangga inti dan memori sistem tambahan. Secara keseluruhan, setiap paket Aum mendukung hingga 16 saluran memori DDR5 (pada 5200 MHz, memberikan bandwidth 332,8 GB/dtk) dan memori HBM3 64 GB (stok 6,4 GHz, diarahkan ke 5,6 GHz pada rilis awal untuk 2,87 yang mengejutkan TB/detik). Throughput byte tambahan ditambahkan oleh 128 jalur PCIe Gen 5, 64 di antaranya mengaktifkan akselerator tambahan (seperti akselerator GPU atau FPGA).

Materi presentasi chip C-DAC AUM

Subsistem memori interkoneksi Aum. (Kredit gambar: C-DAC)

64 sisanya kemungkinan dialihkan untuk struktur komunikasi internal chip, jaringan mesh koheren gaya NUMA, tautan koheren memori penuh berdasarkan protokol CCIX. Tautan ini digunakan oleh dua soket Aum untuk berkomunikasi, dan dibutuhkan satu atau dua halaman desain dari AMD Infinity Fabric.

Materi presentasi chip C-DAC AUM

Perbandingan spesifikasi antara prosesor Aum HPC C-DAC dan A64FX Fujitsu, dari Fugaku. (Kredit gambar: C-DAC)

Menurut dokumentasi, desain Aum terutama bertujuan untuk meningkatkan jumlah bandwidth memori yang tersedia per flop daya komputasi (rasio byte/flop), yang ditemukan sebagai faktor yang sangat membatasi dalam penskalaan kinerja untuk komputasi HPC. Terlalu banyak mobil (operasi mengambang per detik) pada jalur yang terlalu sedikit (memori throughput) hanya dapat berakhir dengan satu arah. Hasilnya adalah Aum dan arsitektur Armnya menargetkan kinerja pada 4,6 teraflops per soket dan bandwidth memori agregat 3 TB/dtk. Itu akan memberikannya rasio byte/gagal 0,7, jauh lebih tinggi dari 0,38 yang dicapai oleh superkomputer Arm tercepat di dunia, Fugaku Jepang, dan secara meyakinkan mengalahkan IBM AS dan Summit yang berbasis Nvidia (<0,2 byte/gagal). Namun, pada TDP 300 W yang diharapkan, tampaknya efisiensi energi benar-benar menurun dibandingkan dengan inti Arm A64FX Fugaku.

Materi presentasi chip C-DAC AUM

Metrik efisiensi byte/gagal untuk beberapa sistem HPC. (Kredit gambar: C-DAC)

Jika semuanya berjalan sesuai rencana, CPU Aum Arm India akan menjadi pintu masuk yang kuat ke bidang superkomputer. Yang terpenting, ini akan menjadi buatan sendiri – meskipun tidak secara dramatis, setidaknya dalam iterasi pertamanya. Banyak pekerjaan yang jelas dilakukan untuk memajukan subsistem memori secara keseluruhan, dan secara umum, memori lebih mudah dan lebih tersedia untuk sumber daripada chip Aum TSMC 5 nm. Menyesuaikan inti CPU itu sendiri bisa menjadi langkah selanjutnya C-DAC, mempersiapkan jalan untuk India dan menambah momentum untuk proses “nasionalisasi chip” di negara lain. Ngomong-ngomong, China juga tertarik pada Arm; tapi itu adalah cerita yang sama sekali berbeda.

Dorongan yang lebih luas untuk ekosistem chip yang lebih beragam ini adalah bagian dari alasan mengapa Intel memutuskan untuk berinvestasi kembali ke dalam bisnis chip klien Foundry, sebuah langkah yang dilakukan AMD saingannya bertahun-tahun yang lalu (sementara di tengah salah satu restrukturisasi perusahaan tersulit yang pernah ada). . Dan ini adalah kemenangan lain untuk ekosistem Arm dibandingkan dengan alternatif x86 yang terkadang bermasalah, yang dengan sendirinya juga menghukum beberapa orang lebih keras daripada yang lain.

Ini juga, mungkin, pertanda akan datangnya volume pengiriman untuk produsen semikonduktor: semakin banyak entitas yang melempar dan menerima desain mereka dari perairan TSMC, namun hanya ada begitu banyak wafer untuk semua pengambil – dan remah-remah dari pertarungan volume sudah mengotori lantai.

Dek slide lengkap berikut.