AMD mới đây đã cho ra mắt mẫu GPU HPC mạnh nhất thế giới: Radeon Instinct MI100. Và con quái vật này sẽ mang lại gì? Ta hãy cùng đi tìm hiểu nhé.
Thế giới, hãy gặp GPU HPC mạnh nhất.
Radeon Instinct MI100 32GB: GPU HPC mạnh nhất thế giới trên nền kiến trúc CDNA thế hệ 1
Ở mẫu card Radeon Instinct thế hệ mới này, AMD đã rời bỏ kiến trúc Vega. Thay vào đó, họ sẽ sử dụng thế hệ đầu tiên của kiến trúc CDNA hoàn toàn mới. Nghe thì có vẻ giống với RDNA trên các mẫu RX 5000 và RX 6000, nhưng CDNA lại có cấu trúc khác hoàn toàn. Và AMD hứa hẹn, đây sẽ là đối trọng lớn cho kiến trúc Ampere của Nvidia trong mảng tính toán.
Video giới thiệu sản phẩm. Nguồn: Kênh Youtube của AMD.
Các tính năng nổi bật của Radeon Instinct MI100
- Kiến trúc CDNA hoàn toàn mới: Trái tim của các GPU AMD trong kỷ nguyên Exascale. Nó sẽ mang lại hiệu năng cực đáng gờm và hiệu suất cực cao.
- Hiệu năng FP64, FP32 dẫn đầu trong các tác vụ HPC, đạt đỉnh lần lượt là 11.5 TFLOPS (FP64) và 23.1 TFLOPS (FP32).
- Công nghệ Matrix Core Technology hoàn toàn mới dành cho các tác vụ HPC và AI.
- Công nghệ AMD Infinity Fabric thế hệ 2: Cung cấp băng thông qua giao thức PCIe 4.0 lên tới 340 GB/s trên mỗi card. Instinct MI100 có thể được bố trí tối đa 2 cụm 4 card, mỗi cụm cho băng thông lên tới 552 GB/s.
- VRAM HBM2 siêu nhanh với tốc độ 1.2 GHz và băng thông lên tới 1.23 TB/s
- Hỗ trợ giao thức PCI Express 4.0
Thông số chi tiết
Radeon Instinct MI100 sẽ sử dụng GPU kiến trúc CDNA trên nền tiến trình 7nm. Nó sẽ sở hữu tới 120 CU, tương đương 7680 stream processors. Với tên mã là Arcturus, GPU này được dự đoán sẽ có kích thước 720mm2 cùng mức xung nhịp ở mức 1500 MHz. Như mình đã nói bên trên, hiệu năng FP64 đạt đỉnh là 11.5 TFLOPS và FP32 đạt 23.1 TFLOPS. Chưa hết, hiệu năng FP16 đạt đỉnh được cho là sẽ lên tới 185 TFLOPS. TDP của chiếc card này sẽ là 300W.
Sơ đồ cấu trúc GPU Arcturus
Về VRAM, AMD sẽ trang bị cho Radeon Instinct MI100 32GB HBM2. Những chiếc card này thường được bố trí theo cụm 4 hoặc 8 card, giao tiếp với nhau thông qua giao thức Infinity Fabric X16, cho băng thông 276 GB/s. Tuy nhiên, băng thông VRAM của MI100 lại kém hơn so với HBM2e trên A100 tới từ Nvidia. HBM2 trên MI100 chỉ cho băng thông 1.23 TB/s. Còn HBM2e trên A100 có băng thông lên tới 1.55 TB/s.
Hiệu năng
Vệ hiệu năng thực tế, MI100 cho hiệu năng FP64 mạnh hơn 19.5% và FP32 mạnh hơn 18.5% so với các đối thủ là Nvidia Volta V100 và Ampere A100. Tuy nhiên, ở các tác vụ FP16, A100 vẫn mạnh hơn đáng kể so với MI100. Và trong 1 số tác vụ chuyên biệt khác, A100 vẫn mạnh hơn đáng kể so với đối thủ từ đội đỏ.
Như vậy, tùy vào tác vụ, MI100 sẽ mạnh hơn hoặc yếu hơn so với A100 của Nvidia. Mình nghĩ, GPU mới của AMD sẽ nằm giữa V100 và A100 của Nvidia.
Các mẫu GPU Radeon Instinct tính tới thời điểm hiện tại
GPU | Radeon Instinct MI6 | Radeon Instinct MI8 | Radeon Instinct MI25 | Radeon Instinct MI50 | Radeon Instinct MI60 | Radeon Instinct MI100 |
Tên mã GPU | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Arcturus | |
Tiến trình | 14nm | 28nm | 14nm | 7nm | ||
SP | 2304 | 4096 | 3840 | 4096 | 7680 | |
Xung nhịp | 1237 MHz | 1000 MHz | 1500 MHz | 1725 MHz | 1800 MHz | ~1500 MHz |
Hiệu năng FP16 | 5.7 TFLOPS | 8.2 TFLOPS | 24.6 TFLOPS | 26.5 TFLOPS | 29.5 TFLOPS | 185 TFLOPS |
Hiệu năng FP32 | 12.3 TFLOPS | 13.3 TFLOPS | 14.7 TFLOPS | 23.1 TFLOPS | ||
Hiệu năng FP64 | 384 GFLOPS | 512 GFLOPS | 768 GFLOPS | 6.6 TFLOPS | 7.4 TFLOPS | 11.5 TFLOPS |
VRAM | 16GB GDDR5 | 4GB HBM | 16GB HBM2 | 32GB HBM2 | ||
Xung VRAM | 1750 MHz | 500 MHz | 945 MHz | 1000 MHz | 1200 MHz | |
Bus | 256-bit | 4096-bit | 2048-bit | 4096-bit | ||
Băng thông | 224 GB/s | 512 GB/s | 484 GB/s | 1 TB/s | 1.23 TB/s | |
TDP | 150W | 175W | 300W |
Giá bán và ngày lên kệ
AMD thông báo rằng Radeon Instinct MI100 sẽ bán thông qua các OEM và ODM. Những hệ thống đầu tiên được tích hợp nó dự kiến sẽ có hàng khoảng cuối năm nay. Các hệ thống đó sẽ kết hợp các CPU EPYC cùng với các GPU MI100 này. Một số các đối tác như HPE, Dell, Supermicro hay Gigabyte cũng đã có sẵn hệ thống được tích hợp GPU MI100 sẵn sàng tới tay người dùng.
Nguồn: Wccftech
Đăng bình luận về bài viết này