Hôm nay, Samsung công bố RAM có gắn chip AI mới của họ, dựa trên giao tiếp HBM2. Con chip được gắn trên RAM có sức mạnh tính toán 1,2 TFLOPS, cho phép nó thực hiện các hoạt động thường được dành cho CPU, GPU, ASIC, hoặc FPGA.
Các chip được gọi là HBM-PIM được nạp sẵn AI engine vào bên trong, do đó giảm tải tác vụ cho vi xử lí chính (CPU). Loại bộ nhớ mới này được thiết kế để giảm bớt gánh nặng di chuyển dữ liệu giữa bộ nhớ và CPU, vốn thường tốn điện hơn cả tác vụ tính toán của CPU.
Samsung cho biết, khi được áp dụng cho bộ nhớ HBM2 Aquabolt hiện có của mình, công nghệ này có thể mang lại hiệu suất gấp đôi cho hệ thống đồng thời giảm điện năng tiêu thụ hơn 70%. Công ty cũng tuyên bố rằng RAM mới không yêu cầu bất kỳ thay đổi về phần mềm hoặc phần cứng nào (bao gồm cả chip điều khiển bộ nhớ), do đó cho phép sản phẩm này bán ra thị trường nhanh hơn.
Samsung cho biết bộ nhớ này đã được thử nghiệm trong các bộ tăng tốc AI với các nhà cung cấp giải pháp AI hàng đầu. Công ty dự kiến tất cả các giấy phép sẽ được hoàn thành trong nửa đầu năm nay.
Trong bộ nhớ HBM-PIM có gì ?
Samsung đã trình bày chi tiết hơn về kiến trúc bộ nhớ mới của mình trong Hội nghị ảo quốc tế về mạch thể rắn (ISSCC) trong tuần này.
Như bạn có thể thấy trong các trang trình bày ở trên, mỗi băng bộ nhớ có một Đơn vị tính toán (PCU) chạy ở 300 MHz, với tổng số 32 PCU trên mỗi khuôn. Các PCU này được điều khiển thông qua các lệnh bộ nhớ thông thường từ máy chủ để cho phép dữ liệu có thể xử lý trên DRAM và chúng có thể thực hiện các phép tính FP16 khác nhau. Thanh RAM cũng có thể hoạt động ở chế độ tiêu chuẩn, có nghĩa là nó hoạt động như một thanh RAM HBM2 bình thường hoặc ở chế độ FIM để xử lý dữ liệu trong bộ nhớ.
Đương nhiên, việc nhường chỗ cho các khối PCU sẽ làm giảm dung lượng bộ nhớ – mỗi khuôn bộ nhớ được trang bị PCU giảm một nửa dung lượng (4Gb) so với khuôn 8Gb HBM2 tiêu chuẩn. Để giúp giải quyết vấn đề đó, Samsung kết hợp bốn khuôn 4Gb với PCU với bốn khuôn 8Gb không có PCU nên thanh RAM có tổng dung lượng 6GB (trái ngược với thanh RAM 8GB thông thường).
Thật không may, chúng ta sẽ không thấy những thanh RAM này trong các GPU chơi game mới nhất, ít nhất là trong năm nay. Samsung lưu ý rằng bộ nhớ mới được thiết kế để đáp ứng các yêu cầu xử lý quy mô lớn trong các trung tâm dữ liệu, hệ thống HPC và các ứng dụng di động hỗ trợ AI.
Đương nhiên việc gắn chip xử lí lên RAM sẽ làm cho vấn đề tản nhiệt cho RAM trở nên cấp thiết hơn, nhất là khi các thanh RAM máy chủ thường được gắn vào trong giá đỡ và ko có tản nhiệt như những thanh RAM gaming với LED RGB như chúng ta thường thấy. Trong bài giới thiệu, Samsung cũng không đề cập vấn đề này.
Kwangil Park, Phó chủ tịch cấp cao của Kế hoạch Sản phẩm Bộ nhớ tại Samsung Electronics cho biết: “HBM-PIM là đột phá của chúng tôi, là giải pháp PIM đầu tiên của ngành cho các công việc liên quan đến AI như HPC, đào tạo và nội suy. Chúng tôi dự định tiếp tục phát triển dựa trên bước đột phá này bằng cách cộng tác hơn nữa với các nhà cung cấp giải pháp AI. ”
Nguồn: Tomshardware.com
Đăng bình luận về bài viết này