Các giải pháp AI tích hợp Xeon 6 & Gaudi 3 mới cho doanh nghiệp
Trong bối cảnh AI tiếp tục tạo nên những thay đổi sâu rộng trong nhiều lĩnh vực, các doanh nghiệp (DN) ngày càng cần đến cơ sở hạ tầng vừa hiệu quả về chi phí, vừa có thể phát triển và triển khai nhanh chóng.
Để đáp ứng nhu cầu này, Intel đã giới thiệu Xeon 6 với các nhân hiệu năng cao và bộ tăng tốc AI Gaudi 3. Hai sản phẩm này cung cấp các hệ thống trí tuệ nhân tạo (AI) mạnh với hiệu năng trên mỗi watt điện được tối ưu và tổng chi phí sở hữu (TCO) thấp hơn.
Theo Intel, vi xử lý (VXL) Xeon 6 với P-core được thiết kế để chạy các ứng dụng đòi hỏi sức mạnh tính toán cao với hiệu quả sử dụng điện tối ưu, Xeon 6 mang đến hiệu năng gấp đôi so với thế hệ tiền nhiệm. Dòng VXL mới của Intel có số lượng nhân nhiều hơn, băng thông bộ nhớ gấp đôi và khả năng tăng tốc AI được tích hợp trong mọi nhân.
Bộ VXL này được thiết kế để đáp ứng các yêu cầu về hiệu năng của AI từ các thiết bị vùng biên đến trung tâm dữ liệu (TTDL) và môi trường đám mây. Thông qua mối quan hệ hợp tác chiến lược với Intel, Google Cloud có thể cung cấp giải pháp với hiệu năng và sự linh hoạt theo nhu cầu của DN, bao gồm cả những giải pháp tích hợp Intel Xeon 6 với P-core trong tương lai.
Bộ tăng tốc AI Intel Gaudi 3: Được tối ưu hóa cho các mô hình AI tạo sinh (Gen AI) quy mô lớn, Gaudi 3 có 64 nhân xử lý Tensor (TPC) và 8 công cụ nhân ma trận (matrix multiplication engine, - MME) để tăng tốc khả năng tính toán của mạng thần kinh nhân tạo (deep neural network).
Bộ tăng tốc AI của Intel bao gồm bộ nhớ HBM2e 128 gigabyte (GB) cho việc huấn luyện và suy luận, và 24 cổng Ethernet 200 Gigabit (Gb) cho khả năng mở rộng mạng. Gaudi 3 cũng cung cấp khả năng tương thích mượt mà với framework PyTorch và các mô hình transformer và diffuser tiên tiến từ Hugging Face. IBM và Intel đang hợp tác để cung cấp dịch vụ Gaudi 3 nhằm hỗ trợ khách hàng tận dụng tốt sức mạnh của AI. Thông qua sự hợp tác này, Intel và IBM đặt mục tiêu giảm tổng chi phí sở hữu để tận dụng và mở rộng quy mô AI, đồng thời nâng cao hiệu năng xử lý.
Việc triển khai AI trên quy mô lớn đòi hỏi DN phải cân nhắc đến nhiều yếu tố, như các tùy chọn triển khai có đủ linh hoạt để đáp ứng nhu cầu, tỉ lệ hiệu năng trên giá thành có thực sự cạnh tranh, và các công nghệ AI có thể sử dụng được. Hạ tầng x86 mạnh và hệ sinh thái mã nguồn mở lớn của Intel hỗ trợ các DN xây dựng các hệ thống AI mang lại giá trị cao với tổng chi phí sở hữu và hiệu năng trên mỗi watt điện được tối ưu. Đáng chú ý, 73% các máy chủ tăng tốc bằng GPU đều sử dụng Intel Xeon làm CPU chính.
Theo Intel