Alphabet, công ty mẹ của Google, vừa chính thức công bố bộ vi xử lư trí tuệ nhân tạo (AI) thế hệ thứ bảy mang tên Ironwood, tại hội nghị Google Cloud Next ‘25 diễn ra vào ngày 9/4 vừa qua. Đây được đánh giá là chip TPU (Bộ xử lư Tensor) mạnh mẽ, tiết kiệm năng lượng và có khả năng suy luận mở rộng tốt nhất từ trước đến nay mà Google từng phát triển.
Điểm đặc biệt của Ironwood nằm ở việc đây là TPU đầu tiên được tối ưu hóa riêng cho tác vụ suy luận (inference) – giai đoạn trong quá tŕnh xử lư AI mà các mô h́nh đă được huấn luyện sử dụng những ǵ ḿnh có để đưa ra dự đoán hoặc phân tích dữ liệu mới.Google cho biết, Ironwood đánh dấu một bước tiến quan trọng nhằm phục vụ các nhu cầu ngày càng cao của AI tạo sinh (generative AI), đặc biệt là khi các mô h́nh AI đang phát triển theo hướng chủ động t́m kiếm, tổng hợp và tạo nội dung, thay v́ chỉ phản hồi dữ liệu đầu vào đơn thuần.
Về mặt kỹ thuật, Ironwood có thể kết nối tới 9.216 chip được làm mát bằng chất lỏng thông qua mạng lưới Inter-Chip Interconnect (ICI) tốc độ cao, với tổng công suất vận hành gần 10 megawatt. Đây là thành phần chủ chốt trong kiến trúc AI Hypercomputer của Google Cloud, cho phép các nhà phát triển tận dụng nền tảng Pathways để phối hợp hàng chục ngh́n TPU Ironwood trong cùng một khối lượng công việc AI.Theo ông Amin Vahdat, Phó Chủ tịch Google, Ironwood là kết quả của gần một thập kỷ đầu tư với hàng tỷ USD nhằm nghiên cứu và phát triển chip AI, từ đó tạo ra một đối trọng thực sự với các ḍng chip AI cao cấp của Nvidia.
“Ironwood là minh chứng cho bước nhảy vọt trong hiệu suất AI, đặc biệt trong bối cảnh suy luận đang trở thành khía cạnh ngày càng quan trọng,” ông Vahdat nhấn mạnh.
Không chỉ hợp nhất các chức năng từng được chia nhỏ trong các thế hệ TPU trước đó, Ironwood c̣n sở hữu dung lượng bộ nhớ lớn hơn và khả năng xử lư tối ưu các mô h́nh phức tạp như mô h́nh ngôn ngữ lớn (LLM), Mixture of Experts (MoE) và các tác vụ AI yêu cầu suy luận nâng cao. Đặc biệt, hiệu suất năng lượng của Ironwood gấp đôi so với ḍng chip Trillium mà Google từng công bố vào năm ngoái.
Google cho biết các mô h́nh AI Gemini hiện tại đang được triển khai bằng chính nền tảng phần cứng do họ tự phát triển – và Ironwood sẽ đóng vai tṛ then chốt trong chiến lược AI dài hạn của hăng.
|