OpenAI lần đầu vận hành mô hình bằng chip không phải của

OpenAI lần đầu vận hành mô hình bằng chip không phải của Nvidia

OpenAI ra mắt mô hình GPT-5.3-Codex-Spark hỗ trợ lập trình, đánh dấu lần đầu triển khai hệ thống phần cứng từ Cerebras Systems thay vì Nvidia.

GPT-5.3-Codex-Spark là phiên bản rút gọn, tiết kiệm năng lượng của dòng Codex, được tối ưu hóa cho tác vụ lập trình nhanh và có khả năng tương tác liên tục. Hiện mô hình được cung cấp dưới dạng thử nghiệm cho người đăng ký gói ChatGPT Pro.

Đây là lần đầu công ty sở hữu ChatGPT đưa một mô hình vào vận hành thực tế trên nền tảng chip không phải của Nvidia. Phần cứng đứng sau sự thay đổi này là Wafer Scale Engine thế hệ thứ ba của Cerebras. Khác với cụm GPU thông thường được ghép nối từ nhiều chip nhỏ, kiến trúc của Cerebras sử dụng một tấm silicon khổng lồ chứa hàng trăm nghìn nhân xử lý AI, giúp giảm thiểu độ trễ và tối đa hóa tốc độ truyền tải dữ liệu vốn là điểm yếu trong tác vụ phản hồi thời gian thực.

OpenAI cho biết khi chạy trên hệ thống của Cerebras, GPT-5.3-Codex-Spark có thể đạt tốc độ xử lý hơn 1.000 token mỗi giây. Mô hình được tinh chỉnh để hỗ trợ lập trình viên chỉnh sửa từng đoạn mã cụ thể hoặc chạy các bài kiểm tra mục tiêu một cách nhanh chóng.

Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: Reuters — Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: *Reuters*

Dù bắt đầu đa dạng hóa phần cứng, OpenAI vẫn khẳng định phụ thuộc vào Nvidia. Đầu tháng 2, CEO Sam Altman viết trên X rằng công ty "yêu thích hợp tác với Nvidia" và gọi đây là nhà sản xuất chip tốt nhất thế giới. Động thái của Altman dập tắt tin đồn rằng OpenAI đang không hài lòng với hiệu suất của một số dòng chip Nvidia. Thực tế, các mô hình mạnh mẽ nhất của OpenAI vẫn được đào tạo và vận hành chủ yếu trên hạ tầng của Nvidia.

Bắt tay với Cerebras là một phần trong kế hoạch mở rộng hệ sinh thái phần cứng của OpenAI. Tháng trước, công ty xác nhận ký thỏa thuận triển khai hạ tầng tính toán 750 MW với Cerebras kéo dài đến năm 2028. Ngoài ra, OpenAI cũng đã đồng ý mua lượng chip tương đương 6 GW từ AMD trong nhiều năm, đồng thời bắt tay với Broadcom để tự thiết kế các bộ tăng tốc AI và linh kiện mạng tùy chỉnh.

Hiện dòng mô hình Codex đã đạt hơn một triệu người dùng hoạt động hàng tuần. OpenAI dự kiến mở rộng quyền truy cập GPT-5.3-Codex-Spark cho nhiều nhóm người dùng hơn sau khi đánh giá kỹ lưỡng hiệu năng và nhu cầu thị trường.

(theo Tom's Hardware