Giải cờ vua dành cho các mô hình AI năm 2025 chứng kiến cuộc đối đầu căng thẳng giữa những mô hình ngôn ngữ lớn (LLM) hàng đầu thế giới. Grok 4, sản phẩm của công ty xAI do tỷ phú Elon Musk sở hữu, đã thể hiện xuất sắc khi thắng Gemini 2.5 Pro của Google trong trận bán kết. Chiến thắng này mở đường cho Grok 4 tiến vào chung kết, đánh dấu bước tiến quan trọng của mô hình này dù nó gần như không được huấn luyện chuyên sâu về cờ vua trước giải đấu.

Tuy nhiên, ở trận chung kết, Grok 4 đã không thể vượt qua sức mạnh vượt trội của ChatGPT o3 của OpenAI. O3 đã hạ gục Grok 4 với tỷ số 4-0 tuyệt đối, cho thấy khả năng phân tích chiến thuật, xử lý trung cuộc và tàn cuộc vượt trội cùng tỷ lệ nước đi chuẩn xác trung bình 90,8%, trong khi Grok 4 chỉ đạt 80,2%. Những sai lầm nghiêm trọng của Grok 4 như mất quân dễ dàng và các nước đi không hợp lý đã được kỳ thủ số 2 thế giới Hikaru Nakamura nhận định nguyên nhân khiến Grok 4 thất bại chung cuộc.

Bên cạnh đó, Gemini 2.5 Pro dù thua Grok 4 tại bán kết nhưng vẫn giành được hạng ba sau khi thắng o4-mini của OpenAI với tỷ số áp đảo 3,5-0,5. Các mô hình Trung Quốc như Kimi K4 và Deepseek đều bị loại sớm ở tứ kết, cho thấy sự thống trị của các công ty Mỹ trong lĩnh vực AI cờ vua hiện nay.

Giải đấu không chỉ là cuộc thi tranh tài cờ vua mà còn là dịp để các công ty công nghệ hàng đầu thử nghiệm và nâng cao tiềm năng AI đa năng trong lĩnh vực logic và tư duy chiến lược. Dù các LLM thể hiện khả năng chơi cờ với tư duy khá giống con người, nhưng vẫn chưa thể so sánh với các engine chuyên biệt như Stockfish hay AlphaZero về mặt trình độ cao cấp.

Thành công của ChatGPT o3 trong giải đấu khẳng định sức mạnh của OpenAI trong lĩnh vực AI suy luận chiến lược, đồng thời cho thấy tiềm năng phát triển chưa giới hạn của các mô hình ngôn ngữ lớn khi áp dụng vào các nhiệm vụ đòi hỏi tư duy phức tạp như chơi cờ vua.