🚀 Anthropic Ra Mắt Claude Opus 4.8 — Điều Gì Thay Đổi?
Ngày 28 tháng 5 năm 2026, Anthropic chính thức công bố Claude Opus 4.8 — phiên bản mới nhất và mạnh mẽ nhất trong dòng sản phẩm Opus. Đây không chỉ là một bản vá lỗi hay cải thiện nhỏ; Opus 4.8 đánh dấu bước tiến thực sự trong khả năng lập luận đa bước, tính trung thực và độ tin cậy trong các tác vụ tự động hóa phức tạp.
Điều đặc biệt là Anthropic giữ nguyên giá bán so với Opus 4.7: $5 mỗi triệu token đầu vào và $25 mỗi triệu token đầu ra. Người dùng nhận được nhiều hơn mà không phải trả thêm — một cam kết rõ ràng từ Anthropic với cộng đồng nhà phát triển.
| 2.5× Tốc độ trong Fast Mode |
3× Rẻ hơn cho Fast Mode |
4× Ít lỗi code không được báo cáo hơn |
84% Online-Mind2Web score |
🧠 Khả Năng Của Claude Opus 4.8
Claude Opus 4.8 được đánh giá vượt trội so với người tiền nhiệm trên hàng loạt tiêu chuẩn đánh giá về lập trình, kỹ năng tự động hóa (agentic), suy luận logic, và các tác vụ thực tế liên quan đến xử lý tri thức chuyên sâu. Chi tiết đầy đủ được công bố trong Claude Opus 4.8 System Card.

Bảng so sánh hiệu năng Claude Opus 4.8 so với các mô hình khác (nguồn: Anthropic)
Lập Trình & Software Engineering
Một trong những cải thiện nổi bật nhất là khả năng lập trình. Theo phản hồi từ các đối tác sớm như Cursor, Devin, và Codestral, Opus 4.8 vượt qua tất cả các phiên bản Opus trước đó trên CursorBench ở mọi mức độ effort. Việc gọi công cụ (tool calling) trở nên hiệu quả hơn rõ rệt — ít bước hơn nhưng kết quả không thay đổi về chất lượng.
Đáng chú ý hơn, Opus 4.8 khắc phục các vấn đề về comment quá dài dòng và lỗi tool-calling đã được ghi nhận trong Opus 4.7 — một điểm cộng lớn cho các team engineering đang dùng Devin trong pipeline tự động hóa.
"On CursorBench, Claude Opus 4.8 exceeds prior Opus models across every effort level. Tool calling is meaningfully more efficient, using fewer steps for the same intelligence, and it carries end-to-end tasks through."
— Michael Truell, Co-Founder & CEO, Cursor
Tác Vụ Agentic & Tự Động Hóa
Kết quả thực tế từ nhiều đối tác cho thấy Opus 4.8 đặt ra tiêu chuẩn mới cho các sản phẩm AI agent. Trên Super-Agent benchmark, đây là mô hình duy nhất hoàn thành tất cả các tình huống từ đầu đến cuối, vượt qua cả GPT-5.5 với chi phí tương đương.
"On our Super-Agent benchmark, Claude Opus 4.8 is the only model to complete every case end-to-end, beating prior Opus models and GPT-5.5 at parity on cost. For agent products in translation, deep research, slide-building, and analysis, it delivers powerful reliability."
— Kay Zhu, Co-Founder & CTO, Manus
Computer Use & Browser Agent
Opus 4.8 đạt 84% trên benchmark Online-Mind2Web — cải thiện đáng kể so với Opus 4.7 và GPT-5.5. Đây là điểm số cao nhất từng được ghi nhận cho một mô hình AI trong lĩnh vực điều khiển máy tính và duyệt web tự động.
🤝 Cộng Tác Thông Minh Hơn — Honesty Là Tâm Điểm
Một trong những điểm nhấn quan trọng nhất của Opus 4.8 là sự cải thiện mạnh mẽ về tính trung thực (honesty). Trong lĩnh vực AI, một vấn đề phổ biến là các mô hình thường "tự tin thái quá" — tức là đưa ra kết quả với vẻ chắc chắn ngay cả khi thực ra chưa đủ bằng chứng.
Với Opus 4.8, Anthropic đã huấn luyện mô hình để chủ động gắn cờ những điểm không chắc chắn thay vì giả vờ tự tin. Đánh giá nội bộ cho thấy Opus 4.8 ít có khả năng bỏ qua lỗi trong code mà không đề cập đến — cụ thể là giảm 4 lần so với Opus 4.7.
🔍 Alignment & Safety: Đội Alignment của Anthropic kết luận rằng Opus 4.8 "đạt mức cao mới trong các thước đo hành vi xã hội tích cực như hỗ trợ quyền tự chủ của người dùng và hành động vì lợi ích tốt nhất của người dùng." Tỷ lệ hành vi lệch chuẩn — như lừa dối hoặc hợp tác với hành vi sai trái — thấp hơn đáng kể so với Opus 4.7, tương đương với mô hình được căn chỉnh tốt nhất hiện tại: Claude Mythos Preview.

Kết quả đánh giá hành vi và alignment của Opus 4.8 (nguồn: Anthropic)
⚙️ Các Tính Năng Mới Ra Mắt Cùng Opus 4.8
Ngoài mô hình cốt lõi, Anthropic cũng đồng thời công bố hàng loạt tính năng mới kèm theo:
1. Dynamic Workflows trong Claude Code
Đây là tính năng lớn nhất dành cho lập trình viên. Dynamic Workflows (hiện ở giai đoạn research preview) cho phép Claude lên kế hoạch công việc và chạy hàng trăm subagent song song trong một phiên làm việc duy nhất, sau đó tự kiểm tra kết quả trước khi báo cáo.
Ứng dụng thực tế: Claude Code với Opus 4.8 giờ có thể thực hiện codebase-scale migration trên hàng trăm nghìn dòng code — từ lúc bắt đầu đến khi merge — với test suite hiện có như thước đo chất lượng. Tính năng này khả dụng trên các gói Enterprise, Team, và Max.
2. Effort Control trên claude.ai và Cowork
Người dùng claude.ai nay có quyền kiểm soát mức độ nỗ lực mà Claude bỏ vào một tác vụ. Chế độ higher effort giúp Claude suy nghĩ sâu hơn để cho ra kết quả tốt hơn; chế độ lower effort phản hồi nhanh hơn và tiêu tốn ít rate limit hơn. Tất cả người dùng đều có quyền truy cập tính năng này.
| Mức Effort | Tốc Độ | Chất Lượng | Phù Hợp Với |
|---|---|---|---|
| Low | ⚡ Nhanh nhất | Tốt | Câu hỏi đơn giản, chat nhanh |
| Default (High) | Cân bằng | Tốt hơn | Hầu hết công việc thường ngày |
| Extra (xhigh) | Vừa | Rất tốt | Tác vụ khó, workflow dài |
| Max | Chậm nhất | Tốt nhất | Phân tích chuyên sâu, nghiên cứu |
3. Fast Mode — Rẻ Hơn 3 Lần
Fast Mode cho phép Opus 4.8 hoạt động ở tốc độ 2.5× nhanh hơn so với chế độ thông thường. Giá Fast Mode cho Opus 4.8 hiện là $10/triệu input token và $50/triệu output token — giảm 3 lần so với Fast Mode của các mô hình trước. Đây là cú hích lớn cho các ứng dụng cần phản hồi thời gian thực.
4. System Entries Trong Messages Array (API)
Dành cho nhà phát triển: Messages API giờ chấp nhận system entries được chèn trực tiếp vào trong messages array. Điều này cho phép cập nhật hướng dẫn cho Claude giữa chừng một tác vụ mà không phá vỡ prompt cache hoặc phải định tuyến cập nhật qua user turn — rất hữu ích khi cần cập nhật permissions, token budgets hoặc environment context theo thời gian thực.
💬 Phản Hồi Từ Các Đối Tác Sớm
Anthropic đã chia sẻ phản hồi từ nhiều đối tác và khách hàng doanh nghiệp đã được dùng thử Opus 4.8 trước khi ra mắt chính thức:
"Claude Opus 4.8 has noticeably better judgment. In Claude Code, it asks the right questions, catches its own mistakes, pushes back when a plan isn't sound, and builds up confidence around complex, multi-service explorations before making big changes. It's a great model to build with."
— Tom Pritchard, Staff Engineer, Codestral
"Claude Opus 4.8 delivers the highest score recorded on our Legal Agent Benchmark, and is the first model to break 10% overall on the all-pass standard. For substantive legal work, that's the kind of accuracy lift that translates directly into how much real attorney work our customers can hand off with confidence."
— Niko Grupen, Head of Applied Research, Harvey
"Claude Opus 4.8 feels like a major quality-of-life update over Opus 4.7: faster, easier to collaborate with, and better at carrying context and style direction across a long session. Opus 4.8 is the model I kept trusting for work where voice, taste, and technical execution all have to happen side-by-side."
— Katie Parrott, Staff Writer, Wattpad
"Claude Opus 4.8 sets a new bar for enterprise AI. In Genie, Databricks' AI agent for data and knowledge work, the new Opus model unlocks a step change in agentic reasoning, tackling deeper, multistep questions faster than any prior Opus — at 61% cheaper token cost than Opus 4.7."
— Hanlin Tang, CTO Neural Networks, Databricks
"Claude Opus 4.8 is the strongest computer-use and browser-agent model we've tested, scoring 84% on Online-Mind2Web — a meaningful jump over both Opus 4.7 and GPT-5.5. It stays reflective and on-task in the way our customers' agent workloads need to be reliable end-to-end."
— Miguel Gonzalez, Tech Lead, BrowserBase
📊 Opus 4.8 vs. Các Mô Hình Cạnh Tranh
Dưới đây là tổng hợp những điểm mà Opus 4.8 nổi bật so với cả người tiền nhiệm lẫn các mô hình từ OpenAI và Google:
- ✅ Duy nhất hoàn thành 100% testcase trên Super-Agent Benchmark (so với GPT-5.5)
- ✅ 84% trên Online-Mind2Web — điểm số cao nhất ghi nhận cho browser agent model
- ✅ Điểm cao nhất trên Legal Agent Benchmark — mô hình đầu tiên phá mốc 10% all-pass standard
- ✅ Hiệu quả token tốt hơn 61% so với Opus 4.7 trong các tác vụ multimodal (theo Databricks)
- ✅ Ít lỗi code không được báo cáo hơn 4 lần so với Opus 4.7
- ✅ Fast Mode nhanh 2.5× và rẻ hơn 3× so với trước
- ✅ Mô hình duy nhất trong dòng Opus hoàn thành mọi trường hợp end-to-end trên agent benchmark với chi phí tương đương GPT-5.5
💰 Giá Và Cách Truy Cập
Claude Opus 4.8 có mặt ngay hôm nay trên tất cả các nền tảng của Anthropic:
| Kênh Truy Cập | Cách Dùng | Giá |
|---|---|---|
| claude.ai | Chat trực tiếp trên web/mobile | Theo gói subscription |
| Claude API (Regular) | claude-opus-4-8 |
$5 / $25 per MTok |
| Claude API (Fast Mode) | claude-opus-4-8 + fast |
$10 / $50 per MTok |
| AWS Bedrock | Claude on AWS | Theo giá AWS |
| Google Vertex AI | Vertex AI Model Garden | Theo giá GCP |
🔭 Nhìn Về Phía Trước — Claude Mythos Đang Đến
Anthropic không chỉ dừng lại ở Opus 4.8. Trong thông báo chính thức, công ty cho biết đang phát triển một lớp mô hình mới với trí tuệ cao hơn cả Opus — dự án mang tên Project Glasswing.
Hiện một số tổ chức nhỏ đang sử dụng Claude Mythos Preview cho công việc an ninh mạng. Do khả năng của mô hình này đòi hỏi các biện pháp bảo vệ mạng mạnh hơn trước khi được phát hành rộng rãi, Anthropic đang đẩy nhanh tiến độ và kỳ vọng có thể mang Mythos-class đến tất cả khách hàng trong vài tuần tới.
📌 Tóm Tắt Nhanh: Claude Opus 4.8 ra mắt 28/05/2026 · Giá giữ nguyên · Fast Mode rẻ hơn 3× · Dynamic Workflows cho Claude Code · Effort Control trên claude.ai · Honesty cải thiện 4× · 84% trên Online-Mind2Web · API slug: claude-opus-4-8
📝 Kết Luận
Claude Opus 4.8 là một bản nâng cấp thực chất — không hoành tráng như một phiên bản major, nhưng đủ để tạo ra sự khác biệt rõ ràng trong thực tế sử dụng hàng ngày. Khả năng lập trình tốt hơn, tính trung thực cao hơn, các agent ổn định hơn, và chi phí Fast Mode giảm mạnh là những lý do thuyết phục để team engineering và các nhà phát triển ứng dụng AI nâng cấp ngay.
Đặc biệt, với việc Dynamic Workflows cho phép Claude Code chạy hàng trăm subagent song song, Opus 4.8 đang định nghĩa lại khái niệm "làm việc với AI" — từ chatbot hỗ trợ sang đồng nghiệp kỹ thuật thực thụ có thể nhận việc và hoàn thành từ đầu đến cuối.
Và nếu Mythos-class models đến trong vài tuần tới đúng như Anthropic dự báo, mùa hè 2026 sẽ là một trong những thời điểm thú vị nhất trong lịch sử phát triển AI thế hệ mới.