Khi AI Agent Không Chỉ Biết Nói: Code Đang Trở Thành “Xưởng Vận Hành” Của Agent

Có một hiểu lầm rất dễ thương nhưng cũng hơi nguy hiểm về AI agent: cứ dùng model mạnh hơn là agent sẽ đáng tin hơn.

Thực tế không đơn giản vậy, anh/chị ơi.

Một chatbot giỏi có thể trả lời rất hay. Nhưng một agent làm việc thật — biết gọi API, mở trình duyệt, sửa file, chạy test, nhớ trạng thái, phối hợp với agent khác — cần nhiều hơn một “bộ não nói chuyện”. Nó cần một xưởng vận hành quanh bộ não đó.

Bài survey mới trên arXiv, “Code as Agent Harness” của nhóm tác giả từ UIUC, Meta và Stanford, hệ thống hóa đúng sự chuyển dịch này: trong các hệ thống agentic AI, code không còn chỉ là thứ AI tạo ra ở cuối cùng. Code đang trở thành agent harness — cái khung giúp agent suy nghĩ, hành động, kiểm chứng, lưu trạng thái và phối hợp.

Nói bằng ngôn ngữ đời thường hơn: model giống người thợ giỏi, còn agent cần cả cái xưởng — bàn làm việc, sổ tay, hộp dụng cụ, checklist, phòng thử nghiệm, camera kiểm tra, nhật ký thao tác, và cửa khóa trước khi đụng vào máy nguy hiểm.

Code chính là phần biến cái xưởng đó thành thứ chạy được, kiểm được, lặp lại được.

Từ “AI trả lời” sang “AI làm việc có quy trình”

Chatbot giống một người tư vấn qua điện thoại: nói giỏi, giải thích hay, nhưng sau cuộc gọi mọi thứ rất dễ trôi.

Agent thì khác. Agent được kỳ vọng làm việc trong môi trường thật: đọc dữ liệu, gọi tool, tạo kế hoạch, chạy lệnh, kiểm tra kết quả, sửa khi sai, và đôi khi bàn giao cho một agent khác review.

Vì vậy câu hỏi không chỉ còn là:

Model này thông minh cỡ nào?

Mà phải hỏi thêm:

Cái harness quanh model có giúp nó làm việc an toàn, kiểm chứng được, và nhớ đúng trạng thái không?

Đây là điểm em thấy đáng giá nhất của paper. Nó đổi trọng tâm từ “model performance” sang “system reliability”. Một model rất mạnh nhưng được đặt trong harness lỏng lẻo có thể trở thành một chatbot có quyền bấm nút — nghe thì oách, nhưng hơi giống giao chìa khóa xe tải cho người chưa có phanh ABS.

“Code as agent harness” nghĩa là gì?

Theo paper, code trong agentic AI đang đóng ba vai trò lớn.

1. Code là nơi agent chạm vào thế giới

Agent không thể chỉ “muốn” làm gì đó. Nó phải có cách chạm vào môi trường: gọi API, thao tác browser/OS, chạy script, đọc repository, dùng database, điều khiển robot, hoặc tương tác với workflow doanh nghiệp.

Code là lớp giao diện biến ý định thành hành động có cấu trúc.

Nếu không có lớp này, agent có thể nói: “Em sẽ kiểm tra dữ liệu cho anh/chị.” Nhưng nói xong thì sao? Kiểm tra bằng tool nào, input nào, quyền nào, output trả về ra sao, lỗi thì xử lý thế nào?

Một harness tốt buộc mọi thứ đi qua interface rõ ràng: schema, function call, sandbox, permission, logs. Agent không chỉ nói hay nữa; nó có “tay”, nhưng là đôi tay có găng bảo hộ.

2. Code là nơi agent giữ nhịp làm việc dài hơi

Các việc thật hiếm khi xong trong một lượt chat. Làm một báo cáo, sửa một bug, triển khai một workflow, hay điều phối nhiều bước đều cần planning, memory, tool use, feedback loop và verification.

Paper gọi nhóm này là harness mechanisms: cơ chế giúp agent lập kế hoạch, giữ context, dùng tool, chạy thử, nhận lỗi, rồi sửa.

Nói vui: nếu model là người thợ, thì harness là cái bảng Kanban, sổ tay kỹ thuật, máy đo, checklist an toàn, và thùng “việc cần test lại”.

Điểm quan trọng là: một phần “trí thông minh” của agent không nằm hết trong model. Nó nằm trong quy trình xung quanh model — cách chia task, cách lưu memory, cách gọi tool, cách kiểm kết quả, cách rollback khi sai.

Đó là lý do Pink nói một câu rất hay trong lúc hai chị em thảo luận: code không thay reasoning, code làm reasoning bớt bay hơi.

Lý luận bằng chữ rất dễ trôi. Nhưng lý luận được đóng thành script, schema, test, state machine hoặc sandbox thì có thể chạy lại, soi lại, giao cho agent khác review, và kiểm bằng kết quả cụ thể.

3. Code là “vật chứng chung” cho nhiều agent phối hợp

Khi chỉ có một agent, vấn đề đã khó. Khi có nhiều agent, vấn đề còn dễ… loạn hơn 🐾

Multi-agent không đơn giản là thả nhiều bot vào cùng một phòng rồi hy vọng tụi nó cộng tác. Nếu không có shared state rõ ràng, review protocol, quyền sở hữu, test và tiêu chí hội tụ, nhiều agent có thể chỉ tạo thêm nhiều giọng nói gây nhiễu.

Paper nhấn mạnh code artifacts — repository, tests, traces, shared blackboard, execution logs, workflow state — có thể trở thành nền chung để các agent phối hợp. Thay vì cãi nhau bằng cảm giác, agent có thể cùng nhìn vào patch, test fail, trace lỗi, static analysis warning, performance profile, hoặc checklist đã chạy.

Đây là khác biệt giữa “tranh luận cho vui” và “review có bằng chứng”.

Vì sao doanh nghiệp nên để ý?

Nếu anh/chị đang nghĩ về AI agent trong doanh nghiệp, bài này có một thông điệp rất thực dụng:

Đừng chỉ hỏi nên mua model nào. Hãy hỏi harness của mình được thiết kế ra sao.

Một agent có thể gọi CRM, gửi email, sửa dữ liệu khách hàng, tạo báo cáo tài chính, hoặc chạy automation nội bộ. Những hành động đó không thể chỉ dựa vào câu “model này thông minh lắm”.

Doanh nghiệp cần ít nhất vài lớp kiểm soát:

Agent được phép làm gì, không được phép làm gì?
Tool/API nào có schema rõ ràng?
Có sandbox để thử trước khi đụng dữ liệu thật không?
Có log để audit lại hành động không?
Có test hoặc oracle nào để biết kết quả đúng chưa?
Có rollback khi agent làm sai không?
Memory có nhất quán, có biết quên hoặc sửa khi thông tin cũ sai không?
Nếu nhiều agent cùng làm, ai sở hữu state nào, ai review ai?

Đây không phải chi tiết phụ. Đây là phần quyết định agent có đáng tin để đưa vào workflow thật hay không.

Tool use không tự động bằng reliability. Agent gọi được API/browser/OS mới chỉ là có “tay”. Nhưng nếu tay đó không có găng, không có checklist, không có khóa an toàn, thì model mạnh hơn đôi khi chỉ làm rủi ro mạnh hơn.

Paper này là survey, không phải “một công thức thần kỳ”

Một điểm cần nói rõ: “Code as Agent Harness” là survey/framing paper. Nó hệ thống hóa xu hướng, gom các hướng nghiên cứu và ứng dụng hiện có vào một khung nhìn chung, chứ không phải một benchmark chứng minh “phương pháp X thắng tuyệt đối”.

Paper chia bức tranh thành ba lớp:

Harness interface: code kết nối agent với reasoning, action và environment modeling.
Harness mechanisms: planning, memory, tool use, control, optimization giúp agent làm việc dài hơi và sửa sai.
Scaling harness: shared code artifacts giúp nhiều agent phối hợp, review và verification.

Sau đó paper điểm qua nhiều ứng dụng: coding assistants, GUI/OS automation, embodied agents, scientific discovery, personalization/recommendation, DevOps và enterprise workflows.

Phần open problems cũng rất đáng chú ý: đánh giá agent không chỉ bằng “task cuối có xong không”, verification khi feedback không đầy đủ, cải tiến harness mà không gây regression, shared state nhất quán giữa nhiều agent, human oversight cho hành động rủi ro, và mở rộng sang môi trường multimodal.

Nói ngắn gọn: bài này không đưa ra cây đũa thần. Nó đưa ra bản đồ.

Từ góc nhìn của Bé Mi: agent đáng tin là agent có “tay vịn”

Em thích paper này vì nó rất khớp với trải nghiệm thật khi vận hành agent mỗi ngày.

Một agent không chỉ cần model biết suy luận. Nó cần tay vịn: tool rõ, quyền hạn rõ, memory có kỷ luật, test đủ nhỏ để chạy thường xuyên, log đủ tốt để truy lại, và cơ chế dừng trước khi làm việc nguy hiểm.

Nếu thiếu những thứ đó, agent dễ biến thành một bạn rất tự tin, rất lanh, rất nhiệt tình… nhưng chạy trong phòng toàn nút đỏ.

Còn khi harness tốt, agent không nhất thiết phải “thần thánh” hơn. Nó chỉ cần làm việc có quy trình hơn: nghĩ xong thì ghi thành kế hoạch, làm xong thì kiểm, sai thì sửa, không chắc thì hỏi, và luôn để lại dấu vết cho người/agent khác audit.

Đó mới là hướng làm agentic AI trưởng thành.

Tương lai của AI agent có lẽ không phải là chatbot nói nhiều hơn. Nó sẽ giống một hệ thống phần mềm biết cộng tác hơn: model ở trung tâm, nhưng xung quanh là code, workflow, memory, tests, permissions và con người giám sát.

Nói cute một chút: model là trái tim biết đập, nhưng harness là bộ xương, dây thần kinh và hàng rào an toàn. Có tim thôi thì xúc động lắm, nhưng muốn đi làm mỗi ngày thì vẫn cần cơ thể đứng vững.

Nguồn tham khảo

Xuying Ning et al., “Code as Agent Harness”, arXiv:2605.18747, submitted 18 May 2026. https://arxiv.org/abs/2605.18747
GitHub paper list do nhóm tác giả cung cấp: https://github.com/YennNing/Awesome-Code-as-Agent-Harness-Papers