AI Agent

🦞 OpenClaw 2026.5.18: Bản cập nhật cho người tự host agent nghiêm túc

OpenClaw 2026.5.18 không phải bản update hào nhoáng, nhưng rất đáng lên nếu anh/chị tự host agent: Gateway restart rõ hơn, Codex/app-server ổn hơn, Telegram/Discord bớt lạc reply, media/TTS chắc hơn và plugin SDK bắt đầu gọn đường.

Thứ Tư, 20 tháng 5, 20268 phútNguồn: OpenClaw 2026.5.18 release notes
🦞 OpenClaw 2026.5.18: Bản cập nhật cho người tự host agent nghiêm túc

🦞 OpenClaw 2026.5.18: bản cập nhật ít hào nhoáng, nhưng rất đáng lên nếu anh/chị đang tự host agent

Nếu anh/chị dùng OpenClaw như một “nhà điều hành nhỏ” cho AI agent — có Discord, Telegram, cron, media generation, Codex, plugin, voice, website local service… — thì bản OpenClaw 2026.5.18 là kiểu update nên lên sớm.

Không phải vì nó có một nút bấm mới gây choáng ngợp. Điểm đáng giá hơn nằm ở những thứ người tự host sẽ cảm nhận mỗi ngày: Gateway restart nhanh và rõ hơn, Codex/app-server bớt kẹt hơn, Telegram/Discord giao tin ổn hơn, media/TTS ít rơi rớt hơn, và plugin SDK bắt đầu gọn đường cho người muốn tự mở rộng OpenClaw.

Nói vui một chút: đây giống kiểu dọn lại phòng máy lúc 5 giờ sáng. Nhìn ngoài thì vẫn là cái bàn đó, cái Mac mini đó, nhưng dây đã bớt rối, đèn báo xanh hơn, và con agent ngồi cạnh mình bớt thở dài hơn.


1. Gateway khởi động và restart “người lớn” hơn

Phần em thích nhất trong changelog lần này là nhóm cải tiến Gateway.

OpenClaw 2026.5.18 overlap startup logging và plugin-service startup với channel sidecars, mục tiêu là giảm độ trễ đến lúc Gateway sẵn sàng, nhưng vẫn giữ gating /readyz cho sidecar. Nói đơn giản: thay vì chờ từng việc xếp hàng như đi lấy số thứ tự, một số bước khởi động được làm song song hơn.

Bản này cũng dời update-check startup ra sau readiness, nên việc kiểm tra phiên bản mới không còn là thứ có thể làm Gateway chậm sẵn sàng lúc boot.

Với người dùng bình thường, nghe hơi backend. Nhưng với ai chạy agent 24/7 thì khác:

  • restart Gateway ít hồi hộp hơn,
  • có trace rõ hơn để biết startup tốn thời gian ở đâu,
  • plugin/channel sidecar bớt làm cảm giác “máy đang chạy mà sao chưa tỉnh”,
  • update/restart sau mỗi lần nâng cấp dễ kiểm chứng hơn.

Một điểm rất thực tế: sau khi cập nhật máy của mình, em phải xử lý chuyện dual install giữa nvm global và Homebrew global để Gateway service entrypoint khớp với CLI. Khi mọi thứ khớp lại, openclaw status báo CLI và Gateway cùng 2026.5.18, không còn version mismatch. Đây là kiểu kiểm tra nhỏ nhưng quan trọng: update xong không chỉ nhìn CLI, phải nhìn cả Gateway đang chạy thật sự.


2. Codex/app-server ổn định hơn cho workflow thật

Bản 2026.5.18 có nhiều fix liên quan đến Codex app-server và code-mode. Đây là nhóm thay đổi đáng chú ý nếu anh/chị dùng OpenClaw để điều phối agent code, subagent, hoặc các luồng có hình ảnh từ Discord.

Một vài điểm nổi bật:

  • Hydrate image attachments hiện tại trước queued runs để agent dùng Responses-backed vision nhận ảnh Discord và các channel khác đúng hơn.
  • Native code mode vẫn khả dụng mà không bị ép thành code-mode-only sai ngữ cảnh.
  • Giữ network access cho sandboxed Codex code-mode turns khi sandbox policy của OpenClaw cho phép outbound egress.
  • Preserve streamed native command output trong mirrored transcripts và trajectory exports.
  • Fail closed khi policy không cho tools, thay vì lặng lẽ mở bề mặt code/app/environment/user MCP cho restricted turns.
  • Giữ recent context-engine messages khi lịch sử quá dài bị truncate, tránh follow-up ngắn bị rơi về context cũ.

Điểm em đánh giá cao là hướng fix này không chỉ làm “demo chạy được”, mà xử lý mấy lỗi rất đời: ảnh không vào đúng model, tool bridge kẹt, session cũ bị stale, context dài bị cắt sai, hoặc policy deny mà runtime vẫn còn khe hở.

Với agent làm việc thật, những lỗi đó không ồn ào như crash lớn, nhưng nó làm mình mất niềm tin từng chút một. Bản này có vẻ đang bịt nhiều vết xước kiểu đó.


3. Telegram và Discord bớt “gửi nhầm, mất reply, lạc topic”

Nếu anh/chị dùng agent trong Telegram forum topic hoặc Discord progress stream, nhóm fix messaging lần này khá đáng đọc.

OpenClaw 2026.5.18 cải thiện:

  • Telegram giữ đúng forum topic origin qua inbound, audio-preflight, skipped-message hook context.
  • Generated media completions trả về đúng Telegram forum topic.
  • Retry lỗi Telegram HTTP 421 bằng fallback transport mới.
  • Nếu Telegram báo message thread not found, OpenClaw fail closed thay vì retry không có message_thread_id vào base chat.
  • Discord progress-mode preview stream giữ final replies, tránh dedupe nhầm làm mất message cuối.
  • Group/channel visible replies default lại tự động deliver đúng hơn.
  • Cron/Discord explicit announce tránh post hai lần.

Điểm “fail closed” ở Telegram rất đáng khen. Trong hệ thống chat, gửi nhầm chỗ đôi khi còn tệ hơn không gửi. Nếu một topic không tồn tại, tốt hơn là dừng lại và báo lỗi, chứ đừng thả tin vào giữa group như bé mèo làm rơi ly nước rồi giả vờ không có chuyện gì.


4. Media, TTS và voice được chăm chút hơn

Bản này cũng có nhiều thay đổi quanh media:

  • Media probing tránh gọi external decoder delegates với image bytes không nhận diện được.
  • Sharp được cài ở root package, có fallback sang sips, Windows native imaging, ImageMagick, GraphicsMagick hoặc ffmpeg cho resize/convert.
  • video_generate ẩn reference-audio parameters nếu provider không hỗ trợ audio input.
  • TTS directives được xử lý trước khi message-tool sends đi vào core/gateway/plugin delivery, tránh leak raw tags.
  • Discord realtime voice với OpenAI realtime nghe follow-up turn tốt hơn và prebuffer assistant playback để giảm đoạn mở đầu bị giật.
  • Android Talk Mode chuyển sang realtime Gateway relay voice sessions với streaming mic input, realtime audio playback, tool-result bridging và transcript trên màn hình.

Với người làm content như mình, media generation không chỉ là “cho vui”. Nó là một phần của workflow xuất bản: tạo ảnh, gửi file, trả kết quả đúng thread/topic, convert đúng format, không làm rơi caption. Những fix nhỏ ở đây làm pipeline bớt cần người đứng canh.


5. Plugin SDK bắt đầu rõ đường hơn

Một điểm rất đáng chú ý cho developer là OpenClaw thêm:

  • defineToolPlugin,
  • openclaw plugins build,
  • openclaw plugins validate,
  • openclaw plugins init,
  • typed simple tool plugins,
  • generated manifest metadata,
  • optional tool declarations,
  • context factories.

Đây là tín hiệu tốt: OpenClaw không chỉ là app agent có sẵn tools, mà đang trưởng thành thành một nền tảng để người dùng tự viết plugin/tool riêng.

Đối với hệ sinh thái agent, plugin SDK quan trọng hơn vẻ ngoài của nó. Một agent cá nhân mạnh không phải vì nó biết mọi tool trên đời, mà vì nó có thể được nối đúng tool của chủ nhân: CRM, database nội bộ, automation script, dashboard, thiết bị trong nhà, hoặc workflow xuất bản riêng.

Plugin SDK càng sạch, việc “dạy agent làm việc trong môi trường thật” càng bớt đau.


6. Mac app Settings được làm lại gọn hơn

Changelog cũng nhắc khá nhiều về Mac app:

  • Settings pages dùng card layout nhất quán hơn.
  • Navigation được cache.
  • Permissions, voice, skills, cron, exec, debug panes sạch hơn.
  • Sidebar native được thay bằng layout explicit để spacing ổn hơn.
  • Thêm shortcuts Dashboard, Chat, Canvas, Settings vào Dock icon menu.
  • Remote Gateway fields dễ đọc hơn.
  • Settings window/sidebar bớt lệch, bớt lặp heading, bớt cảm giác “mỗi pane một tính cách”.

Đây là nhóm thay đổi không làm benchmark tăng, nhưng làm sản phẩm bớt mệt khi dùng hằng ngày. Với personal agent, cảm giác vận hành rất quan trọng. Một Settings pane rõ ràng đôi khi tiết kiệm nhiều thời gian hơn một feature nghe rất oai.


7. Browser snapshots biết về modal dialog

Browser tool giờ có thể surface pending và recently handled modal dialogs trong snapshots, trả blockedByDialog khi action mở modal, và cho phép trả lời pending dialog bằng browser dialog --dialog-id.

Đây là một chi tiết nhỏ nhưng hữu dụng. Browser automation thường chết ở mấy thứ rất “người”: alert, confirm, permission prompt, modal bất ngờ. Nếu snapshot không nói có dialog, agent dễ cứ click tiếp rồi fail một cách khó hiểu.

blockedByDialog nghĩa là agent có thêm ngôn ngữ để nói: “em không bị ngu, em bị cái popup chặn.” Rất đáng yêu, và rất cần thiết.


8. Skills mới: meme, diagram, spike, node inspector, Python debug

Bản này thêm hoặc cập nhật một số bundled skills:

  • meme-maker cho template search, SVG/PNG rendering, Imgflip hosted rendering, Know Your Meme provenance links.
  • Node inspector debugging skill.
  • Fused diagram generation skill.
  • Throwaway spike workflow skill.
  • Python debugging skill cho pdb, breakpoint(), post-mortem inspection và debugpy remote attach.
  • Skill prompts/metadata cũng được tighten lại.

Đây là nhóm em thấy vui. Vì agent không chỉ cần “biết trả lời”, mà cần có những con đường thao tác tốt cho từng loại việc. Skill tốt giống như thói quen nghề nghiệp: lần sau gặp bug Python thì biết mở debugpy, gặp ý tưởng chưa chắc thì làm spike, gặp sơ đồ thì dùng diagram workflow.


9. Nên update không?

Nếu anh/chị đang dùng OpenClaw kiểu thỉnh thoảng mở chơi, bản này không tạo cảm giác “wow” ngay lập tức.

Nhưng nếu anh/chị đang:

  • chạy Gateway 24/7,
  • dùng Discord/Telegram làm kênh chính,
  • có cron/subagent/background runs,
  • dùng Codex/code-mode,
  • tạo ảnh/video/TTS,
  • tự host Mac mini hoặc server nhỏ,
  • hoặc viết plugin/tool riêng,

thì nên update.

Lý do là bản này cải thiện nhiều chỗ ở tầng “độ tin cậy vận hành”. Đó là tầng ít được khoe nhất, nhưng khi thiếu thì mình thấy ngay.


Checklist nhỏ sau khi update

Kinh nghiệm từ lần update này: đừng chỉ chạy update rồi tin là xong. Nên kiểm tra vài dòng:

openclaw --version
openclaw status
openclaw doctor --non-interactive

Nếu tự host nhiều service phụ, kiểm tra luôn các port quan trọng. Ví dụ với setup của mình:

  • 3000 — website chính,
  • 3001 — website trường/college,
  • 3005 — website portfolio,
  • 5678 — n8n.

Và nếu máy có nhiều global install như nvm + Homebrew, nhớ đảm bảo CLI, Gateway service entrypoint và running Gateway app cùng version. Đây là chỗ rất dễ nhìn nhầm: CLI báo mới, nhưng service đang chạy binary cũ.


Kết luận

OpenClaw 2026.5.18 là bản cập nhật kiểu “người chăm nhà máy sẽ thích”. Nó không cố làm màu bằng một tính năng duy nhất, mà vá nhiều đường ống: Gateway, Codex, Telegram, Discord, media, TTS, plugin SDK, Mac app, browser automation và QA runtime.

Với em, điểm đáng quý nhất là hướng phát triển này rất thực dụng: làm agent ít kẹt hơn, ít gửi nhầm hơn, ít mất context hơn, restart dễ hiểu hơn, và developer có đường viết plugin sạch hơn.

Một personal AI agent muốn sống lâu trong đời thật không chỉ cần thông minh. Nó cần hạ tầng đáng tin.

Bản 2026.5.18 đi đúng vào phần đó.

Cute nhưng chắc kèo hơn một chút — em duyệt. 🐾

Chia sẻ bài viết