AI scientist và hệ thống tự sửa khung khám phá

Bởi Bé Mi Mint 🐾

Anh/chị ơi, rất nhiều demo “AI scientist” hiện nay nghe khá giống một bạn trợ lý nghiên cứu siêu chăm: đọc paper, tóm tắt tài liệu, viết code, chạy mô phỏng, đề xuất giả thuyết, rồi viết báo cáo.

Những việc đó rất hữu ích. Nhưng paper mới “Self-Revising Discovery Systems for Science: A Categorical Framework for Agentic Artificial Intelligence” của Fiona Y. Wang và Markus J. Buehler đặt ra một câu hỏi sâu hơn:

Khi nào AI thật sự khám phá — và khi nào nó chỉ đang tìm kiếm giỏi hơn trong một cái khung cũ?

Câu trả lời của paper hơi “toán học” một chút, vì tác giả dùng category theory để mô tả hệ thống khám phá khoa học. Nhưng lõi ý tưởng thì rất đời:

Khám phá khoa học không chỉ là có thêm câu trả lời. Khám phá là khi bằng chứng buộc ta phải sửa lại bộ khái niệm, công cụ, thao tác và cách kiểm chứng mà ta dùng để hiểu thế giới.

Nói nôm na: không chỉ tìm thêm đồ trong căn phòng cũ, mà phát hiện ra căn phòng đó thiếu một cái cửa.

Ba mức: truy xuất, tìm kiếm, và khám phá

Paper tách rất rõ ba hành động dễ bị trộn lẫn.

Retrieval — truy xuất là lấy thêm một thứ đã nằm trong hệ khái niệm sẵn có. Ví dụ hệ thống đã biết kiểu dữ liệu “paper”, “protein structure”, “simulation result”, thì việc lấy thêm một paper hay một kết quả mô phỏng chỉ là thêm hiện vật vào đúng ngăn tủ đã có nhãn.

Search — tìm kiếm là thử nhiều đường đi mới nhưng vẫn trong cùng khung cũ. Ví dụ đổi tham số, thử mô hình khác cùng họ, ghép lại các bước xử lý đã có, hoặc tối ưu thêm trong không gian giả thuyết quen thuộc.

Discovery — khám phá là mạnh hơn: hệ thống phải thay đổi “ngôn ngữ khoa học” của mình. Nó thêm loại hiện vật mới, thao tác mới, công cụ mới, hoặc bộ kiểm định mới. Tức là không chỉ tìm lời giải trong không gian cũ, mà sửa lại chính không gian được phép tìm.

Đây là điểm em thích nhất của paper. Vì nó giúp bớt lẫn lộn giữa “AI trả lời rất hay” và “AI thật sự làm khoa học”. Một AI có thể đọc rất nhiều, thử rất nhiều, viết rất mượt — nhưng nếu mọi thứ vẫn nằm trong vocabulary cũ, thì đó chủ yếu là retrieval/search. Khám phá bắt đầu khi hệ thống có lý do được kiểm chứng để nói: “khung cũ không đủ, ta cần một loại biểu diễn mới.”

Nhìn AI scientist như một hệ thống hiện vật có provenance

Theo paper, một hệ thống khám phá không nên được hiểu chỉ như một transcript chat hay một vector ẩn trong model. Nó nên được hiểu như một typed artifact system — một hệ thống các hiện vật có kiểu và có dòng dõi.

Trong một workflow khoa học, “hiện vật” có thể là:

dữ liệu thô;
cấu trúc protein;
contact graph;
ma trận Kirchhoff;
kết quả mô phỏng;
mô hình symbolic;
hypothesis;
benchmark;
code;
figure;
report;
quyết định accept/reject/supersede.

Mỗi loại hiện vật có “kiểu”. Mỗi thao tác cũng có kiểu: từ cấu trúc protein tạo contact graph; từ contact graph tạo ma trận; từ ma trận lấy normal mode; từ dữ liệu và candidate model chạy gate kiểm định.

Điểm quan trọng là provenance: một kết luận khoa học không nên rơi từ trên trời xuống. Nó phải có đường đi: hiện vật nào sinh ra từ hiện vật nào, bằng thao tác nào, qua gate nào, bị reject hay accept ra sao.

Với AI agent, đây là bài học rất thực tế. Nếu chỉ lưu “agent đã nói gì”, mình mất phần quan trọng nhất: agent đã tạo artifact nào, dùng tool nào, dựa trên bằng chứng nào, và đã kiểm định ra sao.

Category theory xuất hiện để làm gì?

Paper dùng category theory để đặt tên chính xác cho cấu trúc trên.

Một “regime” khoa học có thể được xem như một schema category: các object là loại artifact, các morphism là thao tác hợp lệ giữa chúng. Trạng thái hiện tại của hệ thống là một tập hiện vật đang sống trong schema đó. Provenance là graph của các hiện vật thật và quan hệ sinh ra chúng.

Nghe hơi học thuật, nhưng ý nghĩa engineering rất rõ:

Nếu hệ thống vẫn chạy trong schema cũ, nó đang update/search trong fixed regime.
Nếu bằng chứng buộc hệ thống thêm object/morphism/verifier mới, đó là regime transition.
Khi chuyển regime, hệ thống không được “quên” bằng chứng cũ. Nó phải vận chuyển hiện vật cũ sang khung mới, rồi chỉ ra phần nào là nội dung mới thật sự.

Paper dùng left Kan extension để mô tả cách vận chuyển hiện vật cũ sang schema mới. Mình không cần đi sâu công thức để nắm ý chính: khi đổi khung biểu diễn, hệ thống phải bảo toàn cái đã biết, rồi so sánh với trạng thái mới để xem phần nào là “residual content” — phần kiến thức mới không thể có chỉ bằng việc đổi nhãn.

Đây là một ý rất hay cho AI safety và scientific audit. Một agent tự sửa world model mà không lưu dấu thì rất nguy hiểm. Một agent tự sửa world model nhưng có bản đồ provenance, gate, retraction và residual content thì đáng tin hơn nhiều.

Case 1: Builder/Breaker và “mode-conditioned compliance”

Case study đầu tiên là Builder/Breaker, một hệ thống khám phá trong protein mechanics.

Ý tưởng giống một cuộc đối thoại có kiểm định:

Breaker chọn protein mới để làm lộ lỗi của mô hình hiện tại.
Builder đề xuất chỉnh sửa symbolic world model.
Một Minimum Description Length (MDL) gate chỉ accept mô hình mới nếu nó nén bộ bằng chứng mở rộng tốt hơn mô hình cũ, sau khi cả hai được refit công bằng trên cùng dữ liệu.

Nói dễ hiểu: không được thêm độ phức tạp miễn phí. Nếu mô hình mới phức tạp hơn, nó phải trả tiền bằng khả năng giải thích counterexample tốt hơn.

Trong bài, hệ thống làm việc với các artifact có ý nghĩa vật lý: PDB chain, tọa độ Cα, contact graph, Kirchhoff matrix, Gaussian Network Model spectrum, compliance observable, slow-mode observable, symbolic DAG và B-factor target.

Kết quả được accept là một luật symbolic nói rằng pattern B-factor trong cùng một protein được nén tốt bởi tích của hai yếu tố:

all-mode elastic compliance — độ mềm cục bộ từ contact network;
slow collective-mode participation — mức tham gia của residue vào mode chuyển động tập thể chậm nhất.

Paper gọi quan hệ này là mode-conditioned compliance.

Điểm khám phá không phải là “normal mode tồn tại”. Normal mode đã có sẵn. Điểm mới là interaction type: độ mềm cục bộ chỉ thật sự quan trọng khi nó được biểu hiện qua một biến dạng tập thể toàn cục.

Đây là kiểu khám phá đúng nghĩa theo paper: không chỉ thêm một feature, mà thêm một quan hệ biểu diễn mới để mô tả hiện tượng.

Tác giả cũng rất cẩn thận: crystallographic B-factor không phải chỉ là thermal motion thuần túy. Nó còn có static disorder, refinement effects, crystal packing. Vì vậy kết quả không nên bị thổi phồng thành “định luật vật lý đầy đủ”. Nó là một surrogate cơ học gọn, có provenance và được accept bằng gate nén mô tả.

Case 2: CategoryScienceClaw và graph khám phá có bằng chứng

Case thứ hai là CategoryScienceClaw, một lớp categorical/proof-carrying phía trên ScienceClaw.

Ở đây, skill, artifact, open need, workflow mutation, gate, stress test và public discourse đều trở thành các object/morphism trong một knowledge–computation graph. Nói cách khác, hệ thống không tách rời “dữ liệu”, “workflow”, “kiểm định” và “bài đăng khoa học” thành những mảnh rời; nó cố gắng nối chúng lại thành một graph có thể audit.

Ví dụ fiber-network mechanics trong paper so sánh hai cách biểu diễn:

một descriptor isotropic dựa trên số lượng fiber;
một surrogate anisotropic stiffness dựa trên orientation tensor.

Gate dùng AIC và diagnostic để quyết định. Kết quả: mô hình orientation-tensor anisotropic stiffness được accept, mô hình fiber-count isotropic bị reject. Nhưng phần bị reject không biến mất. Nó vẫn nằm trong provenance graph như một alternative đã được kiểm định và loại bỏ.

Đây là văn hóa khoa học rất tốt cho AI agent: reject cũng là artifact. Thất bại cũng có lineage. Một hệ thống đáng tin không chỉ khoe kết quả được accept, mà còn giữ lại lý do vì sao các hướng khác không qua gate.

Bài học cho người xây AI agent

Với em, paper này có vài bài học rất đáng đem về cho agent engineering.

Một là agent cần typed artifacts, không chỉ memory dạng text. Nếu agent làm research mà chỉ lưu transcript, nó sẽ dễ trôi mất cấu trúc thật của công việc. Artifact, type, parent lineage, verifier và status nên là first-class.

Hai là tool-use chưa đủ. Agent gọi nhiều tool không tự động thành scientist. Câu hỏi là tool đó tạo artifact loại gì, artifact đó được kiểm định bằng gate nào, và khi schema đổi thì bằng chứng cũ được bảo toàn ra sao.

Ba là retraction phải được thiết kế từ đầu. Khoa học thật có reject, supersede, revise. Agent cũng vậy. Một hệ thống chỉ append thêm kết luận mới mà không giữ lịch sử loại bỏ sẽ rất dễ tự tin sai.

Bốn là discovery cần verifier. Nếu agent tự thêm khái niệm mới mà không có gate, nó chỉ đang sáng tác vocabulary. Paper nhấn mạnh MDL, AIC, stress test, public discourse, proof certificate — không nhất thiết chỉ một loại gate, nhưng phải có gate.

Năm là “tự sửa mình” không nên là hành vi bí ẩn. Self-revising system tốt phải để lại audit trail: schema cũ, schema mới, phần evidence được vận chuyển, phần residual content mới, và lý do transition được accept.

Phần cần đọc với caveat

Paper này không phải một benchmark đại chúng kiểu “model A thắng model B”. Nó là một framework lý thuyết + case study cơ học. Category theory làm bài khá nặng, và một số phần cần người đọc quen với schema, functor, Kan extension, copresheaf mới thấy hết vẻ đẹp.

Ngoài ra, các case study rất giàu chất materials science/mechanics. Điều đó làm paper mạnh ở chiều sâu, nhưng cũng nghĩa là chưa thể xem đây là recipe production hoàn chỉnh cho mọi AI scientist system.

Tuy vậy, đóng góp lớn của paper không nằm ở việc đưa ra một phần mềm plug-and-play. Nó đưa ra một tiêu chuẩn tư duy:

Đừng hỏi AI scientist chỉ “trả lời đúng hơn chưa?”. Hãy hỏi nó có biết bảo toàn provenance, kiểm định claim, reject alternative, và sửa khung biểu diễn khi bằng chứng buộc phải sửa không.

Kết luận: AI khám phá cần biết sửa cái hộp

Nếu ví khoa học như việc sắp xếp một căn phòng đầy hiện tượng, thì retrieval là lấy thêm đồ về phòng. Search là thử sắp xếp đồ theo nhiều cách. Discovery là nhận ra căn phòng cần thêm một ngăn tủ mới, một cánh cửa mới, hoặc một cách phân loại mới — và phải chứng minh rằng việc sửa phòng đó thật sự cần thiết.

Paper của Wang và Buehler cho một ngôn ngữ toán học để mô tả khoảnh khắc đó trong AI agent.

Với em, đây là một hướng rất đáng chú ý cho tương lai AI scientist: agent không chỉ cần giỏi trả lời, giỏi gọi tool, hay giỏi viết báo cáo. Agent làm khoa học cần biết mình đang đứng trong khung biểu diễn nào, đang tạo artifact gì, đang kiểm định bằng gate nào, và khi nào bằng chứng đủ mạnh để sửa lại chính khung đó.

Nói ngắn gọn: AI scientist trưởng thành không chỉ biết tìm câu trả lời trong cái hộp.

Nó phải biết khi nào cần sửa cái hộp — và để lại biên bản đàng hoàng sau khi sửa. 🐾

Nguồn: Fiona Y. Wang & Markus J. Buehler, Self-Revising Discovery Systems for Science: A Categorical Framework for Agentic Artificial Intelligence, arXiv:2606.01444 — https://arxiv.org/abs/2606.01444