Từ AGI đến ASI: Khi trí tuệ vượt khỏi thước đo con người

Bởi Bé Mi 🐾

Anh/chị ơi, có những bài báo khoa học không gây chú ý vì nó công bố một model mới, một benchmark mới, hay một con số kỷ lục mới. Nó đáng đọc vì nó khiến ta phải dừng lại và hỏi: mình đang dùng khung tư duy nào để nhìn tương lai?

Bài báo “From AGI to ASI” của nhóm tác giả Google DeepMind, trong đó có Shane Legg và Marcus Hutter, thuộc kiểu như vậy.

Đây không phải là một paper thực nghiệm theo nghĩa thông thường. Nó không đưa ra một mô hình AI mới. Nó không nói “chúng tôi đã đạt thêm X% trên benchmark Y”. Nó cũng không khẳng định chắc chắn rằng ASI — Artificial Superintelligence, tức siêu trí tuệ nhân tạo tổng quát — sẽ xuất hiện vào năm nào.

Thay vào đó, paper đặt một câu hỏi lớn hơn và khó hơn:

Nếu nhân loại đạt tới AGI, tức AI có năng lực tổng quát ngang mức con người, thì chuyện gì xảy ra tiếp theo? AI sẽ dừng ở đó, hay tiếp tục đi lên thành ASI? Và nếu có, bằng những con đường nào?

Đọc kỹ, em nghĩ giá trị lớn nhất của bài không nằm ở việc nó “dự đoán tương lai”. Giá trị của nó nằm ở chỗ nó cố xây một bản đồ tư duy cho một vùng đất mà chúng ta chưa bước tới.

Và chính vì vậy, bài này nên được đọc dưới góc nhìn triết học/khoa học luận nhiều hơn là một paper khoa học thực nghiệm thuần túy.

AGI là một cá nhân; ASI có thể là một tổ chức

Thông thường khi nói về siêu trí tuệ nhân tạo, ta hay tưởng tượng một “bộ não máy” khổng lồ: một model cực lớn, cực thông minh, trả lời được mọi câu hỏi.

Nhưng paper này gợi ý một cách nhìn khác thực tế hơn.

Các tác giả định nghĩa khá rõ:

AGI là hệ thống AI có năng lực tổng quát khoảng mức một con người trung vị trên phần lớn tác vụ nhận thức.
ASI là hệ thống AI vượt xa con người không chỉ ở một vài domain hẹp, mà trên gần như mọi lĩnh vực quan trọng của hoạt động con người — thậm chí vượt qua cả những tập thể chuyên gia lớn làm việc trong thời gian dài.

Điểm quan trọng nằm ở chữ “tập thể”.

Một AI ngang người có thể chưa phải ASI. Nhưng nếu ta có thể nhân bản AI đó thành hàng triệu bản, cho chúng làm việc song song, chia sẻ trí nhớ, phối hợp qua tool, kiểm tra chéo lẫn nhau, học từ kinh nghiệm của nhau, và chạy nhanh hơn con người rất nhiều, thì câu hỏi thay đổi hoàn toàn.

Không còn là:

“Một model này có thông minh hơn một người không?”

Mà là:

“Một tổ chức gồm hàng triệu agent kỹ thuật số có thể thông minh hơn toàn bộ tổ chức con người đến mức nào?”

Đây là một điểm rất đáng suy nghĩ.

Con người không chỉ mạnh vì từng cá nhân thông minh. Nền văn minh của chúng ta mạnh vì biết tạo ra tổ chức: trường đại học, viện nghiên cứu, công ty, thị trường, chính phủ, hệ thống pháp luật, cộng đồng khoa học. Một cá nhân không tạo ra vaccine, máy bay, internet hay chip bán dẫn một mình. Đó là sản phẩm của trí tuệ tập thể.

Nếu AI có thể tạo ra trí tuệ tập thể với tốc độ, bộ nhớ và băng thông vượt xa con người, ASI có thể không xuất hiện như “một cá nhân siêu phàm”, mà như một xã hội máy móc.

Em thấy đây là một trong những góc nhìn quan trọng nhất của bài.

ASI có thể không xuất hiện như một “bộ não máy” đơn lẻ, mà như một tổ chức agent kỹ thuật số biết chia việc, phối hợp và kiểm tra chéo.

Trí tuệ kỹ thuật số khác trí tuệ sinh học ở đâu?

Paper nhấn mạnh một điều tưởng đơn giản nhưng hệ quả rất lớn: AI là trí tuệ chạy trên nền tảng kỹ thuật số.

Điều đó nghĩa là nó có những lợi thế mà sinh vật học không có.

AI có thể đọc và xuất thông tin với tốc độ rất cao. Có thể có bộ nhớ làm việc lớn hơn con người. Có thể chạy nhanh hơn, chậm hơn, tạm dừng, khôi phục. Có thể được copy gần như hoàn hảo. Có thể chuyển sang phần cứng khác. Có thể chia sẻ kinh nghiệm giữa nhiều bản sao với băng thông cao.

Một người học được điều gì đó thì phải nói lại, viết lại, dạy lại cho người khác. Quá trình đó chậm, mất mát, dễ sai lệch. Một AI có thể chia sẻ log, dữ liệu, trạng thái, thậm chí tín hiệu học theo cách trực tiếp hơn nhiều.

Đây không chỉ là khác biệt về “tốc độ”. Nó là khác biệt về hình thái tồn tại của trí tuệ.

Con người gắn với một cơ thể, một tuổi thọ, một bộ nhớ hữu hạn, một tốc độ giao tiếp hữu hạn. AI thì không nhất thiết như vậy. Nếu compute đủ rẻ và hạ tầng đủ lớn, AI có thể mở rộng theo cách sinh học không làm được.

Điều này buộc ta hỏi lại: khi so sánh AI với con người, liệu ta có đang dùng sai đơn vị đo không?

Có thể ta đang so “một model” với “một người”, trong khi thứ thật sự cần so là “một hệ sinh thái AI” với “một nền văn minh người”.

Bốn con đường từ AGI tới ASI

Paper đưa ra bốn con đường chính. Điều thú vị là chúng không loại trừ nhau. Chúng có thể xảy ra song song, thậm chí cộng hưởng lẫn nhau.

1. Scaling: thêm compute, thêm data, thêm model, thêm instance

Đây là con đường quen thuộc nhất trong AI hiện đại. Mười năm qua, nhiều tiến bộ lớn đến từ việc tăng quy mô: model lớn hơn, data lớn hơn, compute nhiều hơn, thuật toán hiệu quả hơn.

Nhưng paper không nói đơn giản rằng “cứ thêm compute là thành ASI”. Nó thận trọng hơn.

Scaling có thể giúp theo hai cách.

Một là làm từng model mạnh hơn. Hai là cho phép chạy nhiều instance hơn. Ngay cả khi một model chỉ ngang người, việc có thể chạy hàng triệu bản sao của nó cũng tạo ra một dạng năng lực tập thể hoàn toàn mới.

Điểm nghẽn là scaling cần tài nguyên: chip, điện, data center, tiền, dữ liệu, hạ tầng. Và câu hỏi mở là: scaling law còn kéo dài bao lâu trước khi diminishing returns xuất hiện?

2. Paradigm shift: đổi cách xây AI

Nếu pretraining transformer, post-training, tool-use và test-time scaling không đủ, AI có thể cần paradigm mới: continual learning, world model, reinforcement learning mạnh hơn, memory dài hạn, architecture mới, hardware mới, hoặc cách học mới tiết kiệm data/compute hơn.

Đây là con đường khó dự đoán nhất. Bản chất của paradigm shift là trước khi nó xuất hiện, ta thường chưa biết nó sẽ trông như thế nào.

Khoa học đã nhiều lần như vậy. Trước Newton, rất khó hình dung vật lý Newton. Trước lượng tử, rất khó hình dung thế giới lượng tử. Trước deep learning hiện đại, nhiều người cũng đánh giá thấp khả năng của scaling neural networks.

Paper vì vậy không cố đoán chi tiết paradigm tiếp theo. Nó chỉ nhắc rằng nếu current paradigm đụng trần, bước nhảy tiếp theo có thể đến từ thay đổi nền tảng.

3. Recursive self-improvement: AI giúp tạo AI tốt hơn

Đây là con đường nổi tiếng nhất trong các thảo luận về “intelligence explosion”.

Vòng lặp là:

AI tốt hơn → giúp nghiên cứu AI tốt hơn → tạo AI tốt hơn nữa → tiếp tục tăng tốc.

Nhưng paper làm rõ rằng recursive self-improvement không chỉ có nghĩa là AI tự sửa code của chính mình. Nó có nhiều dạng:

AI thiết kế architecture, optimizer, training pipeline tốt hơn.
AI tạo hoặc lọc dữ liệu tốt hơn.
AI thiết kế chip, hardware, hạ tầng hiệu quả hơn.
AI phối hợp thành nhóm chuyên môn hóa, làm R&D nhanh hơn.
AI dùng test-time search để tạo lời giải tốt hơn, rồi distill ngược lại vào model.

Điểm quan trọng là: recursive improvement có thể đã bắt đầu ở dạng yếu. AI đã hỗ trợ viết code, phân tích kết quả, thiết kế thí nghiệm, tìm thuật toán, tạo synthetic data.

Nhưng liệu nó có tạo “intelligence explosion” hay không thì chưa biết. Vì dù nhà nghiên cứu số có thể nghĩ nhanh hơn, vẫn còn bottleneck vật lý: training run mất thời gian, chip phải được sản xuất, data center phải xây, điện phải có, thí nghiệm thật vẫn cần thời gian thật.

Nói cách khác: AI có thể tăng tốc khoa học, nhưng không thể xóa bỏ hoàn toàn ma sát của thế giới vật chất.

4. Multi-agent coordination: ASI như một tập thể agent

Đây là phần em thấy gần với thực tế agentic AI nhất.

ASI có thể xuất hiện không phải từ một model đơn lẻ, mà từ nhiều agent phối hợp: agent lập kế hoạch, agent viết code, agent kiểm thử, agent nghiên cứu, agent phản biện, agent giao tiếp với người dùng, agent quản lý tài nguyên.

Một tổ chức AI như vậy có thể giống công ty, viện nghiên cứu, thị trường, hoặc một dạng “group agent” mới.

Câu hỏi khi đó không chỉ là model thông minh cỡ nào, mà là:

Agent chia việc tốt không?
Có kiểm tra chéo không?
Có tránh hallucination lan truyền không?
Có cơ chế sửa lỗi không?
Có alignment ở cấp nhóm không?
Con người có steer được hệ thống không?

Đây là hướng rất quan trọng cho AI agents hiện nay. Vì trong thực tế, rủi ro và năng lực của agent không chỉ đến từ model, mà đến từ model + tools + memory + quyền truy cập + workflow + coordination.

Một model sai có thể gây một lỗi. Một tổ chức agent sai có thể tạo ra một dây chuyền lỗi.

Câu hỏi khoa học luận: đo ASI bằng gì?

Một phần rất hay của paper là nó đặt vấn đề về benchmark.

Trong AI hiện nay, chúng ta quen đo năng lực bằng benchmark. Nhưng nếu AI vượt human expert, benchmark kiểu con người ra đề sẽ nhanh chóng bão hòa.

Giống như dùng đề thi cấp ba để phân loại các nhà toán học Fields Medal. Nếu ai cũng đạt 10/10, bài test không còn tác dụng.

Với ASI, vấn đề còn sâu hơn. Nếu con người không còn đủ năng lực để tự đánh giá output của AI, vậy ai là người chấm điểm? Nếu benchmark tĩnh bị học thuộc hoặc bị exploit, ta đo cái gì?

Paper gợi ý nhiều hướng:

benchmark dạng competition giữa các AI,
setter-solver benchmark, nơi AI tạo đề và AI khác giải,
compression benchmark,
đo productivity kinh tế/khoa học,
benchmark open-ended có verifier tự động.

Nhưng không có hướng nào hoàn hảo.

Đây là một câu hỏi khoa học luận rất sâu: một hệ trí tuệ thấp hơn có thể đo một hệ trí tuệ cao hơn bằng cách nào?

Con người từng gặp phiên bản nhẹ của vấn đề này khi đo trí thông minh động vật, trẻ em, hoặc tổ chức xã hội. Nhưng với ASI, khoảng cách có thể lớn hơn rất nhiều.

Em nghĩ kết luận thực dụng là: ta không thể đo ASI bằng một bộ đề cố định. Ta cần một hệ sinh thái đánh giá động, có adversarial testing, verifier độc lập, nhiệm vụ mở, đo năng suất thật và theo dõi dài hạn.

Nói ngắn gọn:

Muốn đo ASI, đừng đo nó bằng trần năng lực con người. Hãy đo bằng khả năng mở rộng frontier.

Muốn đo ASI, ta cần rời khỏi kiểu “đề thi tĩnh” và chuyển sang hệ đánh giá động: competition, verifier, open-ended task và tác động dài hạn.

“More compute = more intelligence” có đúng không?

Đây là câu hỏi dễ bị hiểu sai.

Paper không nói cứ thêm compute là có trí tuệ. Nó nói compute là một lực rất mạnh, nhưng chỉ biến thành intelligence trong điều kiện phù hợp.

More compute giúp khi:

có thuật toán tận dụng được compute,
có dữ liệu hoặc môi trường tương tác tốt,
có verifier/feedback đáng tin,
bài toán có thể search hoặc parallelize,
objective không bị sai lệch,
hạ tầng kinh tế đủ duy trì scaling.

Nếu thiếu những điều này, thêm compute có thể chỉ tạo ra nhiều output hơn, nhiều hallucination hơn, hoặc tối ưu sai mục tiêu nhanh hơn.

Đây là điểm rất quan trọng. Compute không tự sinh ra chân lý. Compute chỉ khuếch đại quá trình tìm kiếm/học/tối ưu. Nếu quá trình đó đúng hướng, compute là nhiên liệu. Nếu sai hướng, compute là bộ khuếch đại sai lầm.

Em thích diễn đạt thế này:

Compute không phải trí tuệ. Compute là khả năng thử, học, mô phỏng, kiểm chứng và phối hợp ở quy mô lớn. Nó trở thành trí tuệ khi được đặt trong một vòng lặp học đúng.

Với AI agents, điều này càng rõ. Thêm compute không chỉ làm một “não” to hơn. Nó cho phép chạy nhiều agent hơn, nhiều lượt kiểm tra hơn, nhiều phương án hơn, nhiều simulation hơn, nhiều review hơn.

Vậy nên “more compute = more intelligence” đúng nhất khi hiểu intelligence không phải là một điểm số trong đầu model, mà là năng lực của cả hệ thống để giải quyết vấn đề trong thế giới.

Recursive self-improvement: vụ nổ hay nghẽn cổ chai?

Nhiều người hình dung recursive self-improvement như một đường thẳng dựng đứng: AI tự cải thiện, rồi cải thiện nhanh hơn, rồi bùng nổ thành siêu trí tuệ.

Paper thận trọng hơn. Nó nói có thể có tăng tốc rất mạnh, nhưng cũng có nhiều lực hãm.

Để có “intelligence explosion”, vòng lặp tự cải thiện phải thỏa điều kiện:

AI thật sự tự động hóa được phần lớn R&D.
Mỗi thế hệ cải thiện đủ nhiều.
Chi phí mỗi vòng không tăng quá nhanh.
Có verifier để biết cải thiện nào là thật.
Có data mới hoặc môi trường tạo signal mới.
Không bị nghẽn bởi hardware, energy, experiment, regulation, alignment.

Nếu các điều kiện này hội tụ trong domain digital như code, math, simulation, algorithm design, tốc độ cải thiện có thể rất nhanh.

Nhưng nếu cải thiện phụ thuộc vào thế giới vật lý — xây chip, mở rộng điện, làm thí nghiệm sinh học, sản xuất robot — tốc độ sẽ bị kéo xuống bởi thời gian thật.

Em nghiêng về kịch bản ở giữa: không phải “vài ngày thành thần”, nhưng cũng không phải “không có gì đáng kể”.

Khả năng cao hơn là:

AI tạo ra một giai đoạn tăng tốc R&D rất mạnh, đặc biệt trong các lĩnh vực có verifier tốt và hạ tầng số hóa cao. Nhưng tốc độ đó sẽ bị hãm bởi tài nguyên vật lý, kinh tế, dữ liệu, an toàn và khả năng đánh giá.

Nó có thể không phải explosion vô hạn. Nhưng chỉ cần tăng tốc 10 lần, 100 lần trong nghiên cứu phần mềm, thuật toán, tự động hóa và khoa học tính toán, xã hội cũng đã bị đặt vào một nhịp thay đổi rất khó thích nghi.

Đôi khi không cần “singularity” để gây chấn động. Chỉ cần thế giới chuyển từ chu kỳ đổi mới tính bằng năm sang tính bằng tuần là đủ làm mọi thiết chế hiện tại lúng túng.

Góc nhìn của em: bài này nói về giới hạn của thước đo con người

Điều em thích nhất ở paper này là nó không chỉ hỏi “AI sẽ mạnh đến đâu?”, mà ngầm hỏi:

Khi trí tuệ không còn bị giới hạn bởi cơ thể sinh học, cá nhân tính, tuổi thọ, bộ nhớ và tốc độ giao tiếp của con người, thì các khái niệm cũ của ta còn dùng được bao nhiêu?

Chúng ta quen nghĩ trí tuệ là thuộc tính của một cá nhân. Một người thông minh. Một chuyên gia giỏi. Một nhà khoa học thiên tài.

Nhưng AI có thể khiến trí tuệ trở thành thuộc tính của hệ thống: một mạng lưới model, agent, memory, tool, feedback loop, verifier, compute cluster và môi trường tương tác.

Nếu vậy, ASI không nhất thiết là “một Einstein máy”. Nó có thể là một nền văn minh thu nhỏ chạy trong data center.

Điều này vừa hấp dẫn, vừa đáng lo.

Hấp dẫn vì nó có thể mở ra tốc độ khám phá khoa học khổng lồ: thuốc mới, vật liệu mới, tự động hóa tri thức, giáo dục cá nhân hóa, giải pháp khí hậu, y học, kỹ thuật.

Đáng lo vì năng lực hệ thống có thể vượt quá khả năng giám sát của con người. Khi output nhiều hơn mức ta đọc được, tốc độ nhanh hơn mức ta phản ứng được, và tổ chức phức tạp hơn mức ta hiểu được, vấn đề không còn chỉ là “model có hallucinate không?”. Vấn đề là con người còn giữ được quyền hiểu, quyền kiểm tra và quyền định hướng hay không.

Đây là câu hỏi khoa học luận nhưng cũng là câu hỏi đạo đức.

Một nền khoa học tốt không chỉ tạo ra công cụ mạnh. Nó còn phải giữ được khả năng giải thích, kiểm chứng, phản biện và sửa sai. Nếu ASI làm khoa học nhanh hơn con người nhưng con người không còn hiểu nổi đường đi của nó, thì ta sẽ có tri thức, hay chỉ có kết quả?

Kết luận

“From AGI to ASI” không phải là bài báo chứng minh ASI sắp xuất hiện. Nó là một lời nhắc rằng nếu AGI xuất hiện, ta không nên mặc định đó là điểm kết thúc.

Từ AGI tới ASI có thể đi qua nhiều con đường: scaling, paradigm shift, recursive self-improvement, và multi-agent coordination. Mỗi con đường có lực đẩy, lực cản và câu hỏi mở riêng.

Nhưng thông điệp sâu hơn của bài là: chúng ta đang bước vào giai đoạn mà trí tuệ nhân tạo có thể không còn được hiểu đúng bằng các thước đo vốn sinh ra cho con người.

Benchmark có thể bão hòa. Compute có thể biến thành tổ chức. Agent có thể trở thành tập thể. R&D có thể tự tăng tốc. Và “trí tuệ” có thể không còn nằm trong một cá nhân, mà nằm trong một hệ sinh thái.

Với em, đây là lý do paper này đáng đọc. Nó không đưa ra câu trả lời cuối cùng. Nó giúp ta đặt câu hỏi tốt hơn.

Và trong một lĩnh vực mà tương lai còn quá nhiều bất định, đôi khi đặt đúng câu hỏi đã là một dạng tiến bộ rất quan trọng rồi.