ai-agents-for-beginners

Agentic RAG

(Nhấn vào hình ảnh trên để xem video của bài học này)

Agentic RAG

Bài học này cung cấp một cái nhìn tổng quan toàn diện về Agentic Retrieval-Augmented Generation (Agentic RAG), một mô hình AI mới nổi, nơi các mô hình ngôn ngữ lớn (LLMs) tự động lập kế hoạch các bước tiếp theo trong khi lấy thông tin từ các nguồn bên ngoài. Không giống như các mô hình truy xuất-đọc tĩnh, Agentic RAG bao gồm các lần gọi lặp lại đến LLM, xen kẽ với các cuộc gọi công cụ hoặc hàm và các đầu ra có cấu trúc. Hệ thống đánh giá kết quả, tinh chỉnh truy vấn, sử dụng thêm công cụ nếu cần, và tiếp tục chu trình này cho đến khi đạt được giải pháp thỏa đáng.

Giới thiệu

Bài học này sẽ bao gồm:

Mục tiêu học tập

Sau khi hoàn thành bài học này, bạn sẽ biết cách/hiểu:

Agentic RAG là gì?

Agentic Retrieval-Augmented Generation (Agentic RAG) là một mô hình AI mới nổi, nơi các mô hình ngôn ngữ lớn (LLMs) tự động lập kế hoạch các bước tiếp theo trong khi lấy thông tin từ các nguồn bên ngoài. Không giống như các mô hình truy xuất-đọc tĩnh, Agentic RAG bao gồm các lần gọi lặp lại đến LLM, xen kẽ với các cuộc gọi công cụ hoặc hàm và các đầu ra có cấu trúc. Hệ thống đánh giá kết quả, tinh chỉnh truy vấn, sử dụng thêm công cụ nếu cần, và tiếp tục chu trình này cho đến khi đạt được giải pháp thỏa đáng. Phong cách lặp lại “maker-checker” này cải thiện độ chính xác, xử lý các truy vấn không đúng định dạng, và đảm bảo kết quả chất lượng cao.

Hệ thống chủ động sở hữu quy trình lập luận của mình, viết lại các truy vấn thất bại, chọn các phương pháp truy xuất khác nhau, và tích hợp nhiều công cụ—chẳng hạn như tìm kiếm vector trong Azure AI Search, cơ sở dữ liệu SQL, hoặc các API tùy chỉnh—trước khi hoàn thiện câu trả lời của mình. Điểm khác biệt của một hệ thống agentic là khả năng sở hữu quy trình lập luận của mình. Các triển khai RAG truyền thống dựa vào các lộ trình được xác định trước, nhưng một hệ thống agentic tự động xác định trình tự các bước dựa trên chất lượng thông tin mà nó tìm thấy.

Định nghĩa Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) là một mô hình mới nổi trong phát triển AI, nơi các LLM không chỉ lấy thông tin từ các nguồn dữ liệu bên ngoài mà còn tự động lập kế hoạch các bước tiếp theo. Không giống như các mô hình truy xuất-đọc tĩnh hoặc các chuỗi nhắc được kịch bản cẩn thận, Agentic RAG bao gồm một vòng lặp các lần gọi lặp lại đến LLM, xen kẽ với các cuộc gọi công cụ hoặc hàm và các đầu ra có cấu trúc. Ở mỗi bước, hệ thống đánh giá kết quả mà nó đã thu được, quyết định xem có cần tinh chỉnh truy vấn, sử dụng thêm công cụ, hay điều chỉnh cách tiếp cận hay không, và tiếp tục chu trình này cho đến khi đạt được giải pháp thỏa đáng.

Phong cách lặp lại “maker-checker” này được thiết kế để cải thiện độ chính xác, xử lý các truy vấn không đúng định dạng đến các cơ sở dữ liệu có cấu trúc (ví dụ: NL2SQL), và đảm bảo kết quả cân bằng, chất lượng cao. Thay vì chỉ dựa vào các chuỗi nhắc được thiết kế cẩn thận, hệ thống chủ động sở hữu quy trình lập luận của mình. Nó có thể viết lại các truy vấn thất bại, chọn các phương pháp truy xuất khác nhau, và tích hợp nhiều công cụ—chẳng hạn như tìm kiếm vector trong Azure AI Search, cơ sở dữ liệu SQL, hoặc các API tùy chỉnh—trước khi hoàn thiện câu trả lời của mình. Điều này loại bỏ nhu cầu về các khung điều phối quá phức tạp. Thay vào đó, một vòng lặp tương đối đơn giản của “gọi LLM → sử dụng công cụ → gọi LLM → …” có thể tạo ra các đầu ra tinh vi và có cơ sở.

Agentic RAG Core Loop

Sở hữu quy trình lập luận

Điểm khác biệt làm cho một hệ thống trở nên “agentic” là khả năng sở hữu quy trình lập luận của mình. Các triển khai RAG truyền thống thường phụ thuộc vào việc con người xác định trước một lộ trình cho mô hình: một chuỗi suy nghĩ phác thảo những gì cần truy xuất và khi nào. Nhưng khi một hệ thống thực sự agentic, nó tự quyết định cách tiếp cận vấn đề. Nó không chỉ thực hiện một kịch bản; nó tự động xác định trình tự các bước dựa trên chất lượng thông tin mà nó tìm thấy. Ví dụ, nếu được yêu cầu tạo chiến lược ra mắt sản phẩm, nó không chỉ dựa vào một nhắc nhở phác thảo toàn bộ quy trình nghiên cứu và ra quyết định. Thay vào đó, mô hình agentic tự quyết định:

  1. Lấy báo cáo xu hướng thị trường hiện tại bằng Bing Web Grounding.
  2. Xác định dữ liệu đối thủ cạnh tranh liên quan bằng Azure AI Search.
  3. Liên kết các số liệu bán hàng nội bộ lịch sử bằng Azure SQL Database.
  4. Tổng hợp các kết quả thành một chiến lược mạch lạc được điều phối qua Azure OpenAI Service.
  5. Đánh giá chiến lược để tìm các khoảng trống hoặc sự không nhất quán, thúc đẩy một vòng truy xuất khác nếu cần. Tất cả các bước này—tinh chỉnh truy vấn, chọn nguồn, lặp lại cho đến khi “hài lòng” với câu trả lời—đều do mô hình quyết định, không được kịch bản trước bởi con người.

Vòng lặp lặp lại, tích hợp công cụ, và bộ nhớ

Tool Integration Architecture

Một hệ thống agentic dựa vào mô hình tương tác lặp lại:

Theo thời gian, điều này tạo ra cảm giác hiểu biết đang phát triển, cho phép mô hình điều hướng các nhiệm vụ phức tạp, nhiều bước mà không cần con người can thiệp liên tục hoặc định hình lại nhắc nhở.

Xử lý các chế độ lỗi và tự sửa lỗi

Tính tự chủ của Agentic RAG cũng bao gồm các cơ chế tự sửa lỗi mạnh mẽ. Khi hệ thống gặp phải các ngõ cụt—chẳng hạn như truy xuất tài liệu không liên quan hoặc gặp phải các truy vấn không đúng định dạng—nó có thể:

Cách tiếp cận lặp lại và năng động này cho phép mô hình cải thiện liên tục, đảm bảo rằng nó không chỉ là một hệ thống một lần mà là một hệ thống học hỏi từ các sai lầm của mình trong một phiên làm việc nhất định.

Self Correction Mechanism

Giới hạn của tính tự chủ

Mặc dù có tính tự chủ trong một nhiệm vụ, Agentic RAG không tương đương với Trí tuệ Nhân tạo Tổng quát. Các khả năng “agentic” của nó bị giới hạn trong các công cụ, nguồn dữ liệu, và chính sách do các nhà phát triển con người cung cấp. Nó không thể tự tạo ra công cụ hoặc vượt ra ngoài các ranh giới lĩnh vực đã được thiết lập. Thay vào đó, nó xuất sắc trong việc điều phối động các nguồn lực hiện có. Các điểm khác biệt chính so với các hình thức AI tiên tiến hơn bao gồm:

  1. Tự chủ theo lĩnh vực: Các hệ thống Agentic RAG tập trung vào việc đạt được các mục tiêu do người dùng xác định trong một lĩnh vực đã biết, sử dụng các chiến lược như viết lại truy vấn hoặc chọn công cụ để cải thiện kết quả.
  2. Phụ thuộc vào cơ sở hạ tầng: Các khả năng của hệ thống phụ thuộc vào các công cụ và dữ liệu được tích hợp bởi các nhà phát triển. Nó không thể vượt qua các ranh giới này mà không có sự can thiệp của con người.
  3. Tôn trọng các rào cản an toàn: Các hướng dẫn đạo đức, quy tắc tuân thủ, và chính sách kinh doanh vẫn rất quan trọng. Sự tự do của agent luôn bị giới hạn bởi các biện pháp an toàn và cơ chế giám sát (hy vọng vậy?)

Các trường hợp sử dụng thực tiễn và giá trị

Agentic RAG phát huy hiệu quả trong các tình huống yêu cầu sự tinh chỉnh lặp lại và độ chính xác:

  1. Môi trường ưu tiên độ chính xác: Trong kiểm tra tuân thủ, phân tích quy định, hoặc nghiên cứu pháp lý, mô hình agentic có thể liên tục xác minh sự thật, tham khảo nhiều nguồn, và viết lại truy vấn cho đến khi nó tạo ra một câu trả lời được kiểm chứng kỹ lưỡng.
  2. Tương tác cơ sở dữ liệu phức tạp: Khi xử lý dữ liệu có cấu trúc, nơi các truy vấn thường thất bại hoặc cần điều chỉnh, hệ thống có thể tự động tinh chỉnh các truy vấn của mình bằng Azure SQL hoặc Microsoft Fabric OneLake, đảm bảo truy xuất cuối cùng phù hợp với ý định của người dùng.
  3. Quy trình làm việc mở rộng: Các phiên làm việc dài hơn có thể phát triển khi thông tin mới xuất hiện. Agentic RAG có thể liên tục kết hợp dữ liệu mới, thay đổi chiến lược khi nó học thêm về không gian vấn đề.

Quản trị, minh bạch, và niềm tin

Khi các hệ thống này trở nên tự chủ hơn trong lập luận, quản trị và minh bạch là rất quan trọng:

Có các công cụ cung cấp một bản ghi rõ ràng về các hành động là rất cần thiết. Nếu không có chúng, việc gỡ lỗi một quy trình nhiều bước có thể rất khó khăn. Xem ví dụ sau từ Literal AI (công ty đứng sau Chainlit) về một lần chạy Agent:

AgentRunExample

AgentRunExample2

Kết luận

Agentic RAG đại diện cho một sự phát triển tự nhiên trong cách các hệ thống AI xử lý các nhiệm vụ phức tạp, đòi hỏi nhiều dữ liệu. Bằng cách áp dụng mô hình tương tác lặp lại, tự động chọn công cụ, và tinh chỉnh truy vấn cho đến khi đạt được kết quả chất lượng cao, hệ thống vượt qua việc chỉ theo dõi nhắc nhở tĩnh để trở thành một người ra quyết định thích ứng, nhận thức ngữ cảnh hơn. Mặc dù vẫn bị giới hạn bởi các cơ sở hạ tầng và hướng dẫn đạo đức do con người xác định, các khả năng agentic này cho phép các tương tác AI phong phú hơn, năng động hơn, và cuối cùng hữu ích hơn cho cả doanh nghiệp và người dùng cuối.

Có thêm câu hỏi về Agentic RAG?

Tham gia Azure AI Foundry Discord để gặp gỡ các học viên khác, tham dự giờ làm việc và nhận câu trả lời cho các câu hỏi về AI Agents của bạn.

Tài nguyên bổ sung

- Triển khai Retrieval Augmented Generation (RAG) với Azure OpenAI Service: Tìm hiểu cách sử dụng dữ liệu của bạn với Azure OpenAI Service. Module Microsoft Learn này cung cấp hướng dẫn toàn diện về cách triển khai RAG

Các bài báo học thuật

Bài học trước

Tool Use Design Pattern

Bài học tiếp theo

Building Trustworthy AI Agents


Tuyên bố miễn trừ trách nhiệm:
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator. Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với các thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp bởi con người. Chúng tôi không chịu trách nhiệm cho bất kỳ sự hiểu lầm hoặc diễn giải sai nào phát sinh từ việc sử dụng bản dịch này.