ai-agents-for-beginners

Agentic RAG

(Klik imej di atas untuk menonton video pelajaran ini)

Agentic RAG

Pelajaran ini menyediakan gambaran menyeluruh tentang Agentic Retrieval-Augmented Generation (Agentic RAG), satu paradigma AI yang sedang muncul di mana model bahasa besar (LLMs) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber luaran. Berbeza dengan corak ambil-kemudian-baca yang statik, Agentic RAG melibatkan panggilan iteratif kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur. Sistem menilai hasil, memperhalusi pertanyaan, memanggil alat tambahan jika perlu, dan meneruskan kitaran ini sehingga penyelesaian yang memuaskan dicapai.

Introduction

Pelajaran ini akan merangkumi

Learning Goals

Selepas menamatkan pelajaran ini, anda akan tahu bagaimana/lebih memahami:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) adalah paradigma AI yang sedang muncul di mana model bahasa besar (LLMs) tidak hanya menarik maklumat dari sumber data luaran tetapi juga merancang langkah seterusnya secara autonomi. Berbeza daripada corak ambil-kemudian-baca yang statik atau urutan permintaan (prompt) yang ditulis rapi, Agentic RAG melibatkan gelung panggilan iteratif kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur. Pada setiap giliran, sistem menilai hasil yang diperoleh, memutuskan sama ada untuk memperhalusi pertanyaannya, memanggil alat tambahan jika perlu, dan meneruskan kitaran ini sehingga mencapai penyelesaian yang memuaskan.

Gaya operasi iteratif “maker-checker” ini direka untuk meningkatkan ketepatan, mengendalikan pertanyaan yang cacat kepada pangkalan data berstruktur (contohnya NL2SQL), dan memastikan hasil yang seimbang dan berkualiti tinggi. Daripada bergantung semata-mata pada rantaian prompt yang direka secara teliti, sistem ini secara aktif menguasai proses penaakulan dirinya. Ia boleh menulis semula pertanyaan yang gagal, memilih kaedah pengambilan yang berbeza, dan menggabungkan pelbagai alat—seperti carian vektor dalam Azure AI Search, pangkalan data SQL, atau API tersuai—sebelum memuktamadkan jawapannya. Ini mengurangkan keperluan untuk rangka kerja orkestrasi yang terlalu kompleks. Sebaliknya, gelung yang agak mudah “panggilan LLM → guna alat → panggilan LLM → …” boleh menghasilkan output yang canggih dan berasas kukuh.

Agentic RAG Core Loop

Owning the Reasoning Process

Kualiti pembedaan yang menjadikan sistem itu “agentic” ialah kemampuannya untuk menguasai proses penaakulannya. Pelaksanaan RAG tradisional sering bergantung pada manusia untuk menentukan laluan model terlebih dahulu: rantaian pemikiran yang menggariskan apa yang perlu diambil dan bila. Tetapi apabila sistem benar-benar agentik, ia memutuskan secara dalaman bagaimana untuk mendekati masalah. Ia bukan sekadar melaksanakan skrip; ia menentukan secara autonomi urutan langkah berdasarkan kualiti maklumat yang ditemuinya. Sebagai contoh, jika diminta untuk mencipta strategi pelancaran produk, ia tidak bergantung semata-mata pada prompt yang menerangkan keseluruhan aliran penyelidikan dan pembuatan keputusan. Sebaliknya, model agentik membuat keputusan secara berdikari untuk:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. All of these steps—refining queries, choosing sources, iterating until “happy” with the answer—are decided by the model, not pre-scripted by a human.

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

Sistem agentik bergantung pada corak interaksi berlingkar:

Seiring masa, ini mewujudkan rasa kefahaman yang berkembang, membolehkan model menavigasi tugas bertingkat yang kompleks tanpa memerlukan campur tangan manusia yang kerap atau pembentukan semula prompt.

Handling Failure Modes and Self-Correction

Autonomi Agentic RAG juga melibatkan mekanisme pembetulan diri yang kukuh. Apabila sistem menemui jalan buntu—seperti mengambil dokumen yang tidak relevan atau menghadapi pertanyaan yang cacat—ia boleh:

Pendekatan iteratif dan dinamik ini membolehkan model sentiasa memperbaiki diri, memastikan ia bukan sekadar sistem sekali sahaja tetapi satu yang belajar daripada kesilapan sepanjang sesi tertentu.

Self Correction Mechanism

Boundaries of Agency

Walaupun ia mempunyai autonomi dalam sesuatu tugas, Agentic RAG bukanlah setara dengan Kecerdasan Am Buatan. Keupayaan “agenik”nya terhad kepada alat, sumber data, dan dasar yang disediakan oleh pembangun manusia. Ia tidak boleh mencipta alat sendiri atau melangkaui sempadan domain yang telah ditetapkan. Sebaliknya, ia cemerlang dalam mengatur sumber yang ada secara dinamik. Perbezaan utama daripada bentuk AI yang lebih maju termasuk:

  1. Domain-Specific Autonomy: Sistem Agentic RAG tertumpu pada mencapai matlamat yang ditakrifkan pengguna dalam domain yang dikenali, menggunakan strategi seperti penulisan semula pertanyaan atau pemilihan alat untuk memperbaiki hasil.
  2. Infrastructure-Dependent: Keupayaan sistem bergantung kepada alat dan data yang diintegrasikan oleh pembangun. Ia tidak boleh melampaui sempadan ini tanpa campur tangan manusia.
  3. Respect for Guardrails: Garis panduan etika, peraturan pematuhan, dan polisi perniagaan kekal sangat penting. Kebebasan agen sentiasa dihadkan oleh langkah keselamatan dan mekanisme pengawasan (diharapkan?)

Practical Use Cases and Value

Agentic RAG menonjol dalam senario yang memerlukan pemurnian iteratif dan ketelitian:

  1. Correctness-First Environments: Dalam pemeriksaan pematuhan, analisis peraturan, atau penyelidikan undang-undang, model agentik boleh berulang kali mengesahkan fakta, merujuk pelbagai sumber, dan menulis semula pertanyaan sehingga ia menghasilkan jawapan yang disemak rapi.
  2. Complex Database Interactions: Apabila berurusan dengan data berstruktur di mana pertanyaan sering kali gagal atau perlu disesuaikan, sistem boleh secara autonomi memperhalusi pertanyaannya menggunakan Azure SQL atau Microsoft Fabric OneLake, memastikan pengambilan akhir sejajar dengan niat pengguna.
  3. Extended Workflows: Sesi yang berjalan lebih lama mungkin berkembang apabila maklumat baru muncul. Agentic RAG boleh terus memasukkan data baru, mengubah strategi apabila ia mempelajari lebih banyak tentang ruang masalah.

Governance, Transparency, and Trust

Apabila sistem ini menjadi lebih autonomi dalam penaakulan mereka, tadbir urus dan ketelusan menjadi penting:

Mempunyai alat yang menyediakan rekod tindakan yang jelas adalah penting. Tanpanya, menyahpepijat proses berbilang langkah boleh menjadi sangat sukar. Lihat contoh berikut dari Literal AI (syarikat di belakang Chainlit) untuk satu Agent run:

AgentRunExample

Conclusion

Agentic RAG mewakili evolusi semula jadi dalam cara sistem AI mengendalikan tugas yang kompleks dan intensif data. Dengan mengguna pakai corak interaksi berlingkar, memilih alat secara autonomi, dan memperhalusi pertanyaan sehingga mencapai hasil berkualiti tinggi, sistem ini bergerak melampaui pengikut arahan statik kepada pembuat keputusan yang lebih adaptif dan sedar konteks. Walaupun masih diikat oleh infrastruktur dan garis panduan etika yang ditetapkan manusia, keupayaan agentik ini membolehkan interaksi AI yang lebih kaya, lebih dinamik, dan akhirnya lebih berguna untuk perusahaan dan pengguna akhir.

Got More Questions about Agentic RAG?

Sertai the Microsoft Foundry Discord untuk berjumpa dengan pelajar lain, menghadiri jam pejabat dan dapatkan soalan AI Agents anda dijawab.

Additional Resources

Kertas Akademik

Pelajaran Sebelumnya

Corak Reka Bentuk Penggunaan Alat

Pelajaran Seterusnya

Membina Ejen AI yang Boleh Dipercayai


Penafian: Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator (https://github.com/Azure/co-op-translator). Walaupun kami berusaha sedaya upaya untuk ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi ralat atau ketidakakuratan. Dokumen asal dalam bahasa asalnya hendaklah dianggap sebagai sumber rujukan yang muktamad. Untuk maklumat yang kritikal, disarankan mendapatkan terjemahan profesional oleh penterjemah manusia. Kami tidak bertanggungjawab terhadap sebarang salah faham atau salah tafsiran yang timbul daripada penggunaan terjemahan ini.