
(Klik imej di atas untuk menonton video pelajaran ini)
Agentic RAG
Pelajaran ini memberikan gambaran menyeluruh tentang Agentic Retrieval-Augmented Generation (Agentic RAG), satu paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber luaran. Tidak seperti corak statik “retrieval-then-read”, Agentic RAG melibatkan panggilan berulang kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur. Sistem ini menilai hasil, memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga penyelesaian yang memuaskan dicapai.
Pengenalan
Pelajaran ini akan merangkumi:
- Memahami Agentic RAG: Ketahui tentang paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber data luaran.
- Gaya Iteratif Maker-Checker: Fahami kitaran panggilan berulang kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur, yang direka untuk meningkatkan ketepatan dan menangani pertanyaan yang tidak betul.
- Terokai Aplikasi Praktikal: Kenal pasti senario di mana Agentic RAG cemerlang, seperti persekitaran yang mengutamakan ketepatan, interaksi pangkalan data yang kompleks, dan aliran kerja yang panjang.
Matlamat Pembelajaran
Selepas menyelesaikan pelajaran ini, anda akan tahu cara/memahami:
- Memahami Agentic RAG: Ketahui tentang paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber data luaran.
- Gaya Iteratif Maker-Checker: Fahami konsep kitaran panggilan berulang kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur, yang direka untuk meningkatkan ketepatan dan menangani pertanyaan yang tidak betul.
- Menguasai Proses Pemikiran: Fahami keupayaan sistem untuk menguasai proses pemikirannya, membuat keputusan tentang cara mendekati masalah tanpa bergantung pada laluan yang telah ditentukan.
- Aliran Kerja: Fahami bagaimana model agentic secara bebas memutuskan untuk mendapatkan laporan trend pasaran, mengenal pasti data pesaing, mengaitkan metrik jualan dalaman, mensintesis penemuan, dan menilai strategi.
- Kitaran Iteratif, Integrasi Alat, dan Memori: Ketahui tentang kebergantungan sistem pada corak interaksi berulang, mengekalkan keadaan dan memori merentasi langkah-langkah untuk mengelakkan kitaran berulang dan membuat keputusan yang lebih bijak.
- Menangani Mod Kegagalan dan Pembetulan Diri: Terokai mekanisme pembetulan diri yang kukuh dalam sistem, termasuk iterasi dan pertanyaan semula, menggunakan alat diagnostik, dan bergantung pada pengawasan manusia.
- Batasan Agensi: Fahami batasan Agentic RAG, dengan fokus pada autonomi khusus domain, kebergantungan infrastruktur, dan penghormatan terhadap garis panduan.
- Kes Penggunaan Praktikal dan Nilai: Kenal pasti senario di mana Agentic RAG cemerlang, seperti persekitaran yang mengutamakan ketepatan, interaksi pangkalan data yang kompleks, dan aliran kerja yang panjang.
- Tadbir Urus, Ketelusan, dan Kepercayaan: Ketahui tentang kepentingan tadbir urus dan ketelusan, termasuk pemikiran yang boleh dijelaskan, kawalan bias, dan pengawasan manusia.
Apa itu Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) adalah satu paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber luaran. Tidak seperti corak statik “retrieval-then-read”, Agentic RAG melibatkan panggilan berulang kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur. Sistem ini menilai hasil, memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga penyelesaian yang memuaskan dicapai. Gaya iteratif “maker-checker” ini meningkatkan ketepatan, menangani pertanyaan yang tidak betul, dan memastikan hasil berkualiti tinggi.
Sistem ini secara aktif menguasai proses pemikirannya, menulis semula pertanyaan yang gagal, memilih kaedah pengambilan yang berbeza, dan mengintegrasikan pelbagai alat—seperti carian vektor dalam Azure AI Search, pangkalan data SQL, atau API khusus—sebelum memuktamadkan jawapannya. Kualiti yang membezakan sistem agentic adalah keupayaannya untuk menguasai proses pemikirannya. Pelaksanaan RAG tradisional bergantung pada laluan yang telah ditentukan, tetapi sistem agentic secara autonomi menentukan urutan langkah berdasarkan kualiti maklumat yang ditemui.
Mendefinisikan Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) adalah satu paradigma yang sedang berkembang dalam pembangunan AI di mana LLM bukan sahaja mendapatkan maklumat daripada sumber data luaran tetapi juga merancang langkah seterusnya secara autonomi. Tidak seperti corak statik “retrieval-then-read” atau urutan prompt yang ditulis dengan teliti, Agentic RAG melibatkan kitaran panggilan berulang kepada LLM, diselang-seli dengan panggilan alat atau fungsi dan output berstruktur. Pada setiap langkah, sistem menilai hasil yang diperoleh, memutuskan sama ada untuk memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga mencapai penyelesaian yang memuaskan.
Gaya operasi iteratif “maker-checker” ini direka untuk meningkatkan ketepatan, menangani pertanyaan yang tidak betul kepada pangkalan data berstruktur (contohnya NL2SQL), dan memastikan hasil yang seimbang dan berkualiti tinggi. Daripada bergantung sepenuhnya pada rantai prompt yang direka dengan teliti, sistem ini secara aktif menguasai proses pemikirannya. Ia boleh menulis semula pertanyaan yang gagal, memilih kaedah pengambilan yang berbeza, dan mengintegrasikan pelbagai alat—seperti carian vektor dalam Azure AI Search, pangkalan data SQL, atau API khusus—sebelum memuktamadkan jawapannya. Ini menghapuskan keperluan untuk rangka kerja orkestrasi yang terlalu kompleks. Sebaliknya, kitaran yang agak mudah “panggilan LLM → penggunaan alat → panggilan LLM → …” boleh menghasilkan output yang canggih dan berasas.

Menguasai Proses Pemikiran
Kualiti yang membezakan sistem sebagai “agentic” adalah keupayaannya untuk menguasai proses pemikirannya. Pelaksanaan RAG tradisional sering bergantung pada manusia untuk menentukan laluan bagi model: rantai pemikiran yang menggariskan apa yang perlu diambil dan bila. Tetapi apabila sistem benar-benar agentic, ia secara dalaman memutuskan cara mendekati masalah. Ia bukan sekadar melaksanakan skrip; ia secara autonomi menentukan urutan langkah berdasarkan kualiti maklumat yang ditemui.
Sebagai contoh, jika diminta untuk mencipta strategi pelancaran produk, ia tidak bergantung sepenuhnya pada prompt yang menjelaskan keseluruhan aliran kerja penyelidikan dan pembuatan keputusan. Sebaliknya, model agentic secara bebas memutuskan untuk:
- Mendapatkan laporan trend pasaran semasa menggunakan Bing Web Grounding.
- Mengenal pasti data pesaing yang relevan menggunakan Azure AI Search.
- Mengaitkan metrik jualan dalaman sejarah menggunakan Azure SQL Database.
- Mensintesis penemuan kepada strategi yang kohesif yang diorkestrasi melalui Azure OpenAI Service.
- Menilai strategi untuk jurang atau ketidakkonsistenan, mendorong satu lagi pusingan pengambilan jika perlu.
Semua langkah ini—memperbaiki pertanyaan, memilih sumber, mengulangi sehingga “puas” dengan jawapan—diputuskan oleh model, bukan ditulis terlebih dahulu oleh manusia.
Kitaran Iteratif, Integrasi Alat, dan Memori

Sistem agentic bergantung pada corak interaksi berulang:
- Panggilan Awal: Matlamat pengguna (iaitu prompt pengguna) disampaikan kepada LLM.
- Penggunaan Alat: Jika model mengenal pasti maklumat yang hilang atau arahan yang tidak jelas, ia memilih alat atau kaedah pengambilan—seperti pertanyaan pangkalan data vektor (contohnya carian hibrid Azure AI Search ke atas data peribadi) atau panggilan SQL berstruktur—untuk mendapatkan lebih banyak konteks.
- Penilaian & Penambahbaikan: Selepas menyemak data yang dikembalikan, model memutuskan sama ada maklumat mencukupi. Jika tidak, ia memperbaiki pertanyaan, mencuba alat yang berbeza, atau menyesuaikan pendekatannya.
- Ulang Sehingga Puas: Kitaran ini berterusan sehingga model menentukan bahawa ia mempunyai kejelasan dan bukti yang mencukupi untuk memberikan respons akhir yang beralasan dengan baik.
- Memori & Keadaan: Oleh kerana sistem mengekalkan keadaan dan memori merentasi langkah-langkah, ia boleh mengingati percubaan sebelumnya dan hasilnya, mengelakkan kitaran berulang dan membuat keputusan yang lebih bijak semasa ia meneruskan.
Lama-kelamaan, ini mencipta rasa pemahaman yang berkembang, membolehkan model menavigasi tugas yang kompleks dan berbilang langkah tanpa memerlukan manusia untuk campur tangan atau membentuk semula prompt secara berterusan.
Menangani Mod Kegagalan dan Pembetulan Diri
Autonomi Agentic RAG juga melibatkan mekanisme pembetulan diri yang kukuh. Apabila sistem menghadapi jalan buntu—seperti mendapatkan dokumen yang tidak relevan atau menghadapi pertanyaan yang tidak betul—ia boleh:
- Iterasi dan Pertanyaan Semula: Daripada memberikan respons yang bernilai rendah, model mencuba strategi carian baharu, menulis semula pertanyaan pangkalan data, atau melihat set data alternatif.
- Menggunakan Alat Diagnostik: Sistem mungkin menggunakan fungsi tambahan yang direka untuk membantunya menyahpepijat langkah pemikiran atau mengesahkan ketepatan data yang diperoleh. Alat seperti Azure AI Tracing akan menjadi penting untuk membolehkan pemerhatian dan pemantauan yang kukuh.
- Bergantung pada Pengawasan Manusia: Untuk senario berisiko tinggi atau kegagalan berulang, model mungkin menandakan ketidakpastian dan meminta panduan manusia. Setelah manusia memberikan maklum balas pembetulan, model boleh menggabungkan pelajaran itu untuk masa hadapan.
Pendekatan iteratif dan dinamik ini membolehkan model terus bertambah baik, memastikan ia bukan sekadar sistem satu kali tetapi sistem yang belajar daripada kesilapannya semasa sesi tertentu.

Batasan Agensi
Walaupun autonominya dalam tugas, Agentic RAG bukanlah setara dengan Kecerdasan Umum Buatan. Keupayaan “agentic”nya terhad kepada alat, sumber data, dan dasar yang disediakan oleh pembangun manusia. Ia tidak boleh mencipta alatnya sendiri atau melangkaui batas domain yang telah ditetapkan. Sebaliknya, ia cemerlang dalam mengorkestrasi sumber yang ada secara dinamik.
Perbezaan utama daripada bentuk AI yang lebih maju termasuk:
- Autonomi Khusus Domain: Sistem Agentic RAG memberi tumpuan kepada mencapai matlamat yang ditentukan pengguna dalam domain yang diketahui, menggunakan strategi seperti penulisan semula pertanyaan atau pemilihan alat untuk meningkatkan hasil.
- Bergantung pada Infrastruktur: Keupayaan sistem bergantung pada alat dan data yang diintegrasikan oleh pembangun. Ia tidak boleh melampaui batas ini tanpa campur tangan manusia.
- Penghormatan terhadap Garis Panduan: Garis panduan etika, peraturan pematuhan, dan dasar perniagaan tetap sangat penting. Kebebasan agen sentiasa terhad oleh langkah keselamatan dan mekanisme pengawasan (semoga?).
Kes Penggunaan Praktikal dan Nilai
Agentic RAG cemerlang dalam senario yang memerlukan penambahbaikan berulang dan ketepatan:
- Persekitaran yang Mengutamakan Ketepatan: Dalam pemeriksaan pematuhan, analisis peraturan, atau penyelidikan undang-undang, model agentic boleh berulang kali mengesahkan fakta, merujuk pelbagai sumber, dan menulis semula pertanyaan sehingga ia menghasilkan jawapan yang diperiksa dengan teliti.
- Interaksi Pangkalan Data yang Kompleks: Apabila berurusan dengan data berstruktur di mana pertanyaan sering gagal atau memerlukan penyesuaian, sistem boleh memperbaiki pertanyaannya secara autonomi menggunakan Azure SQL atau Microsoft Fabric OneLake, memastikan pengambilan akhir sejajar dengan niat pengguna.
- Aliran Kerja yang Panjang: Sesi yang lebih lama mungkin berkembang apabila maklumat baharu muncul. Agentic RAG boleh terus menggabungkan data baharu, mengubah strategi apabila ia belajar lebih banyak tentang ruang masalah.
Tadbir Urus, Ketelusan, dan Kepercayaan
Apabila sistem ini menjadi lebih autonomi dalam pemikirannya, tadbir urus dan ketelusan adalah penting:
- Pemikiran yang Boleh Dijelaskan: Model boleh memberikan jejak audit pertanyaan yang dibuat, sumber yang dirujuk, dan langkah pemikiran yang diambil untuk mencapai kesimpulannya. Alat seperti Azure AI Content Safety dan Azure AI Tracing / GenAIOps boleh membantu mengekalkan ketelusan dan mengurangkan risiko.
- Kawalan Bias dan Pengambilan Seimbang: Pembangun boleh menyesuaikan strategi pengambilan untuk memastikan sumber data yang seimbang dan representatif dipertimbangkan, dan kerap mengaudit output untuk mengesan bias atau corak yang berat sebelah menggunakan model khusus untuk organisasi sains data lanjutan menggunakan Azure Machine Learning.
- Pengawasan Manusia dan Pematuhan: Untuk tugas sensitif, semakan manusia tetap penting. Agentic RAG tidak menggantikan pertimbangan manusia dalam keputusan berisiko tinggi—ia menambahnya dengan memberikan pilihan yang diperiksa dengan lebih teliti.
Mempunyai alat yang menyediakan rekod tindakan yang jelas adalah penting. Tanpa alat ini, menyahpepijat proses berbilang langkah boleh menjadi sangat sukar. Lihat contoh berikut daripada Literal AI (syarikat di belakang Chainlit) untuk Agent run:


Kesimpulan
Agentic RAG mewakili evolusi semula jadi dalam cara sistem AI menangani tugas yang kompleks dan intensif data. Dengan mengamalkan corak interaksi berulang, memilih alat secara autonomi, dan memperbaiki pertanyaan sehingga mencapai hasil berkualiti tinggi, sistem ini bergerak melangkaui pematuhan prompt statik kepada pembuat keputusan yang lebih adaptif dan sedar konteks. Walaupun masih terhad oleh infrastruktur yang ditentukan manusia dan garis panduan etika, keupayaan agentic ini membolehkan interaksi AI yang lebih kaya, lebih dinamik, dan akhirnya lebih berguna untuk kedua-dua perusahaan dan pengguna akhir.
Ada Lagi Soalan tentang Agentic RAG?
Sertai Azure AI Foundry Discord untuk bertemu dengan pelajar lain, menghadiri waktu pejabat, dan mendapatkan jawapan kepada soalan AI Agents anda.
Sumber Tambahan
-
Implementasi Retrieval Augmented Generation (RAG) dengan Azure OpenAI Service: Pelajari cara menggunakan data anda sendiri dengan Azure OpenAI Service. Modul Microsoft Learn ini menyediakan panduan lengkap tentang cara melaksanakan RAG
Kertas Akademik
Pelajaran Sebelumnya
Corak Reka Bentuk Penggunaan Alat
Pelajaran Seterusnya
Membina Ejen AI yang Boleh Dipercayai
Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat yang kritikal, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.