
(Klik gambar di atas untuk menonton video pelajaran ini)
Agentic RAG
Pelajaran ini memberikan gambaran menyeluruh tentang Agentic Retrieval-Augmented Generation (Agentic RAG), sebuah paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber eksternal. Berbeda dengan pola retrieval-then-read yang statis, Agentic RAG melibatkan panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Sistem mengevaluasi hasil, menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga solusi yang memuaskan tercapai.
Pendahuluan
Pelajaran ini akan mencakup:
- Memahami Agentic RAG: Pelajari tentang paradigma yang sedang berkembang dalam AI di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber data eksternal.
- Memahami Gaya Iteratif Maker-Checker: Pahami loop panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur, yang dirancang untuk meningkatkan ketepatan dan menangani kueri yang salah.
- Mengeksplorasi Aplikasi Praktis: Identifikasi skenario di mana Agentic RAG unggul, seperti lingkungan yang mengutamakan ketepatan, interaksi database yang kompleks, dan alur kerja yang diperpanjang.
Tujuan Pembelajaran
Setelah menyelesaikan pelajaran ini, Anda akan mengetahui cara/memahami:
- Memahami Agentic RAG: Pelajari tentang paradigma yang sedang berkembang dalam AI di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber data eksternal.
- Gaya Iteratif Maker-Checker: Pahami konsep loop panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur, yang dirancang untuk meningkatkan ketepatan dan menangani kueri yang salah.
- Menguasai Proses Penalaran: Pahami kemampuan sistem untuk menguasai proses penalarannya, membuat keputusan tentang cara mendekati masalah tanpa bergantung pada jalur yang telah ditentukan sebelumnya.
- Alur Kerja: Pahami bagaimana model agentic secara mandiri memutuskan untuk mengambil laporan tren pasar, mengidentifikasi data pesaing, menghubungkan metrik penjualan internal, mensintesis temuan, dan mengevaluasi strategi.
- Loop Iteratif, Integrasi Alat, dan Memori: Pelajari tentang ketergantungan sistem pada pola interaksi berulang, mempertahankan status dan memori di setiap langkah untuk menghindari loop yang berulang dan membuat keputusan yang terinformasi.
- Menangani Mode Kegagalan dan Koreksi Diri: Eksplorasi mekanisme koreksi diri yang kuat dari sistem, termasuk iterasi dan re-kueri, menggunakan alat diagnostik, dan bergantung pada pengawasan manusia.
- Batasan Agensi: Pahami keterbatasan Agentic RAG, dengan fokus pada otonomi spesifik domain, ketergantungan infrastruktur, dan penghormatan terhadap batasan.
- Kasus Penggunaan Praktis dan Nilai: Identifikasi skenario di mana Agentic RAG unggul, seperti lingkungan yang mengutamakan ketepatan, interaksi database yang kompleks, dan alur kerja yang diperpanjang.
- Tata Kelola, Transparansi, dan Kepercayaan: Pelajari tentang pentingnya tata kelola dan transparansi, termasuk penalaran yang dapat dijelaskan, kontrol bias, dan pengawasan manusia.
Apa itu Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) adalah paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber eksternal. Berbeda dengan pola retrieval-then-read yang statis, Agentic RAG melibatkan panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Sistem mengevaluasi hasil, menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga solusi yang memuaskan tercapai. Gaya iteratif “maker-checker” ini meningkatkan ketepatan, menangani kueri yang salah, dan memastikan hasil berkualitas tinggi.
Sistem secara aktif menguasai proses penalarannya, menulis ulang kueri yang gagal, memilih metode pengambilan yang berbeda, dan mengintegrasikan beberapa alat—seperti pencarian vektor di Azure AI Search, database SQL, atau API khusus—sebelum menyelesaikan jawabannya. Kualitas pembeda dari sistem agentic adalah kemampuannya untuk menguasai proses penalarannya. Implementasi RAG tradisional bergantung pada jalur yang telah ditentukan sebelumnya, tetapi sistem agentic secara mandiri menentukan urutan langkah berdasarkan kualitas informasi yang ditemukan.
Mendefinisikan Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) adalah paradigma yang sedang berkembang dalam pengembangan AI di mana LLM tidak hanya mengambil informasi dari sumber data eksternal tetapi juga secara mandiri merencanakan langkah berikutnya. Berbeda dengan pola retrieval-then-read yang statis atau urutan prompt yang dirancang dengan hati-hati, Agentic RAG melibatkan loop panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Pada setiap langkah, sistem mengevaluasi hasil yang diperoleh, memutuskan apakah perlu menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga mencapai solusi yang memuaskan.
Gaya operasi iteratif “maker-checker” ini dirancang untuk meningkatkan ketepatan, menangani kueri yang salah ke database terstruktur (misalnya NL2SQL), dan memastikan hasil yang seimbang dan berkualitas tinggi. Alih-alih hanya bergantung pada rantai prompt yang dirancang dengan hati-hati, sistem secara aktif menguasai proses penalarannya. Sistem dapat menulis ulang kueri yang gagal, memilih metode pengambilan yang berbeda, dan mengintegrasikan beberapa alat—seperti pencarian vektor di Azure AI Search, database SQL, atau API khusus—sebelum menyelesaikan jawabannya. Hal ini menghilangkan kebutuhan akan kerangka orkestrasi yang terlalu kompleks. Sebaliknya, loop sederhana “panggilan LLM → penggunaan alat → panggilan LLM → …” dapat menghasilkan output yang canggih dan terstruktur dengan baik.

Menguasai Proses Penalaran
Kualitas pembeda yang membuat sistem menjadi “agentic” adalah kemampuannya untuk menguasai proses penalarannya. Implementasi RAG tradisional sering kali bergantung pada manusia untuk mendefinisikan jalur bagi model: sebuah chain-of-thought yang menguraikan apa yang harus diambil dan kapan.
Namun, ketika sistem benar-benar agentic, ia secara internal memutuskan bagaimana mendekati masalah. Sistem ini tidak hanya menjalankan skrip; ia secara mandiri menentukan urutan langkah berdasarkan kualitas informasi yang ditemukan.
Sebagai contoh, jika diminta untuk membuat strategi peluncuran produk, sistem tidak hanya bergantung pada prompt yang merinci seluruh alur kerja penelitian dan pengambilan keputusan. Sebaliknya, model agentic secara mandiri memutuskan untuk:
- Mengambil laporan tren pasar terkini menggunakan Bing Web Grounding.
- Mengidentifikasi data pesaing yang relevan menggunakan Azure AI Search.
- Menghubungkan metrik penjualan internal historis menggunakan Azure SQL Database.
- Mensintesis temuan menjadi strategi yang kohesif yang diorkestrasi melalui Azure OpenAI Service.
- Mengevaluasi strategi untuk menemukan celah atau ketidakkonsistenan, dan memulai putaran pengambilan data lainnya jika diperlukan.
Semua langkah ini—menyempurnakan kueri, memilih sumber, mengulangi hingga “puas” dengan jawabannya—diputuskan oleh model, bukan diskripkan sebelumnya oleh manusia.
Loop Iteratif, Integrasi Alat, dan Memori

Sistem agentic bergantung pada pola interaksi berulang:
- Panggilan Awal: Tujuan pengguna (alias prompt pengguna) disampaikan kepada LLM.
- Pemanggilan Alat: Jika model mengidentifikasi informasi yang hilang atau instruksi yang ambigu, ia memilih alat atau metode pengambilan—seperti kueri database vektor (misalnya Azure AI Search Hybrid search atas data pribadi) atau panggilan SQL terstruktur—untuk mengumpulkan lebih banyak konteks.
- Penilaian & Penyempurnaan: Setelah meninjau data yang dikembalikan, model memutuskan apakah informasi tersebut sudah cukup. Jika tidak, ia menyempurnakan kueri, mencoba alat yang berbeda, atau menyesuaikan pendekatannya.
- Ulangi Hingga Puas: Siklus ini berlanjut hingga model menentukan bahwa ia memiliki kejelasan dan bukti yang cukup untuk memberikan respons akhir yang terstruktur dengan baik.
- Memori & Status: Karena sistem mempertahankan status dan memori di setiap langkah, ia dapat mengingat upaya sebelumnya dan hasilnya, menghindari loop yang berulang dan membuat keputusan yang lebih terinformasi saat melanjutkan.
Seiring waktu, ini menciptakan rasa pemahaman yang berkembang, memungkinkan model untuk menavigasi tugas yang kompleks dan multi-langkah tanpa memerlukan intervensi manusia secara terus-menerus atau pengubahan prompt.
Menangani Mode Kegagalan dan Koreksi Diri
Otonomi Agentic RAG juga melibatkan mekanisme koreksi diri yang kuat. Ketika sistem menemui jalan buntu—seperti mengambil dokumen yang tidak relevan atau menghadapi kueri yang salah—sistem dapat:
- Iterasi dan Re-Kueri: Alih-alih memberikan respons yang bernilai rendah, model mencoba strategi pencarian baru, menulis ulang kueri database, atau melihat kumpulan data alternatif.
- Menggunakan Alat Diagnostik: Sistem dapat memanggil fungsi tambahan yang dirancang untuk membantunya memeriksa langkah-langkah penalarannya atau mengonfirmasi ketepatan data yang diambil. Alat seperti Azure AI Tracing akan penting untuk memungkinkan observabilitas dan pemantauan yang kuat.
- Bergantung pada Pengawasan Manusia: Untuk skenario yang berisiko tinggi atau sering gagal, model mungkin menandai ketidakpastian dan meminta panduan manusia. Setelah manusia memberikan umpan balik korektif, model dapat menggabungkan pelajaran tersebut ke depannya.
Pendekatan iteratif dan dinamis ini memungkinkan model untuk terus meningkatkan diri, memastikan bahwa ia bukan hanya sistem satu kali tetapi sistem yang belajar dari kesalahannya selama sesi tertentu.

Batasan Agensi
Meskipun memiliki otonomi dalam tugas tertentu, Agentic RAG tidak setara dengan Artificial General Intelligence. Kemampuan “agentic”-nya terbatas pada alat, sumber data, dan kebijakan yang disediakan oleh pengembang manusia. Sistem ini tidak dapat menciptakan alatnya sendiri atau melampaui batas domain yang telah ditetapkan. Sebaliknya, sistem ini unggul dalam mengorkestrasi sumber daya yang ada secara dinamis.
Perbedaan utama dari bentuk AI yang lebih maju meliputi:
- Otonomi Spesifik Domain: Sistem Agentic RAG berfokus pada pencapaian tujuan yang ditentukan pengguna dalam domain yang diketahui, menggunakan strategi seperti penulisan ulang kueri atau pemilihan alat untuk meningkatkan hasil.
- Ketergantungan Infrastruktur: Kemampuan sistem bergantung pada alat dan data yang diintegrasikan oleh pengembang. Sistem ini tidak dapat melampaui batasan ini tanpa intervensi manusia.
- Penghormatan terhadap Batasan: Pedoman etika, aturan kepatuhan, dan kebijakan bisnis tetap sangat penting. Kebebasan agen selalu dibatasi oleh langkah-langkah keamanan dan mekanisme pengawasan (semoga?).
Kasus Penggunaan Praktis dan Nilai
Agentic RAG unggul dalam skenario yang membutuhkan penyempurnaan iteratif dan presisi:
- Lingkungan yang Mengutamakan Ketepatan: Dalam pemeriksaan kepatuhan, analisis regulasi, atau penelitian hukum, model agentic dapat memverifikasi fakta secara berulang, berkonsultasi dengan beberapa sumber, dan menulis ulang kueri hingga menghasilkan jawaban yang benar-benar terverifikasi.
- Interaksi Database yang Kompleks: Saat berurusan dengan data terstruktur di mana kueri sering kali gagal atau perlu disesuaikan, sistem dapat secara mandiri menyempurnakan kuerinya menggunakan Azure SQL atau Microsoft Fabric OneLake, memastikan pengambilan akhir sesuai dengan maksud pengguna.
- Alur Kerja yang Diperpanjang: Sesi yang berlangsung lebih lama mungkin berkembang seiring munculnya informasi baru. Agentic RAG dapat terus menggabungkan data baru, mengubah strategi saat mempelajari lebih lanjut tentang ruang masalah.
Tata Kelola, Transparansi, dan Kepercayaan
Seiring sistem ini menjadi lebih otonom dalam penalarannya, tata kelola dan transparansi menjadi sangat penting:
- Penalaran yang Dapat Dijelaskan: Model dapat memberikan jejak audit dari kueri yang dibuat, sumber yang dikonsultasikan, dan langkah-langkah penalaran yang diambil untuk mencapai kesimpulannya. Alat seperti Azure AI Content Safety dan Azure AI Tracing / GenAIOps dapat membantu menjaga transparansi dan mengurangi risiko.
- Kontrol Bias dan Pengambilan yang Seimbang: Pengembang dapat menyetel strategi pengambilan untuk memastikan sumber data yang seimbang dan representatif dipertimbangkan, serta secara teratur mengaudit output untuk mendeteksi bias atau pola yang menyimpang menggunakan model khusus untuk organisasi data science tingkat lanjut menggunakan Azure Machine Learning.
- Pengawasan Manusia dan Kepatuhan: Untuk tugas yang sensitif, tinjauan manusia tetap penting. Agentic RAG tidak menggantikan penilaian manusia dalam keputusan yang berisiko tinggi—sistem ini melengkapinya dengan memberikan opsi yang lebih terverifikasi secara menyeluruh.
Memiliki alat yang menyediakan catatan tindakan yang jelas sangat penting. Tanpa itu, debugging proses multi-langkah bisa sangat sulit. Lihat contoh berikut dari Literal AI (perusahaan di balik Chainlit) untuk Agent run:


Kesimpulan
Agentic RAG mewakili evolusi alami dalam cara sistem AI menangani tugas yang kompleks dan intensif data. Dengan mengadopsi pola interaksi berulang, secara mandiri memilih alat, dan menyempurnakan kueri hingga mencapai hasil berkualitas tinggi, sistem ini bergerak melampaui pengikut prompt statis menjadi pengambil keputusan yang lebih adaptif dan sadar konteks. Meskipun masih dibatasi oleh infrastruktur yang ditentukan manusia dan pedoman etika, kemampuan agentic ini memungkinkan interaksi AI yang lebih kaya, lebih dinamis, dan pada akhirnya lebih berguna bagi perusahaan dan pengguna akhir.
Punya Pertanyaan Lebih Lanjut tentang Agentic RAG?
Bergabunglah dengan Azure AI Foundry Discord untuk bertemu dengan pelajar lainnya, menghadiri jam kantor, dan mendapatkan jawaban atas pertanyaan Anda tentang AI Agents.
Sumber Daya Tambahan
-
Implementasi Retrieval Augmented Generation (RAG) dengan Azure OpenAI Service: Pelajari cara menggunakan data Anda sendiri dengan Azure OpenAI Service. Modul Microsoft Learn ini menyediakan panduan lengkap tentang cara mengimplementasikan RAG
Makalah Akademik
Pelajaran Sebelumnya
Polanya Desain Penggunaan Alat
Pelajaran Selanjutnya
Membangun Agen AI yang Dapat Dipercaya
Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI Co-op Translator. Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diketahui bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.