ai-agents-for-beginners

Agentic RAG

(Klik gambar di atas untuk menonton video pelajaran ini)

Agentic RAG

Pelajaran ini memberikan gambaran menyeluruh tentang Agentic Retrieval-Augmented Generation (Agentic RAG), sebuah paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber eksternal. Berbeda dengan pola retrieval-then-read yang statis, Agentic RAG melibatkan panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Sistem mengevaluasi hasil, menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga solusi yang memuaskan tercapai.

Pendahuluan

Pelajaran ini akan mencakup:

Tujuan Pembelajaran

Setelah menyelesaikan pelajaran ini, Anda akan mengetahui cara/memahami:

Apa itu Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) adalah paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) secara mandiri merencanakan langkah berikutnya sambil mengambil informasi dari sumber eksternal. Berbeda dengan pola retrieval-then-read yang statis, Agentic RAG melibatkan panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Sistem mengevaluasi hasil, menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga solusi yang memuaskan tercapai. Gaya iteratif “maker-checker” ini meningkatkan ketepatan, menangani kueri yang salah, dan memastikan hasil berkualitas tinggi.

Sistem secara aktif menguasai proses penalarannya, menulis ulang kueri yang gagal, memilih metode pengambilan yang berbeda, dan mengintegrasikan beberapa alat—seperti pencarian vektor di Azure AI Search, database SQL, atau API khusus—sebelum menyelesaikan jawabannya. Kualitas pembeda dari sistem agentic adalah kemampuannya untuk menguasai proses penalarannya. Implementasi RAG tradisional bergantung pada jalur yang telah ditentukan sebelumnya, tetapi sistem agentic secara mandiri menentukan urutan langkah berdasarkan kualitas informasi yang ditemukan.

Mendefinisikan Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) adalah paradigma yang sedang berkembang dalam pengembangan AI di mana LLM tidak hanya mengambil informasi dari sumber data eksternal tetapi juga secara mandiri merencanakan langkah berikutnya. Berbeda dengan pola retrieval-then-read yang statis atau urutan prompt yang dirancang dengan hati-hati, Agentic RAG melibatkan loop panggilan berulang ke LLM, diselingi dengan panggilan alat atau fungsi dan output terstruktur. Pada setiap langkah, sistem mengevaluasi hasil yang diperoleh, memutuskan apakah perlu menyempurnakan kueri, memanggil alat tambahan jika diperlukan, dan melanjutkan siklus ini hingga mencapai solusi yang memuaskan.

Gaya operasi iteratif “maker-checker” ini dirancang untuk meningkatkan ketepatan, menangani kueri yang salah ke database terstruktur (misalnya NL2SQL), dan memastikan hasil yang seimbang dan berkualitas tinggi. Alih-alih hanya bergantung pada rantai prompt yang dirancang dengan hati-hati, sistem secara aktif menguasai proses penalarannya. Sistem dapat menulis ulang kueri yang gagal, memilih metode pengambilan yang berbeda, dan mengintegrasikan beberapa alat—seperti pencarian vektor di Azure AI Search, database SQL, atau API khusus—sebelum menyelesaikan jawabannya. Hal ini menghilangkan kebutuhan akan kerangka orkestrasi yang terlalu kompleks. Sebaliknya, loop sederhana “panggilan LLM → penggunaan alat → panggilan LLM → …” dapat menghasilkan output yang canggih dan terstruktur dengan baik.

Agentic RAG Core Loop

Menguasai Proses Penalaran

Kualitas pembeda yang membuat sistem menjadi “agentic” adalah kemampuannya untuk menguasai proses penalarannya. Implementasi RAG tradisional sering kali bergantung pada manusia untuk mendefinisikan jalur bagi model: sebuah chain-of-thought yang menguraikan apa yang harus diambil dan kapan. Namun, ketika sistem benar-benar agentic, ia secara internal memutuskan bagaimana mendekati masalah. Sistem ini tidak hanya menjalankan skrip; ia secara mandiri menentukan urutan langkah berdasarkan kualitas informasi yang ditemukan. Sebagai contoh, jika diminta untuk membuat strategi peluncuran produk, sistem tidak hanya bergantung pada prompt yang merinci seluruh alur kerja penelitian dan pengambilan keputusan. Sebaliknya, model agentic secara mandiri memutuskan untuk:

  1. Mengambil laporan tren pasar terkini menggunakan Bing Web Grounding.
  2. Mengidentifikasi data pesaing yang relevan menggunakan Azure AI Search.
  3. Menghubungkan metrik penjualan internal historis menggunakan Azure SQL Database.
  4. Mensintesis temuan menjadi strategi yang kohesif yang diorkestrasi melalui Azure OpenAI Service.
  5. Mengevaluasi strategi untuk menemukan celah atau ketidakkonsistenan, dan memulai putaran pengambilan data lainnya jika diperlukan. Semua langkah ini—menyempurnakan kueri, memilih sumber, mengulangi hingga “puas” dengan jawabannya—diputuskan oleh model, bukan diskripkan sebelumnya oleh manusia.

Loop Iteratif, Integrasi Alat, dan Memori

Tool Integration Architecture

Sistem agentic bergantung pada pola interaksi berulang:

Seiring waktu, ini menciptakan rasa pemahaman yang berkembang, memungkinkan model untuk menavigasi tugas yang kompleks dan multi-langkah tanpa memerlukan intervensi manusia secara terus-menerus atau pengubahan prompt.

Menangani Mode Kegagalan dan Koreksi Diri

Otonomi Agentic RAG juga melibatkan mekanisme koreksi diri yang kuat. Ketika sistem menemui jalan buntu—seperti mengambil dokumen yang tidak relevan atau menghadapi kueri yang salah—sistem dapat:

Pendekatan iteratif dan dinamis ini memungkinkan model untuk terus meningkatkan diri, memastikan bahwa ia bukan hanya sistem satu kali tetapi sistem yang belajar dari kesalahannya selama sesi tertentu.

Self Correction Mechanism

Batasan Agensi

Meskipun memiliki otonomi dalam tugas tertentu, Agentic RAG tidak setara dengan Artificial General Intelligence. Kemampuan “agentic”-nya terbatas pada alat, sumber data, dan kebijakan yang disediakan oleh pengembang manusia. Sistem ini tidak dapat menciptakan alatnya sendiri atau melampaui batas domain yang telah ditetapkan. Sebaliknya, sistem ini unggul dalam mengorkestrasi sumber daya yang ada secara dinamis. Perbedaan utama dari bentuk AI yang lebih maju meliputi:

  1. Otonomi Spesifik Domain: Sistem Agentic RAG berfokus pada pencapaian tujuan yang ditentukan pengguna dalam domain yang diketahui, menggunakan strategi seperti penulisan ulang kueri atau pemilihan alat untuk meningkatkan hasil.
  2. Ketergantungan Infrastruktur: Kemampuan sistem bergantung pada alat dan data yang diintegrasikan oleh pengembang. Sistem ini tidak dapat melampaui batasan ini tanpa intervensi manusia.
  3. Penghormatan terhadap Batasan: Pedoman etika, aturan kepatuhan, dan kebijakan bisnis tetap sangat penting. Kebebasan agen selalu dibatasi oleh langkah-langkah keamanan dan mekanisme pengawasan (semoga?).

Kasus Penggunaan Praktis dan Nilai

Agentic RAG unggul dalam skenario yang membutuhkan penyempurnaan iteratif dan presisi:

  1. Lingkungan yang Mengutamakan Ketepatan: Dalam pemeriksaan kepatuhan, analisis regulasi, atau penelitian hukum, model agentic dapat memverifikasi fakta secara berulang, berkonsultasi dengan beberapa sumber, dan menulis ulang kueri hingga menghasilkan jawaban yang benar-benar terverifikasi.
  2. Interaksi Database yang Kompleks: Saat berurusan dengan data terstruktur di mana kueri sering kali gagal atau perlu disesuaikan, sistem dapat secara mandiri menyempurnakan kuerinya menggunakan Azure SQL atau Microsoft Fabric OneLake, memastikan pengambilan akhir sesuai dengan maksud pengguna.
  3. Alur Kerja yang Diperpanjang: Sesi yang berlangsung lebih lama mungkin berkembang seiring munculnya informasi baru. Agentic RAG dapat terus menggabungkan data baru, mengubah strategi saat mempelajari lebih lanjut tentang ruang masalah.

Tata Kelola, Transparansi, dan Kepercayaan

Seiring sistem ini menjadi lebih otonom dalam penalarannya, tata kelola dan transparansi menjadi sangat penting:

Memiliki alat yang menyediakan catatan tindakan yang jelas sangat penting. Tanpa itu, debugging proses multi-langkah bisa sangat sulit. Lihat contoh berikut dari Literal AI (perusahaan di balik Chainlit) untuk Agent run:

AgentRunExample

AgentRunExample2

Kesimpulan

Agentic RAG mewakili evolusi alami dalam cara sistem AI menangani tugas yang kompleks dan intensif data. Dengan mengadopsi pola interaksi berulang, secara mandiri memilih alat, dan menyempurnakan kueri hingga mencapai hasil berkualitas tinggi, sistem ini bergerak melampaui pengikut prompt statis menjadi pengambil keputusan yang lebih adaptif dan sadar konteks. Meskipun masih dibatasi oleh infrastruktur yang ditentukan manusia dan pedoman etika, kemampuan agentic ini memungkinkan interaksi AI yang lebih kaya, lebih dinamis, dan pada akhirnya lebih berguna bagi perusahaan dan pengguna akhir.

Punya Pertanyaan Lebih Lanjut tentang Agentic RAG?

Bergabunglah dengan Azure AI Foundry Discord untuk bertemu dengan pelajar lainnya, menghadiri jam kantor, dan mendapatkan jawaban atas pertanyaan Anda tentang AI Agents.

Sumber Daya Tambahan

- Implementasi Retrieval Augmented Generation (RAG) dengan Azure OpenAI Service: Pelajari cara menggunakan data Anda sendiri dengan Azure OpenAI Service. Modul Microsoft Learn ini menyediakan panduan lengkap tentang cara mengimplementasikan RAG

Makalah Akademik

Pelajaran Sebelumnya

Polanya Desain Penggunaan Alat

Pelajaran Selanjutnya

Membangun Agen AI yang Dapat Dipercaya


Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan penerjemahan AI Co-op Translator. Meskipun kami berupaya untuk memberikan hasil yang akurat, harap diketahui bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang otoritatif. Untuk informasi yang bersifat kritis, disarankan menggunakan jasa penerjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.