ai-agents-for-beginners

Agentic RAG

(Klik pada imej di atas untuk menonton video pelajaran ini)

Agentic RAG

Pelajaran ini memberikan gambaran menyeluruh tentang Agentic Retrieval-Augmented Generation (Agentic RAG), satu paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber luaran. Tidak seperti corak statik “retrieval-then-read”, Agentic RAG melibatkan panggilan berulang kepada LLM, diselang-selikan dengan panggilan alat atau fungsi serta output yang berstruktur. Sistem ini menilai hasil, memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga penyelesaian yang memuaskan dicapai.

Pengenalan

Pelajaran ini akan merangkumi:

Matlamat Pembelajaran

Selepas menyelesaikan pelajaran ini, anda akan tahu bagaimana untuk/memahami:

Apa itu Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) adalah satu paradigma AI yang sedang berkembang di mana model bahasa besar (LLM) merancang langkah seterusnya secara autonomi sambil mendapatkan maklumat daripada sumber luaran. Tidak seperti corak statik “retrieval-then-read”, Agentic RAG melibatkan panggilan berulang kepada LLM, diselang-selikan dengan panggilan alat atau fungsi serta output yang berstruktur. Sistem ini menilai hasil, memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga penyelesaian yang memuaskan dicapai. Gaya iteratif “maker-checker” ini meningkatkan ketepatan, menangani pertanyaan yang tidak sempurna, dan memastikan hasil yang berkualiti tinggi.

Sistem ini secara aktif menguasai proses pemikirannya, menulis semula pertanyaan yang gagal, memilih kaedah pengambilan yang berbeza, dan mengintegrasikan pelbagai alat—seperti carian vektor dalam Azure AI Search, pangkalan data SQL, atau API khusus—sebelum menyelesaikan jawapannya. Kualiti yang membezakan sistem agentic adalah keupayaannya untuk menguasai proses pemikirannya. Pelaksanaan RAG tradisional bergantung pada laluan yang telah ditentukan, tetapi sistem agentic secara autonomi menentukan urutan langkah berdasarkan kualiti maklumat yang ditemui.

Mendefinisikan Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) adalah satu paradigma yang sedang berkembang dalam pembangunan AI di mana LLM bukan sahaja mendapatkan maklumat daripada sumber data luaran tetapi juga merancang langkah seterusnya secara autonomi. Tidak seperti corak statik “retrieval-then-read” atau urutan prompt yang ditulis dengan teliti, Agentic RAG melibatkan kitaran panggilan berulang kepada LLM, diselang-selikan dengan panggilan alat atau fungsi serta output yang berstruktur. Pada setiap langkah, sistem menilai hasil yang diperoleh, memutuskan sama ada untuk memperbaiki pertanyaan, menggunakan alat tambahan jika diperlukan, dan meneruskan kitaran ini sehingga mencapai penyelesaian yang memuaskan.

Gaya operasi iteratif “maker-checker” ini direka untuk meningkatkan ketepatan, menangani pertanyaan yang tidak sempurna kepada pangkalan data berstruktur (contohnya NL2SQL), dan memastikan hasil yang seimbang dan berkualiti tinggi. Daripada bergantung semata-mata pada rantai prompt yang direka dengan teliti, sistem ini secara aktif menguasai proses pemikirannya. Ia boleh menulis semula pertanyaan yang gagal, memilih kaedah pengambilan yang berbeza, dan mengintegrasikan pelbagai alat—seperti carian vektor dalam Azure AI Search, pangkalan data SQL, atau API khusus—sebelum menyelesaikan jawapannya. Ini menghapuskan keperluan untuk rangka kerja orkestrasi yang terlalu kompleks. Sebaliknya, kitaran yang agak mudah “panggilan LLM → penggunaan alat → panggilan LLM → …” boleh menghasilkan output yang canggih dan berasas.

Agentic RAG Core Loop

Menguasai Proses Pemikiran

Kualiti yang membezakan sistem “agentic” adalah keupayaannya untuk menguasai proses pemikirannya. Pelaksanaan RAG tradisional sering bergantung pada manusia untuk menentukan laluan bagi model: rantai pemikiran yang menggariskan apa yang perlu diambil dan bila. Tetapi apabila sistem benar-benar agentic, ia secara dalaman memutuskan cara mendekati masalah. Ia bukan sekadar melaksanakan skrip; ia secara autonomi menentukan urutan langkah berdasarkan kualiti maklumat yang ditemui. Sebagai contoh, jika diminta untuk mencipta strategi pelancaran produk, ia tidak bergantung semata-mata pada prompt yang menjelaskan keseluruhan aliran kerja penyelidikan dan pengambilan keputusan. Sebaliknya, model agentic secara bebas memutuskan untuk:

  1. Mendapatkan laporan trend pasaran semasa menggunakan Bing Web Grounding.
  2. Mengenal pasti data pesaing yang relevan menggunakan Azure AI Search.
  3. Menghubungkan metrik jualan dalaman sejarah menggunakan Azure SQL Database.
  4. Mensintesis penemuan kepada strategi yang kohesif yang diorkestrasi melalui Azure OpenAI Service.
  5. Menilai strategi untuk jurang atau ketidakkonsistenan, mendorong satu lagi pusingan pengambilan jika perlu. Semua langkah ini—memperbaiki pertanyaan, memilih sumber, mengulangi sehingga “puas” dengan jawapan—diputuskan oleh model, bukan ditulis terlebih dahulu oleh manusia.

Kitaran Iteratif, Integrasi Alat, dan Memori

Tool Integration Architecture

Sistem agentic bergantung pada corak interaksi berulang:

Dari masa ke masa, ini mencipta rasa pemahaman yang berkembang, membolehkan model menavigasi tugas yang kompleks dan berbilang langkah tanpa memerlukan manusia untuk campur tangan atau membentuk semula prompt secara berterusan.

Menangani Mod Kegagalan dan Pembetulan Diri

Autonomi Agentic RAG juga melibatkan mekanisme pembetulan diri yang kukuh. Apabila sistem menghadapi jalan buntu—seperti mendapatkan dokumen yang tidak relevan atau menghadapi pertanyaan yang tidak sempurna—ia boleh:

Pendekatan iteratif dan dinamik ini membolehkan model untuk terus memperbaiki, memastikan bahawa ia bukan sekadar sistem satu kali tetapi satu yang belajar daripada kesilapan semasa sesi tertentu.

Self Correction Mechanism

Batasan Agensi

Walaupun autonominya dalam tugas, Agentic RAG tidak sama dengan Kecerdasan Umum Buatan. Keupayaan “agentic”nya terhad kepada alat, sumber data, dan polisi yang disediakan oleh pembangun manusia. Ia tidak boleh mencipta alatnya sendiri atau melangkaui batas domain yang telah ditetapkan. Sebaliknya, ia cemerlang dalam mengorkestrasi sumber yang ada secara dinamik. Perbezaan utama daripada bentuk AI yang lebih maju termasuk:

  1. Autonomi Khusus Domain: Sistem Agentic RAG memberi tumpuan kepada mencapai matlamat yang ditentukan pengguna dalam domain yang diketahui, menggunakan strategi seperti penulisan semula pertanyaan atau pemilihan alat untuk meningkatkan hasil.
  2. Bergantung pada Infrastruktur: Keupayaan sistem bergantung pada alat dan data yang diintegrasikan oleh pembangun. Ia tidak boleh melampaui batas ini tanpa campur tangan manusia.
  3. Penghormatan terhadap Kawalan Keselamatan: Garis panduan etika, peraturan pematuhan, dan polisi perniagaan tetap sangat penting. Kebebasan agen sentiasa terhad oleh langkah keselamatan dan mekanisme pengawasan (semoga?).

Kes Penggunaan Praktikal dan Nilai

Agentic RAG cemerlang dalam senario yang memerlukan penambahbaikan berulang dan ketepatan:

  1. Persekitaran yang Mengutamakan Ketepatan: Dalam pemeriksaan pematuhan, analisis peraturan, atau penyelidikan undang-undang, model agentic boleh berulang kali mengesahkan fakta, merujuk kepada pelbagai sumber, dan menulis semula pertanyaan sehingga menghasilkan jawapan yang disemak dengan teliti.
  2. Interaksi Pangkalan Data yang Kompleks: Apabila berurusan dengan data berstruktur di mana pertanyaan sering gagal atau memerlukan penyesuaian, sistem boleh memperbaiki pertanyaannya secara autonomi menggunakan Azure SQL atau Microsoft Fabric OneLake, memastikan pengambilan akhir selaras dengan niat pengguna.
  3. Aliran Kerja yang Panjang: Sesi yang lebih panjang mungkin berkembang apabila maklumat baru muncul. Agentic RAG boleh terus menggabungkan data baru, mengubah strategi apabila ia belajar lebih banyak tentang ruang masalah.

Tadbir Urus, Ketelusan, dan Kepercayaan

Apabila sistem ini menjadi lebih autonomi dalam pemikirannya, tadbir urus dan ketelusan adalah penting:

Mempunyai alat yang menyediakan rekod tindakan yang jelas adalah penting. Tanpa alat ini, menyahpepijat proses berbilang langkah boleh menjadi sangat sukar. Lihat contoh berikut daripada Literal AI (syarikat di belakang Chainlit) untuk Agent run:

AgentRunExample

Kesimpulan

Agentic RAG mewakili evolusi semula jadi dalam cara sistem AI menangani tugas yang kompleks dan intensif data. Dengan mengadaptasi corak interaksi berulang, memilih alat secara autonomi, dan memperbaiki pertanyaan sehingga mencapai hasil berkualiti tinggi, sistem ini bergerak melangkaui pengikut prompt statik kepada pembuat keputusan yang lebih adaptif dan sedar konteks. Walaupun masih terhad oleh infrastruktur yang ditentukan manusia dan garis panduan etika, keupayaan agentic ini membolehkan interaksi AI yang lebih kaya, lebih dinamik, dan akhirnya lebih berguna untuk kedua-dua perusahaan dan pengguna akhir.

Ada Lagi Soalan tentang Agentic RAG?

Sertai Azure AI Foundry Discord untuk berhubung dengan pelajar lain, menghadiri waktu pejabat, dan mendapatkan jawapan kepada soalan AI Agents anda.

Sumber Tambahan

Kertas Akademik

Pelajaran Sebelumnya

Pola Reka Bentuk Penggunaan Alat

Pelajaran Seterusnya

Membina Ejen AI yang Boleh Dipercayai


Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat yang kritikal, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.