ai-agents-for-beginners

Agentic RAG

(برای مشاهده ویدیوی این درس بر روی تصویر بالا کلیک کنید)

Agentic RAG

این درس یک مرور جامع بر روی Agentic Retrieval-Augmented Generation (Agentic RAG) ارائه می‌دهد، یک پارادایم نوظهور در هوش مصنوعی که در آن مدل‌های زبانی بزرگ (LLM) به‌صورت خودکار برنامه‌ریزی برای گام‌های بعدی خود را انجام می‌دهند و هم‌زمان اطلاعات را از منابع خارجی استخراج می‌کنند. بر خلاف الگوهای ایستا که ابتدا بازیابی می‌کنند و سپس می‌خوانند، Agentic RAG شامل فراخوان‌های تکراری به LLM است که با فراخوانی ابزار یا تابع و خروجی‌های ساختار یافته ترکیب می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را پالایش می‌کند، ابزارهای بیشتری را در صورت نیاز فرا می‌خواند و این چرخه را ادامه می‌دهد تا زمانی که راه‌حلی قابل قبول به دست آید.

مقدمه

این درس موارد زیر را پوشش می‌دهد

اهداف یادگیری

پس از اتمام این درس، شما خواهید دانست چگونه/درک خواهید کرد:

Agentic RAG چیست؟

Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در هوش مصنوعی است که در آن مدل‌های زبانی بزرگ (LLM) به‌صورت خودکار گام‌های بعدی خود را برنامه‌ریزی می‌کنند در حالی که اطلاعات را از منابع خارجی استخراج می‌کنند. بر خلاف الگوهای ایستا که ابتدا بازیابی می‌کنند و سپس می‌خوانند، Agentic RAG شامل فراخوان‌های تکراری به LLM است که با فراخوانی ابزار یا توابع و خروجی‌های ساختار یافته ترکیب می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را پالایش می‌کند، ابزارهای بیشتری را در صورت نیاز فرا می‌خواند و این چرخه را ادامه می‌دهد تا زمانی که راه‌حلی قابل قبول به دست آید. این سبک “سازنده-بازرس” تکراری دقت را بهبود می‌بخشد، پرسش‌های ناقص را مدیریت می‌کند و نتایج با کیفیت بالا را تضمین می‌کند.

سیستم فرآیند استدلال خود را به‌صورت فعال در اختیار دارد، پرسش‌های ناموفق را بازنویسی می‌کند، روش‌های بازیابی متفاوتی را انتخاب می‌کند و ابزارهای متعددی را مانند جستجوی برداری در Azure AI Search، پایگاه داده‌های SQL یا API‌های سفارشی پیش از نهایی کردن پاسخ خود ادغام می‌کند. کیفیت تمایز دهنده یک سیستم عاملی، توانایی آن در مالکیت فرآیند استدلال خود است. پیاده‌سازی‌های سنتی RAG به مسیرهای از پیش تعیین شده تکیه دارند، اما یک سیستم عاملی به‌صورت خودکار توالی گام‌ها را بر اساس کیفیت اطلاعاتی که می‌یابد تعیین می‌کند.

تعریف Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در توسعه هوش مصنوعی است که در آن مدل‌های زبانی بزرگ نه تنها اطلاعات را از منابع داده خارجی استخراج می‌کنند، بلکه به‌طور خودکار گام‌های بعدی خود را برنامه‌ریزی می‌کنند. بر خلاف الگوهای ایستا که ابتدا بازیابی می‌کنند و سپس می‌خوانند یا توالی‌های کاملاً اسکریپت شده درخواست‌ها، Agentic RAG شامل یک حلقه از فراخوان‌های تکراری به LLM است که با فراخوانی ابزار یا توابع و خروجی‌های ساختار یافته ترکیب می‌شود. در هر مرحله، سیستم نتایجی را که به دست آورده ارزیابی می‌کند، تصمیم می‌گیرد پرسش‌های خود را پالایش کند یا خیر، ابزارهای اضافی را در صورت نیاز فرا می‌خواند و این چرخه را تا زمانی که راه‌حل رضایت‌بخشی به دست آورد، ادامه می‌دهد.

این سبک عملکرد “سازنده-بازرس” تکراری برای بهبود دقت، رسیدگی به پرسش‌های ناقص به پایگاه‌های داده ساختارشده (مثلاً NL2SQL) و تضمین نتایج متعادل و با کیفیت طراحی شده است. به جای تکیه صرف بر زنجیره‌های درخواست‌های مهندسی شده، سیستم به‌طور فعال فرآیند استدلال خود را در اختیار دارد. می‌تواند پرسش‌هایی که شکست می‌خورند را بازنویسی کند، روش‌های بازیابی مختلفی را انتخاب نماید و چندین ابزار را مانند جستجوی برداری در Azure AI Search، پایگاه داده‌های SQL یا API‌های سفارشی قبل از نهایی کردن پاسخ خود ادغام کند. این نیاز به چارچوب‌های سازماندهی پیچیده را از بین می‌برد. در عوض، یک حلقه نسبتاً ساده از «فراخوان LLM → استفاده از ابزار → فراخوان LLM → …» می‌تواند خروجی‌های پیشرفته و مبتنی بر استدلال تولید کند.

Agentic RAG Core Loop

مالکیت فرآیند استدلال

ویژگی تمایز دهنده‌ای که یک سیستم را «عاملی» می‌کند، توانایی مالکیت فرآیند استدلالش است. پیاده‌سازی‌های سنتی RAG اغلب به مسیر تعیین شده توسط انسان برای مدل تکیه دارند: یک زنجیره اندیشه که مشخص می‌کند چه چیزی و چه زمانی بازیابی شود. اما زمانی که یک سیستم واقعاً عاملی است، به‌صورت داخلی تصمیم می‌گیرد چگونه به مسئله نزدیک شود. این فقط اجرای یک اسکریپت نیست؛ بلکه به‌صورت خودکار توالی گام‌ها را بر اساس کیفیت اطلاعاتی که می‌یابد تعیین می‌کند. برای مثال، اگر از آن خواسته شود استراتژی راه‌اندازی محصولی را ایجاد کند، تنها به یک درخواست که کل جریان تحقیق و تصمیم‌گیری را مشخص می‌کند تکیه نمی‌کند. بلکه مدل عاملی به‌طور مستقل تصمیم می‌گیرد:

  1. بازیابی گزارش‌های روند بازار فعلی با استفاده از Bing Web Grounding
  2. شناسایی داده‌های مرتبط رقبا با استفاده از Azure AI Search.
  3. همبسته‌سازی معیارهای فروش داخلی تاریخی با استفاده از Azure SQL Database.
  4. ترکیب یافته‌ها به استراتژی یکپارچه هماهنگ شده از طریق Azure OpenAI Service.
  5. ارزیابی استراتژی برای شکاف‌ها یا ناسازگاری‌ها و درخواست دور دوم بازیابی در صورت لزوم. تمام این گام‌ها — پالایش پرسش‌ها، انتخاب منابع، تکرار تا رسیدن به «رضایت» نسبت به پاسخ — توسط مدل تصمیم‌گیری می‌شود، نه توسط یک انسان پیش‌اسکریپت شده.

حلقه‌های تکراری، ادغام ابزار و حافظه

Tool Integration Architecture

یک سیستم عاملی به یک الگوی تعامل حلقوی تکیه دارد:

با گذشت زمان، این حس فهم پیوسته ایجاد می‌شود که به مدل اجازه می‌دهد وظایف پیچیده چندمرحله‌ای را بدون نیاز به مداخله مستمر انسان یا تغییر مکرر درخواست هدایت کند.

رسیدگی به حالات شکست و خوداصلاحی

خودمختاری Agentic RAG همچنین شامل مکانیزم‌های قوی خوداصلاحی است. زمانی که سیستم به بن‌بست می‌رسد — مانند بازیابی اسناد نامرتبط یا مواجهه با پرسش‌های ناقص — می‌تواند:

این رویکرد تکراری و پویا به مدل اجازه می‌دهد به‌طور مستمر بهبود یابد و اطمینان حاصل کند که سیستم تنها یکبار شلیک نیست بلکه از اشتباهات خود در طول یک جلسه یاد می‌گیرد.

Self Correction Mechanism

مرزهای آژانسی

با وجود خودمختاری‌اش در یک وظیفه، Agentic RAG معادل هوش مصنوعی عمومی نیست. قابلیت‌های «عاملی» آن محدود به ابزارها، منابع داده و سیاست‌هایی است که توسط توسعه‌دهندگان انسانی ارائه شده‌اند. نمی‌تواند ابزارهای خود را اختراع کند یا از مرزهای حوزه‌های تعیین شده فراتر رود. بلکه در سازماندهی پویا منابع موجود عالی است. تفاوت‌های کلیدی با اشکال پیشرفته‌تر هوش مصنوعی عبارتند از:

  1. خودمختاری خاص حوزه: سیستم‌های Agentic RAG بر دستیابی به اهداف تعریف شده توسط کاربر در حوزه‌ای شناخته شده تمرکز دارند و از استراتژی‌هایی مانند بازنویسی پرسش یا انتخاب ابزار برای بهبود نتایج استفاده می‌کنند.
  2. وابسته به زیرساخت: توانایی‌های سیستم به ابزارها و داده‌هایی که توسعه‌دهندگان ادغام کرده‌اند بستگی دارد. بدون دخالت انسان نمی‌تواند از این مرزها فراتر رود.
  3. احترام به محدودیت‌ها: دستورالعمل‌های اخلاقی، قوانین تطبیق و سیاست‌های کسب‌وکار بسیار مهم باقی می‌مانند. آزادی عامل همیشه توسط تدابیر ایمنی و مکانیزم‌های نظارت محدود می‌شود (امیدواریم).

موارد استفاده عملی و ارزش

Agentic RAG در سناریوهایی که نیاز به پالایش تکراری و دقت دارد می‌درخشد:

  1. محیط‌های با اولویت صحت: در بررسی‌های تطبیق، تحلیل‌های نظارتی یا تحقیقات حقوقی، مدل عاملی می‌تواند بارها حقیقت‌ها را بررسی کند، منابع متعدد را مشورت کند و پرسش‌ها را تا تولید پاسخی کاملاً بررسی شده بازنویسی کند.
  2. تعاملات پیچیده پایگاه داده: هنگام کار با داده‌های ساختاربندی شده که پرسش‌ها ممکن است اغلب شکست بخورند یا نیاز به تنظیم داشته باشند، سیستم می‌تواند پرسش‌های خود را با استفاده از Azure SQL یا Microsoft Fabric OneLake اصلاح کرده و اطمینان حاصل کند بازیابی نهایی با نیت کاربر مطابقت دارد.
  3. جریان‌های کاری گسترده: جلسات طولانی‌تر ممکن است با ظهور اطلاعات جدید تکامل یابند. Agentic RAG می‌تواند به طور مداوم داده‌های جدید را وارد کند و استراتژی‌ها را در حالی که بیشتر درباره فضای مسئله می‌آموزد، تغییر دهد.

حکمرانی، شفافیت و اعتماد

با خودمختارتر شدن این سیستم‌ها در استدلال، حکمرانی و شفافیت حیاتی می‌شود:

داشتن ابزارهایی که سوابق واضحی از اقدامات فراهم می‌کنند ضروری است. بدون آن‌ها عیب‌یابی یک فرآیند چند مرحله‌ای می‌تواند بسیار دشوار باشد. مثال زیر از Literal AI (شرکتی پشت Chainlit) برای یک اجرای Agent را ببینید:

AgentRunExample

نتیجه‌گیری

Agentic RAG نمایانگر یک تحول طبیعی در نحوه مدیریت سیستم‌های هوش مصنوعی برای وظایف پیچیده و داده‌محور است. با اتخاذ الگوی تعامل حلقوی، انتخاب خودکار ابزارها و پالایش پرسش‌ها تا رسیدن به نتیجه‌ای با کیفیت بالا، سیستم فراتر از تبعیت ایستا از درخواست‌ها حرکت کرده و به تصمیم‌گیری تطبیقی، آگاه به زمینه تبدیل می‌شود. در حالی که هنوز محدود به زیرساخت‌ها و دستورالعمل‌های اخلاقی تعریف شده توسط انسان است، این قابلیت‌های عاملی تعاملات هوش مصنوعی غنی‌تر، پویا‌تر و در نهایت مفیدتری را برای سازمان‌ها و کاربران نهایی فراهم می‌کنند.

سوالات بیشتری درباره Agentic RAG دارید؟

به Microsoft Foundry Discord بپیوندید تا با دیگر یادگیرندگان ملاقات کنید، در ساعات اداری شرکت کنید و سوالات خود درباره AI Agents را مطرح نمایید.

منابع اضافی

مقالات علمی

درس قبلی

الگوی طراحی استفاده از ابزار

درس بعدی

ساخت عوامل هوش مصنوعی قابل اعتماد


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً آگاه باشید که ترجمه‌های خودکار ممکن است حاوی خطا یا نادرستی باشند. سند اصلی به زبان بومی خود باید منبع معتبر تلقی شود. برای اطلاعات حیاتی، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما مسئول هیچ گونه سوء تفاهم یا تفسیر نادرستی که از استفاده این ترجمه ناشی شود، نیستیم.