ai-agents-for-beginners

Agentic RAG

(برای مشاهده ویدئوی این درس، روی تصویر بالا کلیک کنید)

Agentic RAG

این درس یک مرور جامع از “تولید مبتنی بر بازیابی عامل‌محور” (Agentic Retrieval-Augmented Generation یا Agentic RAG) ارائه می‌دهد، یک پارادایم نوظهور در هوش مصنوعی که در آن مدل‌های زبانی بزرگ (LLMs) به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند و اطلاعات را از منابع خارجی استخراج می‌کنند. برخلاف الگوهای ایستا مانند “بازیابی-سپس-خواندن”، Agentic RAG شامل تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را اصلاح می‌کند، در صورت نیاز ابزارهای اضافی را فراخوانی می‌کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد.

مقدمه

این درس شامل موارد زیر خواهد بود:

اهداف یادگیری

پس از تکمیل این درس، شما قادر خواهید بود:

Agentic RAG چیست؟

“تولید مبتنی بر بازیابی عامل‌محور” (Agentic Retrieval-Augmented Generation یا Agentic RAG) یک پارادایم نوظهور در هوش مصنوعی است که در آن مدل‌های زبانی بزرگ (LLMs) به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند و اطلاعات را از منابع خارجی استخراج می‌کنند. برخلاف الگوهای ایستا مانند “بازیابی-سپس-خواندن”، Agentic RAG شامل تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را اصلاح می‌کند، در صورت نیاز ابزارهای اضافی را فراخوانی می‌کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد. این سبک تکراری “سازنده-بازبین” برای بهبود صحت، مدیریت پرسش‌های ناقص و تضمین نتایج با کیفیت بالا طراحی شده است.

سیستم به صورت فعال مالکیت فرآیند استدلال خود را بر عهده می‌گیرد، پرسش‌های ناموفق را بازنویسی می‌کند، روش‌های بازیابی مختلف را انتخاب می‌کند و ابزارهای متعددی مانند جستجوی برداری در Azure AI Search، پایگاه‌های داده SQL یا API‌های سفارشی را یکپارچه می‌کند تا پاسخ نهایی خود را ارائه دهد. ویژگی متمایز یک سیستم عامل‌محور توانایی آن در مالکیت فرآیند استدلال خود است. پیاده‌سازی‌های سنتی RAG به مسیرهای از پیش تعریف‌شده متکی هستند، اما یک سیستم عامل‌محور به صورت خودکار ترتیب مراحل را بر اساس کیفیت اطلاعاتی که پیدا می‌کند تعیین می‌کند.

تعریف “تولید مبتنی بر بازیابی عامل‌محور” (Agentic RAG)

“تولید مبتنی بر بازیابی عامل‌محور” (Agentic Retrieval-Augmented Generation یا Agentic RAG) یک پارادایم نوظهور در توسعه هوش مصنوعی است که در آن مدل‌های زبانی بزرگ (LLMs) نه تنها اطلاعات را از منابع داده خارجی استخراج می‌کنند، بلکه به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند. برخلاف الگوهای ایستا مانند “بازیابی-سپس-خواندن” یا دنباله‌های پرسش‌نامه‌ای دقیق، Agentic RAG شامل چرخه تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. در هر مرحله، سیستم نتایج به دست آمده را ارزیابی می‌کند، تصمیم می‌گیرد که آیا پرسش‌ها را اصلاح کند، ابزارهای اضافی را فراخوانی کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد.

این سبک تکراری “سازنده-بازبین” برای بهبود صحت، مدیریت پرسش‌های ناقص به پایگاه‌های داده ساختاریافته (مانند NL2SQL) و تضمین نتایج متعادل و با کیفیت بالا طراحی شده است. به جای تکیه بر زنجیره‌های پرسش‌نامه‌ای پیچیده، سیستم به صورت فعال مالکیت فرآیند استدلال خود را بر عهده می‌گیرد. این سیستم می‌تواند پرسش‌های ناموفق را بازنویسی کند، روش‌های بازیابی مختلف را انتخاب کند و ابزارهای متعددی مانند جستجوی برداری در Azure AI Search، پایگاه‌های داده SQL یا API‌های سفارشی را یکپارچه کند تا پاسخ نهایی خود را ارائه دهد. این امر نیاز به چارچوب‌های ارکستراسیون پیچیده را از بین می‌برد. در عوض، یک چرخه نسبتاً ساده از “تماس با LLM → استفاده از ابزار → تماس با LLM → …” می‌تواند خروجی‌های پیچیده و مستدل ارائه دهد.

Agentic RAG Core Loop

مالکیت فرآیند استدلال

ویژگی متمایزی که یک سیستم را “عامل‌محور” می‌کند توانایی آن در مالکیت فرآیند استدلال خود است. پیاده‌سازی‌های سنتی RAG اغلب به انسان‌ها متکی هستند تا مسیر مدل را از پیش تعریف کنند: یک زنجیره تفکر که مشخص می‌کند چه چیزی را بازیابی کند و چه زمانی. اما زمانی که یک سیستم واقعاً عامل‌محور باشد، به صورت داخلی تصمیم می‌گیرد که چگونه به مشکل نزدیک شود. این فقط اجرای یک اسکریپت نیست؛ بلکه به صورت خودکار ترتیب مراحل را بر اساس کیفیت اطلاعاتی که پیدا می‌کند تعیین می‌کند. برای مثال، اگر از آن خواسته شود یک استراتژی راه‌اندازی محصول ایجاد کند، فقط به یک پرسش‌نامه که کل جریان تحقیق و تصمیم‌گیری را مشخص می‌کند متکی نیست. در عوض، مدل عامل‌محور به صورت مستقل تصمیم می‌گیرد:

  1. گزارش‌های روند بازار فعلی را با استفاده از Bing Web Grounding بازیابی کند.
  2. داده‌های رقبا را با استفاده از Azure AI Search شناسایی کند.
  3. معیارهای فروش داخلی تاریخی را با استفاده از Azure SQL Database مرتبط کند.
  4. یافته‌ها را به یک استراتژی منسجم ترکیب کند که از طریق Azure OpenAI Service هماهنگ شده است.
  5. استراتژی را برای شکاف‌ها یا ناسازگاری‌ها ارزیابی کند و در صورت لزوم یک دور دیگر بازیابی را آغاز کند. تمام این مراحل—اصلاح پرسش‌ها، انتخاب منابع، تکرار تا زمانی که از پاسخ “راضی” باشد—توسط مدل تصمیم‌گیری می‌شود، نه اینکه از پیش توسط انسان اسکریپت شده باشد.

چرخه‌های تکراری، یکپارچه‌سازی ابزار و حافظه

Tool Integration Architecture

یک سیستم عامل‌محور به یک الگوی تعامل چرخه‌ای متکی است:

با گذشت زمان، این امر حس درک تکاملی ایجاد می‌کند و به مدل امکان می‌دهد وظایف پیچیده و چندمرحله‌ای را بدون نیاز به دخالت مداوم انسان یا تغییر شکل پرسش انجام دهد.

مدیریت حالت‌های شکست و خودتصحیح

خودمختاری Agentic RAG همچنین شامل مکانیسم‌های خودتصحیح قوی است. زمانی که سیستم به بن‌بست می‌رسد—مانند بازیابی اسناد نامربوط یا مواجهه با پرسش‌های ناقص—می‌تواند:

این رویکرد تکراری و پویا به مدل امکان می‌دهد به طور مداوم بهبود یابد و اطمینان حاصل کند که فقط یک سیستم تک‌مرحله‌ای نیست بلکه سیستمی است که از اشتباهات خود در طول یک جلسه یاد می‌گیرد.

Self Correction Mechanism

مرزهای عامل‌محوری

با وجود خودمختاری در یک وظیفه، Agentic RAG معادل هوش مصنوعی عمومی نیست. قابلیت‌های “عامل‌محور” آن محدود به ابزارها، منابع داده و سیاست‌هایی است که توسط توسعه‌دهندگان انسانی ارائه شده‌اند. این سیستم نمی‌تواند ابزارهای خود را اختراع کند یا از مرزهای دامنه‌ای که تعیین شده‌اند فراتر رود. بلکه در هماهنگی پویا منابع موجود برجسته است. تفاوت‌های کلیدی با اشکال پیشرفته‌تر هوش مصنوعی شامل موارد زیر است:

  1. خودمختاری خاص دامنه: سیستم‌های Agentic RAG بر دستیابی به اهداف تعریف‌شده توسط کاربر در یک دامنه شناخته‌شده تمرکز دارند و از استراتژی‌هایی مانند بازنویسی پرسش یا انتخاب ابزار برای بهبود نتایج استفاده می‌کنند.
  2. وابسته به زیرساخت: قابلیت‌های سیستم به ابزارها و داده‌هایی که توسط توسعه‌دهندگان یکپارچه شده‌اند بستگی دارد. این سیستم نمی‌تواند بدون دخالت انسانی از این مرزها فراتر رود.
  3. احترام به محدودیت‌ها: دستورالعمل‌های اخلاقی، قوانین انطباق و سیاست‌های کسب‌وکار همچنان بسیار مهم هستند. آزادی عامل همیشه توسط اقدامات ایمنی و مکانیسم‌های نظارتی محدود می‌شود (امیدواریم؟).

موارد استفاده عملی و ارزش

Agentic RAG در سناریوهایی که نیاز به اصلاح تکراری و دقت دارند برجسته است:

  1. محیط‌های مبتنی بر صحت: در بررسی‌های انطباق، تحلیل‌های نظارتی یا تحقیقات حقوقی، مدل عامل‌محور می‌تواند به طور مکرر حقایق را تأیید کند، منابع متعدد را مشورت کند و پرسش‌ها را بازنویسی کند تا پاسخی کاملاً بررسی‌شده ارائه دهد.
  2. تعاملات پیچیده با پایگاه‌های داده: هنگام کار با داده‌های ساختاریافته که پرسش‌ها ممکن است اغلب شکست بخورند یا نیاز به تنظیم داشته باشند، سیستم می‌تواند پرسش‌های خود را به صورت خودکار با استفاده از Azure SQL یا Microsoft Fabric OneLake اصلاح کند و اطمینان حاصل کند که بازیابی نهایی با هدف کاربر هماهنگ است.
  3. جریان‌های کاری طولانی‌مدت: جلسات طولانی‌تر ممکن است با ظهور اطلاعات جدید تکامل یابند. Agentic RAG می‌تواند به طور مداوم داده‌های جدید را وارد کند و استراتژی‌ها را با یادگیری بیشتر درباره فضای مشکل تغییر دهد.

حاکمیت، شفافیت و اعتماد

با افزایش خودمختاری این سیستم‌ها در استدلال، حاکمیت و شفافیت بسیار مهم هستند:

داشتن ابزارهایی که یک رکورد واضح از اقدامات ارائه دهند ضروری است. بدون آن‌ها، اشکال‌زدایی یک فرآیند چندمرحله‌ای می‌تواند بسیار دشوار باشد. مثال زیر از Literal AI (شرکت پشت Chainlit) را برای یک اجرای عامل ببینید:

AgentRunExample

نتیجه‌گیری

Agentic RAG نمایانگر یک تکامل طبیعی در نحوه برخورد سیستم‌های هوش مصنوعی با وظایف پیچیده و داده‌محور است. با اتخاذ یک الگوی تعامل چرخه‌ای، انتخاب خودکار ابزارها و اصلاح پرسش‌ها تا رسیدن به یک نتیجه با کیفیت بالا، سیستم از پیروی ایستا از پرسش‌نامه‌ها به یک تصمیم‌گیرنده تطبیق‌پذیر و آگاه به زمینه حرکت می‌کند. در حالی که همچنان محدود به زیرساخت‌ها و دستورالعمل‌های اخلاقی تعریف‌شده توسط انسان است، این قابلیت‌های عامل‌محور تعاملات غنی‌تر، پویا‌تر و در نهایت مفیدتر هوش مصنوعی را برای شرکت‌ها و کاربران نهایی امکان‌پذیر می‌کند.

سوالات بیشتری درباره Agentic RAG دارید؟

به Discord Azure AI Foundry بپیوندید تا با دیگر یادگیرندگان ملاقات کنید، در ساعات اداری شرکت کنید و سوالات خود درباره عوامل هوش مصنوعی را مطرح کنید.

منابع اضافی

مقالات علمی

درس قبلی

الگوی طراحی استفاده از ابزار

درس بعدی

ساخت عوامل هوش مصنوعی قابل اعتماد


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش می‌کنیم دقت را حفظ کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌ها باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، توصیه می‌شود از ترجمه انسانی حرفه‌ای استفاده کنید. ما مسئولیتی در قبال سوءتفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.