ai-agents-for-beginners

Agentic RAG

(برای مشاهده ویدئوی این درس، روی تصویر بالا کلیک کنید)

Agentic RAG

این درس یک مرور جامع از Agentic Retrieval-Augmented Generation (Agentic RAG) ارائه می‌دهد، یک پارادایم نوظهور در هوش مصنوعی که در آن مدل‌های زبانی بزرگ (LLMs) به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند و اطلاعات را از منابع خارجی استخراج می‌کنند. برخلاف الگوهای ایستا مانند «بازیابی و سپس خواندن»، Agentic RAG شامل تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را اصلاح می‌کند، ابزارهای اضافی را در صورت نیاز فراخوانی می‌کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد.

مقدمه

این درس شامل موارد زیر خواهد بود:

اهداف یادگیری

پس از تکمیل این درس، شما قادر خواهید بود:

Agentic RAG چیست؟

Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در هوش مصنوعی است که در آن مدل‌های زبانی بزرگ (LLMs) به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند و اطلاعات را از منابع خارجی استخراج می‌کنند. برخلاف الگوهای ایستا مانند «بازیابی و سپس خواندن»، Agentic RAG شامل تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. سیستم نتایج را ارزیابی می‌کند، پرسش‌ها را اصلاح می‌کند، ابزارهای اضافی را در صورت نیاز فراخوانی می‌کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد. این سبک تکراری «سازنده-بازبین» برای بهبود صحت، مدیریت پرسش‌های ناقص، و تضمین نتایج با کیفیت بالا طراحی شده است.

سیستم به طور فعال فرآیند استدلال خود را مالکیت می‌کند، پرسش‌های ناموفق را بازنویسی می‌کند، روش‌های بازیابی مختلف را انتخاب می‌کند، و ابزارهای متعددی مانند جستجوی برداری در Azure AI Search، پایگاه‌های داده SQL، یا API‌های سفارشی را ادغام می‌کند تا پاسخ نهایی خود را ارائه دهد. ویژگی متمایز یک سیستم عامل‌محور توانایی آن در مالکیت فرآیند استدلال خود است. پیاده‌سازی‌های سنتی RAG به مسیرهای از پیش تعریف‌شده متکی هستند، اما یک سیستم عامل‌محور به صورت خودکار ترتیب مراحل را بر اساس کیفیت اطلاعاتی که پیدا می‌کند تعیین می‌کند.

تعریف Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در توسعه هوش مصنوعی است که در آن LLM‌ها نه تنها اطلاعات را از منابع داده خارجی استخراج می‌کنند بلکه به صورت خودکار مراحل بعدی خود را برنامه‌ریزی می‌کنند. برخلاف الگوهای ایستا مانند «بازیابی و سپس خواندن» یا توالی‌های پرسش‌نامه‌ای دقیق، Agentic RAG شامل چرخه تماس‌های تکراری با LLM است که با استفاده از ابزارها یا توابع و خروجی‌های ساختاریافته همراه می‌شود. در هر مرحله، سیستم نتایج به دست آمده را ارزیابی می‌کند، تصمیم می‌گیرد که آیا پرسش‌ها را اصلاح کند، ابزارهای اضافی را فراخوانی می‌کند و این چرخه را تا رسیدن به یک راه‌حل رضایت‌بخش ادامه می‌دهد.

این سبک تکراری «سازنده-بازبین» برای بهبود صحت، مدیریت پرسش‌های ناقص به پایگاه‌های داده ساختاریافته (مانند NL2SQL)، و تضمین نتایج متعادل و با کیفیت بالا طراحی شده است. به جای تکیه بر زنجیره‌های پرسش‌نامه‌ای پیچیده، سیستم به طور فعال فرآیند استدلال خود را مالکیت می‌کند. این سیستم می‌تواند پرسش‌های ناموفق را بازنویسی کند، روش‌های بازیابی مختلف را انتخاب کند، و ابزارهای متعددی مانند جستجوی برداری در Azure AI Search، پایگاه‌های داده SQL، یا API‌های سفارشی را ادغام کند تا پاسخ نهایی خود را ارائه دهد. این امر نیاز به چارچوب‌های ارکستراسیون پیچیده را از بین می‌برد. در عوض، یک چرخه نسبتاً ساده از «تماس با LLM → استفاده از ابزار → تماس با LLM → …» می‌تواند خروجی‌های پیچیده و مستدل ارائه دهد.

Agentic RAG Core Loop

مالکیت فرآیند استدلال

ویژگی متمایزی که یک سیستم را «عامل‌محور» می‌کند توانایی آن در مالکیت فرآیند استدلال خود است. پیاده‌سازی‌های سنتی RAG اغلب به انسان‌ها متکی هستند تا مسیر مدل را از پیش تعریف کنند: یک زنجیره تفکر که مشخص می‌کند چه چیزی را بازیابی کند و چه زمانی. اما وقتی یک سیستم واقعاً عامل‌محور باشد، به صورت داخلی تصمیم می‌گیرد که چگونه به مشکل نزدیک شود. این فقط اجرای یک اسکریپت نیست؛ بلکه به صورت خودکار ترتیب مراحل را بر اساس کیفیت اطلاعاتی که پیدا می‌کند تعیین می‌کند. برای مثال، اگر از آن خواسته شود یک استراتژی راه‌اندازی محصول ایجاد کند، فقط به یک پرسش‌نامه که کل جریان تحقیق و تصمیم‌گیری را مشخص می‌کند متکی نیست. در عوض، مدل عامل‌محور به صورت مستقل تصمیم می‌گیرد:

  1. گزارش‌های روند بازار فعلی را با استفاده از Bing Web Grounding بازیابی کند.
  2. داده‌های رقبا را با استفاده از Azure AI Search شناسایی کند.
  3. معیارهای فروش داخلی تاریخی را با استفاده از Azure SQL Database مرتبط کند.
  4. یافته‌ها را به یک استراتژی منسجم ترکیب کند که از طریق Azure OpenAI Service هماهنگ شده است.
  5. استراتژی را برای شکاف‌ها یا ناسازگاری‌ها ارزیابی کند و در صورت لزوم یک دور دیگر بازیابی را آغاز کند. تمام این مراحل—اصلاح پرسش‌ها، انتخاب منابع، تکرار تا زمانی که از پاسخ «راضی» باشد—توسط مدل تصمیم‌گیری می‌شود، نه اینکه از پیش توسط انسان اسکریپت شده باشد.

حلقه‌های تکراری، یکپارچه‌سازی ابزار و حافظه

Tool Integration Architecture

یک سیستم عامل‌محور به یک الگوی تعامل حلقه‌ای متکی است:

با گذشت زمان، این امر حس درک تکاملی ایجاد می‌کند و به مدل امکان می‌دهد وظایف پیچیده و چندمرحله‌ای را بدون نیاز به دخالت مداوم انسان یا تغییر شکل پرسش انجام دهد.

مدیریت حالت‌های شکست و خودتصحیح

خودمختاری Agentic RAG شامل مکانیسم‌های خودتصحیح قوی نیز می‌شود. وقتی سیستم به بن‌بست می‌رسد—مانند بازیابی اسناد نامربوط یا مواجهه با پرسش‌های ناقص—می‌تواند:

این رویکرد تکراری و پویا به مدل امکان می‌دهد به طور مداوم بهبود یابد و تضمین کند که فقط یک سیستم تک‌مرحله‌ای نیست بلکه سیستمی است که از اشتباهات خود در طول یک جلسه خاص یاد می‌گیرد.

Self Correction Mechanism

مرزهای عامل‌محوری

با وجود خودمختاری در یک وظیفه، Agentic RAG معادل هوش مصنوعی عمومی نیست. قابلیت‌های «عامل‌محور» آن محدود به ابزارها، منابع داده، و سیاست‌هایی است که توسط توسعه‌دهندگان انسانی ارائه شده‌اند. این سیستم نمی‌تواند ابزارهای خود را اختراع کند یا از مرزهای دامنه‌ای که تعیین شده‌اند فراتر رود. بلکه در هماهنگی پویا منابع موجود برجسته است. تفاوت‌های کلیدی با اشکال پیشرفته‌تر هوش مصنوعی شامل موارد زیر است:

  1. خودمختاری خاص دامنه: سیستم‌های Agentic RAG بر دستیابی به اهداف تعریف‌شده توسط کاربر در یک دامنه شناخته‌شده تمرکز دارند و از استراتژی‌هایی مانند بازنویسی پرسش‌ها یا انتخاب ابزار برای بهبود نتایج استفاده می‌کنند.
  2. وابسته به زیرساخت: قابلیت‌های سیستم به ابزارها و داده‌هایی که توسط توسعه‌دهندگان ادغام شده‌اند بستگی دارد. این سیستم نمی‌تواند بدون دخالت انسانی از این مرزها فراتر رود.
  3. احترام به محدودیت‌ها: دستورالعمل‌های اخلاقی، قوانین انطباق، و سیاست‌های کسب‌وکار همچنان بسیار مهم هستند. آزادی عامل همیشه توسط اقدامات ایمنی و مکانیسم‌های نظارتی محدود می‌شود (امیدواریم؟)

موارد استفاده عملی و ارزش

Agentic RAG در سناریوهایی که نیاز به اصلاح تکراری و دقت دارند برجسته است:

  1. محیط‌های مبتنی بر صحت: در بررسی‌های انطباق، تحلیل‌های نظارتی، یا تحقیقات قانونی، مدل عامل‌محور می‌تواند به طور مکرر حقایق را تأیید کند، منابع متعدد را مشورت کند، و پرسش‌ها را بازنویسی کند تا پاسخی کاملاً بررسی‌شده ارائه دهد.
  2. تعاملات پیچیده با پایگاه‌های داده: هنگام کار با داده‌های ساختاریافته که پرسش‌ها ممکن است اغلب شکست بخورند یا نیاز به تنظیم داشته باشند، سیستم می‌تواند پرسش‌های خود را به صورت خودکار با استفاده از Azure SQL یا Microsoft Fabric OneLake اصلاح کند و اطمینان حاصل کند که بازیابی نهایی با قصد کاربر همسو است.
  3. جریان‌های کاری طولانی‌مدت: جلسات طولانی‌تر ممکن است با ظهور اطلاعات جدید تکامل یابند. Agentic RAG می‌تواند به طور مداوم داده‌های جدید را ادغام کند و استراتژی‌ها را با یادگیری بیشتر درباره فضای مشکل تغییر دهد.

حاکمیت، شفافیت و اعتماد

با افزایش خودمختاری این سیستم‌ها در استدلال، حاکمیت و شفافیت بسیار مهم هستند:

داشتن ابزارهایی که یک رکورد واضح از اقدامات ارائه می‌دهند ضروری است. بدون آن‌ها، اشکال‌زدایی یک فرآیند چندمرحله‌ای می‌تواند بسیار دشوار باشد. مثال زیر از Literal AI (شرکت پشت Chainlit) را برای اجرای عامل ببینید:

AgentRunExample

AgentRunExample2

نتیجه‌گیری

Agentic RAG نمایانگر یک تکامل طبیعی در نحوه برخورد سیستم‌های هوش مصنوعی با وظایف پیچیده و داده‌محور است. با اتخاذ یک الگوی تعامل حلقه‌ای، انتخاب ابزارها به صورت خودکار، و اصلاح پرسش‌ها تا رسیدن به یک نتیجه با کیفیت بالا، سیستم از پیروی ایستا از پرسش‌ها به یک تصمیم‌گیرنده تطبیقی و آگاه به زمینه حرکت می‌کند. در حالی که همچنان محدود به زیرساخت‌های تعریف‌شده توسط انسان و دستورالعمل‌های اخلاقی است، این قابلیت‌های عامل‌محور تعاملات هوش مصنوعی غنی‌تر، پویا‌تر، و در نهایت مفیدتر را برای شرکت‌ها و کاربران نهایی امکان‌پذیر می‌سازد.

سوالات بیشتری درباره Agentic RAG دارید؟

به Azure AI Foundry Discord بپیوندید تا با دیگر یادگیرندگان ملاقات کنید، در ساعات اداری شرکت کنید و سوالات خود درباره AI Agents را پاسخ دهید.

منابع اضافی

- پیاده‌سازی تولید تقویت‌شده با بازیابی (RAG) با استفاده از سرویس Azure OpenAI: یاد بگیرید چگونه از داده‌های خود با سرویس Azure OpenAI استفاده کنید. این ماژول آموزشی مایکروسافت یک راهنمای جامع برای پیاده‌سازی RAG ارائه می‌دهد.

مقالات علمی

درس قبلی

الگوی طراحی استفاده از ابزار

درس بعدی

ساخت عوامل هوش مصنوعی قابل اعتماد


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما برای دقت تلاش می‌کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است شامل خطاها یا نادرستی‌هایی باشند. سند اصلی به زبان اصلی آن باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حساس، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما هیچ مسئولیتی در قبال سوءتفاهم‌ها یا تفسیرهای نادرست ناشی از استفاده از این ترجمه نداریم.