ai-agents-for-beginners

Agentic RAG

(לחצו על התמונה למעלה כדי לצפות בסרטון של השיעור הזה)

Agentic RAG

השיעור הזה מספק סקירה מקיפה על Agentic Retrieval-Augmented Generation (Agentic RAG), פרדיגמה מתפתחת ב-AI שבה מודלים שפתיים גדולים (LLMs) מתכננים באופן אוטונומי את הצעדים הבאים שלהם בזמן שהם שולפים מידע ממקורות חיצוניים. בניגוד לדפוסים סטטיים של שליפה ואז קריאה, Agentic RAG כולל קריאות איטרטיביות ל-LLM, משולבות עם קריאות לכלים או לפונקציות ופלטים ממוסדים. המערכת מעריכה תוצאות, מחדדת שאילתות, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד שמושגת תשובה מספקת.

Introduction

שיעור זה יכסה

Learning Goals

לאחר השלמת שיעור זה, תדעו/תבינו כיצד:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) היא פרדיגמה מתפתחת ב-AI שבה מודלים שפתיים גדולים (LLMs) מתכננים באופן אוטונומי את הצעדים הבאים שלהם בזמן שהם שולפים מידע ממקורות חיצוניים. בניגוד לדפוסים סטטיים של שליפה ואז קריאה, Agentic RAG כולל קריאות איטרטיביות ל-LLM, המשולבות עם קריאות לכלים או לפונקציות ופלטים ממוסדים. המערכת מעריכה תוצאות, מחדדת שאילתות, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד שהיא משיגה פתרון מספק. סגנון “יוצר-בודק” איטרטיבי זה משפר את הנכונות, מטפל בשאילתות פגומות ומבטיח תוצאות באיכות גבוהה.

המערכת בעלת בעלות פעילה על תהליך ההסקה שלה, כותבת מחדש שאילתות שנכשלו, בוחרת שיטות שליפה שונות ומשלבת כמה כלים—כמו חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL, או APIs מותאמים—לפני שהיא מסכמת את תשובתה הסופית. המאפיין המבדיל של מערכת סוכנית הוא היכולת שלה להיות בעלת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים נשענים על מסלולים מוגדרים מראש, אך מערכת סוכנית קובעת באופן אוטונומי את רצף הצעדים על בסיס איכות המידע שהיא מוצאת.

Defining Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) היא פרדיגמה מתפתחת בפיתוח AI שבה LLMs לא רק שולפים מידע ממקורות חיצוניים אלא גם מתכננים באופן אוטונומי את הצעדים הבאים שלהם. בניגוד לדפוסים סטטיים של שליפה ואז קריאה או רצפי פרומפטים כתובים בקפידה, Agentic RAG מערב לולאה של קריאות איטרטיביות ל-LLM, המשולבות עם קריאות לכלים או לפונקציות ופלטים ממוסדים. בכל שלב, המערכת מעריכה את התוצאות שהשיגה, מחליטה האם לחדד את השאילתות שלה, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד שהיא משיגה פתרון מספק.

סגנון הפעולה ה”איטרטיבי” של “יוצר-בודק” נועד לשפר את הנכונות, לטפל בשאילתות פגומות למסדי נתונים ממוסדים (למשל NL2SQL), ולהבטיח תוצאות מאוזנות ובאיכות גבוהה. במקום להסתמך אך ורק על שרשראות פרומפט מהונדסות בקפידה, המערכת בעלת בעלות פעילה על תהליך ההסקה שלה. היא יכולה לכתוב מחדש שאילתות שנכשלו, לבחור שיטות שליפה שונות ולשלב מספר כלים—כמו חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים—לפני שהיא מסיימת את התשובה שלה. זה מסיר את הצורך במסגרת אורכסטרציה מורכבת מדי. במקום זאת, לולאה פשוטה יחסית של “קריאת LLM → שימוש בכלי → קריאת LLM → …” יכולה לייצר פלטים מתוחכמים ומבוססים היטב.

Agentic RAG Core Loop

Owning the Reasoning Process

המאפיין המבדיל שהופך מערכת ל”סוכנית” הוא היכולת שלה להיות בעלת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים לעיתים קרובות תלויים בכך שבני אדם יגדירו מראש מסלול עבור המודל: שרשרת מחשבה שמפרטת מה לשלוף ומתי. אבל כאשר מערכת היא באמת סוכנית, היא מחליטה באופן פנימי כיצד לגשת לבעיה. היא לא רק מבצעת תסריט; היא מגדירה באופן אוטונומי את רצף הצעדים על בסיס איכות המידע שהיא מוצאת. לדוגמה, אם מבקשים ממנה ליצור אסטרטגיית השקת מוצר, היא לא תסתמך אך ורק על פרומפט שמפרט את כל סביבת המחקר וקבלת ההחלטות. במקום זאת, המודל הסוכני מחליט באופן עצמאי כדי:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. כל שלב מהשלבים האלה—מחדוד שאילתות, בחירת מקורות, איטרציה עד ש”מסופק” עם התשובה—מוחלט על ידי המודל, לא כתוב מראש על ידי אדם.

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

מערכת סוכנית מסתמכת על דפוס אינטראקציה לולאתי:

במהלך הזמן, זה יוצר תחושת הבנה מתפתחת, מה שמאפשר למודל לנווט במשימות מורכבות רב-שלביות מבלי לדרוש מהאדם להתערב באופן מתמיד או לעצב מחדש את הפרומפט.

Handling Failure Modes and Self-Correction

האוטונומיה של Agentic RAG כוללת גם מנגנוני תיקון עצמי חזקים. כשהמערכת נתקעת במבואות ללא מוצא—כגון שליפה של מסמכים לא רלוונטיים או התקלות בשאילתות פגומות—היא יכולה:

גישה איטרטיבית ודינמית זו מאפשרת למודל להשתפר באופן רציף, ומבטיחה שהוא לא רק מערכת של ניסיון אחד אלא מערכת שלומדת מהטעויות שלה במהלך כל סשן.

Self Correction Mechanism

Boundaries of Agency

למרות האוטונומיה בתוך משימה, Agentic RAG אינו שקול ל-Artificial General Intelligence. היכולות ה”סוכניות” שלה מוגבלות לכלים, למקורות הנתונים ולמדיניות שהוספקו על ידי מפתחים אנושיים. היא אינה יכולה להמציא כלים משלה או לצאת מעבר לגבולות התחום שנקבעו. במקום זאת, היא מצטיינת בתזמור דינמי של המשאבים הזמינים. הבדלים עיקריים מצורות AI מתקדמות יותר כוללים:

  1. Domain-Specific Autonomy: מערכות Agentic RAG מתמקדות בהשגת יעדי משתמש בתחום ידוע, ומשתמשות באסטרטגיות כמו כתיבת שאילתות מחדש או בחירת כלים כדי לשפר תוצאות.
  2. Infrastructure-Dependent: היכולות של המערכת תלויות בכלים ובנתונים שאינטגרו המפתחים. היא אינה יכולה לחרוג מהמגבלות הללו ללא התערבות אנושית.
  3. Respect for Guardrails: קווים מנחים אתיים, כללי תאימות ומדיניות עסקית נשארים חשובים מאוד. חופש הפעולה של הסוכן תמיד מוגבל על ידי אמצעי שמירה ומנגנוני פיקוח (מקווים כן?).

Practical Use Cases and Value

Agentic RAG מצטיין בתרחישים שדורשים חידוד איטרטיבי ודיוק:

  1. Correctness-First Environments: בבדיקות תאימות, ניתוח רגולטורי או מחקר משפטי, המודל הסוכני יכול לאמת עובדות שוב ושוב, להתייעץ במספר מקורות ולכתוב שאילתות מחדש עד שייצור תשובה שעברה ביקורת מעמיקה.
  2. Complex Database Interactions: כאשר עובדים עם נתונים ממוסדים שבהם שאילתות עלולות להיכשל או להזדקק להתאמה תכופה, המערכת יכולה לחדד את השאילתות באופן אוטונומי באמצעות Azure SQL או Microsoft Fabric OneLake, ולהבטיח שהשליפה הסופית תתאים לכוונת המשתמש.
  3. Extended Workflows: סשנים ארוכי-טווח עשויים להתפתח ככל שמידע חדש מתגלה. Agentic RAG יכול לשלב נתונים חדשים באופן רציף, לשנות אסטרטגיות ככל שהוא לומד יותר על מרחב הבעיה.

Governance, Transparency, and Trust

ככל שמערכות אלו הופכות ליותר אוטונומיות בתהליך ההסקה שלהן, ממשל ושקיפות הם קריטיים:

כלי שמספקים רישום ברור של הפעולות הם חיוניים. בלעדיהם, איתור תקלות בתהליך רב-שלבי יכול להיות קשה מאוד. ראו את הדוגמה הבאה מ-Literal AI (החברה שמאחורי Chainlit) עבור הרצת Agent:

AgentRunExample

Conclusion

Agentic RAG מייצג אבולוציה טבעית באופן שבו מערכות AI מטפלות במשימות מורכבות ותובעניות מבחינת נתונים. על ידי אימוץ דפוס אינטראקציה לולאתי, בחירה אוטונומית של כלים וחדוש שאילתות עד להשגת תוצאה איכותית, המערכת חורגת מעבר לעקיבות פרומפט סטטית והופכת לקבלת החלטות מותאמת להקשר. בעוד שהיא עדיין מוגבלת לתשתיות ולהנחיות אתיות שנקבעו על ידי בני אדם, יכולות הסוכנות הללו מאפשרות אינטראקציות AI עשירות יותר, דינמיות ושימושיות יותר הן עבור ארגונים והן עבור משתמשי קצה.

Got More Questions about Agentic RAG?

הצטרפו ל-Discord של Microsoft Foundry כדי לפגוש לומדים אחרים, להשתתף בשעות משרדיות ולקבל תשובות על שאלותיכם בנוגע ל-AI Agents.

Additional Resources

מאמרים אקדמיים

שיעור קודם

דפוס עיצוב לשימוש בכלים

השיעור הבא

בניית סוכני בינה אמינים


הצהרת אחריות: מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator (https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לשים לב שתרגומים אוטומטיים עלולים להכיל שגיאות או אי־דיוקים. המסמך המקורי בשפת המקור שלו צריך להיחשב כמקור הסמכות. למידע קריטי מומלץ להיעזר בתרגום מקצועי שנעשה על ידי מתרגם אנושי. איננו אחראים לכל אי־הבנות או לפרשנויות שגויות הנובעות מהשימוש בתרגום זה.