ai-agents-for-beginners

Agentic RAG

(לחצו על התמונה למעלה לצפייה בסרטון של השיעור)

Agentic RAG

שיעור זה מספק סקירה מקיפה על Agentic Retrieval-Augmented Generation (Agentic RAG), פרדיגמה חדשה בתחום הבינה המלאכותית שבה מודלים שפה גדולים (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך משיכת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות למודל השפה, משולבות עם קריאות לכלים או פונקציות ותוצרים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד להשגת פתרון מספק.

מבוא

שיעור זה יעסוק ב:

מטרות למידה

לאחר השלמת השיעור, תדעו כיצד/תבינו:

מהו Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בתחום הבינה המלאכותית שבה מודלים שפה גדולים (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך משיכת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות למודל השפה, משולבות עם קריאות לכלים או פונקציות ותוצרים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד להשגת פתרון מספק. סגנון איטרטיבי זה, המכונה “יצרן-בודק”, משפר את הדיוק, מטפל בשאילתות פגומות ומבטיח תוצאות איכותיות.

המערכת שולטת באופן פעיל בתהליך ההסקה שלה, משכתבת שאילתות שנכשלו, בוחרת שיטות שליפה שונות ומשלבת כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מסיימת את תשובתה. התכונה המבדילה של מערכת אג’נטית היא יכולתה לשלוט בתהליך ההסקה שלה. יישומי RAG מסורתיים מסתמכים על נתיבים מוגדרים מראש, אך מערכת אג’נטית קובעת באופן עצמאי את רצף השלבים בהתבסס על איכות המידע שהיא מוצאת.

הגדרת Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בפיתוח בינה מלאכותית שבה מודלים שפה גדולים (LLMs) לא רק שולפים מידע ממקורות נתונים חיצוניים אלא גם מתכננים באופן עצמאי את הצעדים הבאים שלהם. בניגוד לדפוסי שליפה-קריאה סטטיים או רצפי הנחיות מתוסרטים בקפידה, Agentic RAG כולל מחזור של קריאות חוזרות למודל השפה, משולבות עם קריאות לכלים או פונקציות ותוצרים מובנים. בכל שלב, המערכת מעריכה את התוצאות שהשיגה, מחליטה אם לשפר את השאילתות, מפעילה כלים נוספים במידת הצורך וממשיכה במחזור זה עד שהיא משיגה פתרון מספק.

סגנון פעולה איטרטיבי זה, המכונה “יצרן-בודק”, נועד לשפר את הדיוק, לטפל בשאילתות פגומות למסדי נתונים מובנים (לדוגמה, NL2SQL) ולהבטיח תוצאות מאוזנות ואיכותיות. במקום להסתמך רק על שרשראות הנחיות מתוכננות בקפידה, המערכת שולטת באופן פעיל בתהליך ההסקה שלה. היא יכולה לשכתב שאילתות שנכשלו, לבחור שיטות שליפה שונות ולשלב כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מסיימת את תשובתה. הדבר מבטל את הצורך במסגרות תזמור מורכבות מדי. במקום זאת, מחזור פשוט יחסית של “קריאה למודל שפה → שימוש בכלי → קריאה למודל שפה → …” יכול להניב תוצרים מתוחכמים ומבוססים היטב.

Agentic RAG Core Loop

שליטה בתהליך ההסקה

התכונה המבדילה שהופכת מערכת ל”אג’נטית” היא יכולתה לשלוט בתהליך ההסקה שלה. יישומי RAG מסורתיים מסתמכים לעיתים קרובות על בני אדם שמגדירים מראש נתיב עבור המודל: שרשרת מחשבה שמתארת מה לשלוף ומתי.
אך כאשר מערכת היא באמת אג’נטית, היא מחליטה באופן פנימי כיצד לגשת לבעיה. היא לא רק מבצעת תסריט; היא קובעת באופן עצמאי את רצף השלבים בהתבסס על איכות המידע שהיא מוצאת.
לדוגמה, אם היא מתבקשת ליצור אסטרטגיית השקת מוצר, היא לא מסתמכת רק על הנחיה שמפרטת את כל תהליך המחקר וקבלת ההחלטות. במקום זאת, המודל האג’נטי מחליט באופן עצמאי:

  1. לשלוף דוחות מגמות שוק עדכניים באמצעות Bing Web Grounding.
  2. לזהות נתוני מתחרים רלוונטיים באמצעות Azure AI Search.
  3. לקשר בין מדדי מכירות פנימיים היסטוריים באמצעות Azure SQL Database.
  4. לסנתז את הממצאים לאסטרטגיה מגובשת באמצעות Azure OpenAI Service.
  5. להעריך את האסטרטגיה לאיתור פערים או אי-התאמות, וליזום סבב שליפה נוסף במידת הצורך.
    כל השלבים הללו—שיפור שאילתות, בחירת מקורות, איטרציה עד שהמודל “מרוצה” מהתשובה—מוחלטים על ידי המודל, ולא מתוסרטים מראש על ידי אדם.

מחזורים איטרטיביים, שילוב כלים וזיכרון

Tool Integration Architecture

מערכת אג’נטית מסתמכת על דפוס אינטראקציה מחזורי:

עם הזמן, הדבר יוצר תחושה של הבנה מתפתחת, ומאפשר למודל לנווט משימות מורכבות ורב-שלביות מבלי שאדם יצטרך להתערב או לעצב מחדש את ההנחיה באופן מתמיד.

התמודדות עם מצבי כשל ותיקון עצמי

האג’נטיות של Agentic RAG כוללת גם מנגנוני תיקון עצמי חזקים. כאשר המערכת נתקלת במבוי סתום—כגון שליפת מסמכים לא רלוונטיים או שאילתות פגומות—היא יכולה:

גישה איטרטיבית ודינמית זו מאפשרת למודל להשתפר באופן מתמיד, ומבטיחה שהוא לא רק מערכת חד-פעמית אלא כזו שלומדת מטעויותיה במהלך סשן נתון.

Self Correction Mechanism

גבולות האג’נטיות

למרות האוטונומיה שלה בתוך משימה, Agentic RAG אינה מקבילה לבינה מלאכותית כללית. יכולותיה ה”אג’נטיות” מוגבלות לכלים, מקורות הנתונים והמדיניות שסופקו על ידי מפתחים אנושיים. היא אינה יכולה להמציא כלים משלה או לצאת מחוץ לגבולות התחום שהוגדרו. במקום זאת, היא מצטיינת בתזמור דינמי של המשאבים הקיימים.

הבדלים מרכזיים מצורות מתקדמות יותר של בינה מלאכותית כוללים:

  1. אוטונומיה ספציפית לתחום: מערכות Agentic RAG מתמקדות בהשגת מטרות שהוגדרו על ידי המשתמש בתוך תחום ידוע, תוך שימוש באסטרטגיות כמו שכתוב שאילתות או בחירת כלים כדי לשפר תוצאות.
  2. תלות בתשתית: יכולות המערכת תלויות בכלים ובנתונים ששולבו על ידי מפתחים. היא אינה יכולה לחרוג מגבולות אלה ללא התערבות אנושית.
  3. כיבוד מגבלות: הנחיות אתיות, כללי ציות ומדיניות עסקית נותרות חשובות מאוד. חופש הפעולה של הסוכן תמיד מוגבל על ידי אמצעי בטיחות ומנגנוני פיקוח (בתקווה).

מקרי שימוש מעשיים וערך

Agentic RAG מצטיין בתרחישים הדורשים איטרציה ודיוק:

  1. סביבות שבהן הדיוק הוא קריטי: בבדיקות ציות, ניתוח רגולטורי או מחקר משפטי, המודל האג’נטי יכול לאמת עובדות שוב ושוב, להתייעץ עם מקורות מרובים ולשכתב שאילתות עד שהוא מספק תשובה שנבדקה היטב.
  2. אינטראקציות מורכבות עם מסדי נתונים: כאשר מתמודדים עם נתונים מובנים שבהם שאילתות עשויות להיכשל לעיתים קרובות או לדרוש התאמה, המערכת יכולה לשפר את שאילתותיה באופן עצמאי באמצעות Azure SQL או Microsoft Fabric OneLake, ולהבטיח שהשליפה הסופית תואמת את כוונת המשתמש.
  3. תהליכי עבודה מורחבים: סשנים ארוכי טווח עשויים להתפתח ככל שמידע חדש עולה. Agentic RAG יכול לשלב באופן מתמיד נתונים חדשים, לשנות אסטרטגיות ככל שהוא לומד יותר על מרחב הבעיה.

ממשל, שקיפות ואמון

ככל שמערכות אלו הופכות לאוטונומיות יותר בתהליך ההסקה שלהן, ממשל ושקיפות הם קריטיים:

שימוש בכלים המספקים תיעוד ברור של פעולות הוא חיוני. בלעדיהם, איתור שגיאות בתהליך רב-שלבי יכול להיות קשה מאוד. ראו את הדוגמה הבאה מ-Literal AI (החברה מאחורי Chainlit) עבור הפעלת סוכן:

AgentRunExample

סיכום

Agentic RAG מייצג התפתחות טבעית באופן שבו מערכות בינה מלאכותית מתמודדות עם משימות מורכבות ועשירות בנתונים. על ידי אימוץ דפוס אינטראקציה מחזורי, בחירה אוטונומית של כלים ושיפור שאילתות עד להשגת תוצאה איכותית, המערכת מתקדמת מעבר למעקב סטטי אחר הנחיות לכדי מקבל החלטות אדפטיבי ומודע להקשר. למרות שהיא עדיין מוגבלת על ידי תשתיות שהוגדרו על ידי בני אדם והנחיות אתיות, יכולות אג’נטיות אלו מאפשרות אינטראקציות עשירות, דינמיות ובסופו של דבר מועילות יותר עם בינה מלאכותית עבור ארגונים ומשתמשי קצה.

יש לכם עוד שאלות על Agentic RAG?

הצטרפו ל-Azure AI Foundry Discord כדי לפגוש לומדים אחרים, להשתתף בשעות קבלה ולקבל תשובות לשאלות שלכם על סוכני בינה מלאכותית.

משאבים נוספים

מאמרים אקדמיים

שיעור קודם

תבנית עיצוב לשימוש בכלים

שיעור הבא

בניית סוכני AI אמינים


כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי אנושי. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.