ai-agents-for-beginners

Agentic RAG

(לחצו על התמונה למעלה לצפייה בסרטון של השיעור)

Agentic RAG

שיעור זה מספק סקירה מקיפה על Agentic Retrieval-Augmented Generation (Agentic RAG), פרדיגמה חדשה בעולם הבינה המלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות ונשנות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד להשגת פתרון מספק.

מבוא

שיעור זה יעסוק בנושאים הבאים:

מטרות למידה

לאחר השלמת שיעור זה, תדעו כיצד/תבינו:

מהו Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בבינה מלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות ונשנות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד להשגת פתרון מספק.

סגנון הפעולה האיטרטיבי “Maker-Checker” משפר את הדיוק, מטפל בשאילתות שגויות ומבטיח תוצאות איכותיות. המערכת לוקחת בעלות פעילה על תהליך ההסקה שלה, משכתבת שאילתות שנכשלו, בוחרת שיטות שליפה שונות ומשלבת כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מספקת תשובה סופית. האיכות המבדילה של מערכת אג’נטית היא יכולתה לקחת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים מסתמכים על מסלולים מוגדרים מראש, אך מערכת אג’נטית קובעת באופן עצמאי את רצף הצעדים בהתבסס על איכות המידע שהיא מוצאת.

הגדרת Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בפיתוח בינה מלאכותית שבה LLMs לא רק שולפים מידע ממקורות נתונים חיצוניים אלא גם מתכננים באופן עצמאי את הצעדים הבאים שלהם. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים או רצפי הנחיות מתוסרטים בקפידה, Agentic RAG כולל לולאה של קריאות חוזרות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. בכל שלב, המערכת מעריכה את התוצאות שהשיגה, מחליטה אם לשפר את השאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד שהיא משיגה פתרון מספק.

סגנון הפעולה האיטרטיבי “Maker-Checker” נועד לשפר את הדיוק, לטפל בשאילתות שגויות למסדי נתונים מובנים (כגון NL2SQL) ולהבטיח תוצאות מאוזנות ואיכותיות. במקום להסתמך רק על שרשראות הנחיה מתוכננות בקפידה, המערכת לוקחת בעלות פעילה על תהליך ההסקה שלה. היא יכולה לשכתב שאילתות שנכשלו, לבחור שיטות שליפה שונות ולשלב כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מספקת תשובה סופית. כך מתבטלת הצורך במסגרת תזמור מורכבת מדי. במקום זאת, לולאה פשוטה יחסית של “קריאת LLM → שימוש בכלי → קריאת LLM → …” יכולה להניב פלטים מתוחכמים ומבוססים היטב.

Agentic RAG Core Loop

בעלות על תהליך ההסקה

האיכות המבדילה שהופכת מערכת ל”אג’נטית” היא יכולתה לקחת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים תלויים לעיתים קרובות בבני אדם שמגדירים מראש מסלול עבור המודל: שרשרת מחשבה שמפרטת מה לשלוף ומתי.
אך כאשר מערכת היא באמת אג’נטית, היא מחליטה באופן פנימי כיצד לגשת לבעיה. היא לא רק מבצעת תסריט; היא קובעת באופן עצמאי את רצף הצעדים בהתבסס על איכות המידע שהיא מוצאת.
לדוגמה, אם היא מתבקשת ליצור אסטרטגיית השקת מוצר, היא לא מסתמכת רק על הנחיה שמפרטת את כל תהליך המחקר וקבלת ההחלטות. במקום זאת, המודל האג’נטי מחליט באופן עצמאי:

  1. לשלוף דוחות מגמות שוק עדכניים באמצעות Bing Web Grounding.
  2. לזהות נתוני מתחרים רלוונטיים באמצעות Azure AI Search.
  3. לקשר בין מדדי מכירות פנימיים היסטוריים באמצעות Azure SQL Database.
  4. לסנתז את הממצאים לאסטרטגיה מגובשת שמתוזמרת באמצעות Azure OpenAI Service.
  5. להעריך את האסטרטגיה לאיתור פערים או אי-עקביות, וליזום סבב שליפה נוסף במידת הצורך.
    כל הצעדים הללו—שיפור שאילתות, בחירת מקורות, איטרציה עד שהמודל “מרוצה” מהתשובה—מוחלטים על ידי המודל, ולא מתוסרטים מראש על ידי אדם.

לולאות איטרטיביות, אינטגרציה של כלים וזיכרון

Tool Integration Architecture

מערכת אג’נטית מסתמכת על דפוס אינטראקציה מחזורי:

עם הזמן, הדבר יוצר תחושת הבנה מתפתחת, המאפשרת למודל לנווט משימות מורכבות ורב-שלביות מבלי שאדם יצטרך להתערב או לעצב מחדש את ההנחיה באופן מתמיד.

התמודדות עם מצבי כשל ותיקון עצמי

האוטונומיה של Agentic RAG כוללת גם מנגנוני תיקון עצמי חזקים. כאשר המערכת נתקלת במבוי סתום—כגון שליפת מסמכים לא רלוונטיים או שאילתות שגויות—היא יכולה:

גישה איטרטיבית ודינמית זו מאפשרת למודל להשתפר באופן מתמשך, ומבטיחה שהוא לא רק מערכת חד-פעמית אלא כזו שלומדת מטעויותיה במהלך סשן נתון.

Self Correction Mechanism

גבולות הסוכנות

למרות האוטונומיה שלה בתוך משימה, Agentic RAG אינה מקבילה לבינה מלאכותית כללית. היכולות ה”אג’נטיות” שלה מוגבלות לכלים, מקורות הנתונים והמדיניות שסופקו על ידי מפתחים אנושיים. היא אינה יכולה להמציא כלים משלה או לצאת מגבולות התחום שהוגדרו. במקום זאת, היא מצטיינת בתזמור דינמי של המשאבים הזמינים.

הבדלים מרכזיים מצורות מתקדמות יותר של בינה מלאכותית כוללים:

  1. אוטונומיה ספציפית לתחום: מערכות Agentic RAG מתמקדות בהשגת מטרות שהוגדרו על ידי המשתמש בתוך תחום ידוע, תוך שימוש באסטרטגיות כמו שכתוב שאילתות או בחירת כלים כדי לשפר תוצאות.
  2. תלות בתשתית: יכולות המערכת תלויות בכלים ובנתונים ששולבו על ידי מפתחים. היא אינה יכולה לחרוג מגבולות אלה ללא התערבות אנושית.
  3. כיבוד גבולות בטיחות: הנחיות אתיות, כללי ציות ומדיניות עסקית נותרים חשובים מאוד. החופש של הסוכן תמיד מוגבל על ידי אמצעי בטיחות ומנגנוני פיקוח (בתקווה).

מקרי שימוש מעשיים וערך

Agentic RAG מצטיין בתרחישים הדורשים שיפור איטרטיבי ודיוק:

  1. סביבות שבהן הדיוק הוא בראש סדר העדיפויות: בבדיקות ציות, ניתוח רגולטורי או מחקר משפטי, המודל האג’נטי יכול לאמת עובדות שוב ושוב, להתייעץ עם מקורות מרובים ולשכתב שאילתות עד שהוא מפיק תשובה שנבדקה ביסודיות.
  2. אינטראקציות מורכבות עם מסדי נתונים: כאשר עובדים עם נתונים מובנים שבהם שאילתות עשויות להיכשל לעיתים קרובות או לדרוש התאמה, המערכת יכולה לשפר את השאילתות שלה באופן עצמאי באמצעות Azure SQL או Microsoft Fabric OneLake, ולהבטיח שהשליפה הסופית תואמת את כוונת המשתמש.
  3. תהליכי עבודה ממושכים: סשנים ארוכים יותר עשויים להתפתח ככל שמידע חדש עולה. Agentic RAG יכול לשלב באופן מתמשך נתונים חדשים, לשנות אסטרטגיות ככל שהוא לומד יותר על מרחב הבעיה.

ממשל, שקיפות ואמון

ככל שמערכות אלו הופכות לאוטונומיות יותר בתהליך ההסקה שלהן, ממשל ושקיפות הם קריטיים:

שימוש בכלים המספקים תיעוד ברור של פעולות הוא חיוני. בלעדיהם, איתור באגים בתהליך רב-שלבי עשוי להיות קשה מאוד. ראו את הדוגמה הבאה מ-Literal AI (החברה מאחורי Chainlit) עבור ריצת סוכן:

AgentRunExample

AgentRunExample2

סיכום

Agentic RAG מייצג התפתחות טבעית באופן שבו מערכות בינה מלאכותית מטפלות במשימות מורכבות ועשירות בנתונים. על ידי אימוץ דפוס אינטראקציה מחזורי, בחירה אוטונומית של כלים ושיפור שאילתות עד להשגת תוצאה איכותית, המערכת מתקדמת מעבר לביצוע הנחיות סטטיות והופכת למקבלת החלטות אדפטיבית ומודעת להקשר. בעוד שהיא עדיין מוגבלת על ידי תשתיות שהוגדרו על ידי בני אדם והנחיות אתיות, יכולותיה האג’נטיות מאפשרות אינטראקציות עשירות, דינמיות ובסופו של דבר שימושיות יותר עם בינה מלאכותית עבור ארגונים ומשתמשי קצה.

יש לכם שאלות נוספות על Agentic RAG?

הצטרפו ל-Azure AI Foundry Discord כדי לפגוש לומדים נוספים, יישום RAG (חיפוש מוגבר יצירה) עם שירות Azure OpenAI: למדו כיצד להשתמש בנתונים שלכם עם שירות Azure OpenAI. מודול זה של Microsoft Learn מספק מדריך מקיף ליישום RAG

מאמרים אקדמיים

שיעור קודם

תבנית עיצוב לשימוש בכלים

שיעור הבא

בניית סוכני AI אמינים


כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.