
(לחצו על התמונה למעלה לצפייה בסרטון של השיעור)
Agentic RAG
שיעור זה מספק סקירה מקיפה על Agentic Retrieval-Augmented Generation (Agentic RAG), פרדיגמה חדשה בעולם הבינה המלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות ונשנות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד להשגת פתרון מספק.
מבוא
שיעור זה יעסוק בנושאים הבאים:
- הבנת Agentic RAG: למדו על הפרדיגמה החדשה בבינה מלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות נתונים חיצוניים.
- הבנת סגנון Maker-Checker איטרטיבי: הבינו את הלולאה של קריאות חוזרות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים, שנועדו לשפר את הדיוק ולטפל בשאילתות שגויות.
- חקר יישומים מעשיים: זיהוי תרחישים שבהם Agentic RAG מצטיין, כמו סביבות שבהן הדיוק הוא בראש סדר העדיפויות, אינטראקציות מורכבות עם מסדי נתונים, ותהליכי עבודה ממושכים.
מטרות למידה
לאחר השלמת שיעור זה, תדעו כיצד/תבינו:
- הבנת Agentic RAG: למדו על הפרדיגמה החדשה בבינה מלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות נתונים חיצוניים.
- סגנון Maker-Checker איטרטיבי: הבינו את הרעיון של לולאת קריאות חוזרות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים, שנועדו לשפר את הדיוק ולטפל בשאילתות שגויות.
- בעלות על תהליך ההסקה: הבינו את יכולת המערכת לקחת בעלות על תהליך ההסקה שלה, לקבל החלטות כיצד לגשת לבעיות מבלי להסתמך על מסלולים מוגדרים מראש.
- תהליך עבודה: הבינו כיצד מודל אג’נטי מחליט באופן עצמאי לשלוף דוחות מגמות שוק, לזהות נתוני מתחרים, לקשר בין מדדי מכירות פנימיים, לסנתז ממצאים ולהעריך אסטרטגיה.
- לולאות איטרטיביות, אינטגרציה של כלים וזיכרון: למדו על הסתמכות המערכת על דפוס אינטראקציה מחזורי, שמירה על מצב וזיכרון בין שלבים כדי להימנע מלולאות חוזרות ולקבל החלטות מושכלות.
- התמודדות עם מצבי כשל ותיקון עצמי: חקרו את מנגנוני התיקון העצמי החזקים של המערכת, כולל איטרציה ושאילתות חוזרות, שימוש בכלי אבחון, והסתמכות על פיקוח אנושי במידת הצורך.
- גבולות הסוכנות: הבינו את המגבלות של Agentic RAG, תוך התמקדות באוטונומיה ספציפית לתחום, תלות בתשתית וכיבוד גבולות בטיחות.
- מקרי שימוש מעשיים וערך: זיהוי תרחישים שבהם Agentic RAG מצטיין, כמו סביבות שבהן הדיוק הוא בראש סדר העדיפויות, אינטראקציות מורכבות עם מסדי נתונים, ותהליכי עבודה ממושכים.
- ממשל, שקיפות ואמון: למדו על חשיבות הממשל והשקיפות, כולל הסקה ניתנת להסבר, שליטה בהטיות ופיקוח אנושי.
מהו Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בבינה מלאכותית שבה מודלים של שפה גדולה (LLMs) מתכננים באופן עצמאי את הצעדים הבאים שלהם תוך שליפת מידע ממקורות חיצוניים. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים, Agentic RAG כולל קריאות חוזרות ונשנות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. המערכת מעריכה תוצאות, משפרת שאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד להשגת פתרון מספק.
סגנון הפעולה האיטרטיבי “Maker-Checker” משפר את הדיוק, מטפל בשאילתות שגויות ומבטיח תוצאות איכותיות. המערכת לוקחת בעלות פעילה על תהליך ההסקה שלה, משכתבת שאילתות שנכשלו, בוחרת שיטות שליפה שונות ומשלבת כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מספקת תשובה סופית. האיכות המבדילה של מערכת אג’נטית היא יכולתה לקחת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים מסתמכים על מסלולים מוגדרים מראש, אך מערכת אג’נטית קובעת באופן עצמאי את רצף הצעדים בהתבסס על איכות המידע שהיא מוצאת.
הגדרת Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) הוא פרדיגמה חדשה בפיתוח בינה מלאכותית שבה LLMs לא רק שולפים מידע ממקורות נתונים חיצוניים אלא גם מתכננים באופן עצמאי את הצעדים הבאים שלהם. בניגוד לדפוסי שליפה-ואז-קריאה סטטיים או רצפי הנחיות מתוסרטים בקפידה, Agentic RAG כולל לולאה של קריאות חוזרות ל-LLM, המשולבות עם קריאות לכלים או פונקציות ופלטים מובנים. בכל שלב, המערכת מעריכה את התוצאות שהשיגה, מחליטה אם לשפר את השאילתות, מפעילה כלים נוספים במידת הצורך, וממשיכה במחזור זה עד שהיא משיגה פתרון מספק.
סגנון הפעולה האיטרטיבי “Maker-Checker” נועד לשפר את הדיוק, לטפל בשאילתות שגויות למסדי נתונים מובנים (כגון NL2SQL) ולהבטיח תוצאות מאוזנות ואיכותיות. במקום להסתמך רק על שרשראות הנחיה מתוכננות בקפידה, המערכת לוקחת בעלות פעילה על תהליך ההסקה שלה. היא יכולה לשכתב שאילתות שנכשלו, לבחור שיטות שליפה שונות ולשלב כלים מרובים—כגון חיפוש וקטורי ב-Azure AI Search, מסדי נתונים SQL או APIs מותאמים אישית—לפני שהיא מספקת תשובה סופית. כך מתבטלת הצורך במסגרת תזמור מורכבת מדי. במקום זאת, לולאה פשוטה יחסית של “קריאת LLM → שימוש בכלי → קריאת LLM → …” יכולה להניב פלטים מתוחכמים ומבוססים היטב.

בעלות על תהליך ההסקה
האיכות המבדילה שהופכת מערכת ל”אג’נטית” היא יכולתה לקחת בעלות על תהליך ההסקה שלה. יישומי RAG מסורתיים תלויים לעיתים קרובות בבני אדם שמגדירים מראש מסלול עבור המודל: שרשרת מחשבה שמפרטת מה לשלוף ומתי.
אך כאשר מערכת היא באמת אג’נטית, היא מחליטה באופן פנימי כיצד לגשת לבעיה. היא לא רק מבצעת תסריט; היא קובעת באופן עצמאי את רצף הצעדים בהתבסס על איכות המידע שהיא מוצאת.
לדוגמה, אם היא מתבקשת ליצור אסטרטגיית השקת מוצר, היא לא מסתמכת רק על הנחיה שמפרטת את כל תהליך המחקר וקבלת ההחלטות. במקום זאת, המודל האג’נטי מחליט באופן עצמאי:
- לשלוף דוחות מגמות שוק עדכניים באמצעות Bing Web Grounding.
- לזהות נתוני מתחרים רלוונטיים באמצעות Azure AI Search.
- לקשר בין מדדי מכירות פנימיים היסטוריים באמצעות Azure SQL Database.
- לסנתז את הממצאים לאסטרטגיה מגובשת שמתוזמרת באמצעות Azure OpenAI Service.
- להעריך את האסטרטגיה לאיתור פערים או אי-עקביות, וליזום סבב שליפה נוסף במידת הצורך.
כל הצעדים הללו—שיפור שאילתות, בחירת מקורות, איטרציה עד שהמודל “מרוצה” מהתשובה—מוחלטים על ידי המודל, ולא מתוסרטים מראש על ידי אדם.
לולאות איטרטיביות, אינטגרציה של כלים וזיכרון

מערכת אג’נטית מסתמכת על דפוס אינטראקציה מחזורי:
- קריאה ראשונית: המטרה של המשתמש (כלומר, ההנחיה) מוצגת ל-LLM.
- הפעלת כלים: אם המודל מזהה מידע חסר או הוראות מעורפלות, הוא בוחר כלי או שיטת שליפה—כגון שאילתת מסד נתונים וקטורי (למשל, Azure AI Search Hybrid search על נתונים פרטיים) או קריאה מובנית ל-SQL—כדי לאסוף הקשר נוסף.
- הערכה ושיפור: לאחר סקירת הנתונים שהוחזרו, המודל מחליט אם המידע מספיק. אם לא, הוא משפר את השאילתה, מנסה כלי אחר או מתאים את הגישה שלו.
- חזרה עד לסיפוק: מחזור זה נמשך עד שהמודל קובע שיש לו מספיק בהירות וראיות כדי לספק תשובה סופית ומנומקת היטב.
- זיכרון ומצב: מכיוון שהמערכת שומרת על מצב וזיכרון בין שלבים, היא יכולה להיזכר בניסיונות קודמים ובתוצאותיהם, להימנע מלולאות חוזרות ולקבל החלטות מושכלות יותר ככל שהיא מתקדמת.
עם הזמן, הדבר יוצר תחושת הבנה מתפתחת, המאפשרת למודל לנווט משימות מורכבות ורב-שלביות מבלי שאדם יצטרך להתערב או לעצב מחדש את ההנחיה באופן מתמיד.
התמודדות עם מצבי כשל ותיקון עצמי
האוטונומיה של Agentic RAG כוללת גם מנגנוני תיקון עצמי חזקים. כאשר המערכת נתקלת במבוי סתום—כגון שליפת מסמכים לא רלוונטיים או שאילתות שגויות—היא יכולה:
- לאתר מחדש ולבצע שאילתות חוזרות: במקום להחזיר תשובות בעלות ערך נמוך, המודל מנסה אסטרטגיות חיפוש חדשות, משכתב שאילתות מסד נתונים או בוחן מערכי נתונים חלופיים.
- להשתמש בכלי אבחון: המערכת עשויה להפעיל פונקציות נוספות שנועדו לעזור לה לאבחן את שלבי ההסקה שלה או לאמת את נכונות הנתונים שנשלפו. כלים כמו Azure AI Tracing יהיו חשובים כדי לאפשר תצפיתיות וניטור חזקים.
- להסתמך על פיקוח אנושי: בתרחישים קריטיים או כושלים שוב ושוב, המודל עשוי לסמן חוסר ודאות ולבקש הנחיה אנושית. ברגע שהאדם מספק משוב מתקן, המודל יכול לשלב את הלקח הזה להבא.
גישה איטרטיבית ודינמית זו מאפשרת למודל להשתפר באופן מתמשך, ומבטיחה שהוא לא רק מערכת חד-פעמית אלא כזו שלומדת מטעויותיה במהלך סשן נתון.

גבולות הסוכנות
למרות האוטונומיה שלה בתוך משימה, Agentic RAG אינה מקבילה לבינה מלאכותית כללית. היכולות ה”אג’נטיות” שלה מוגבלות לכלים, מקורות הנתונים והמדיניות שסופקו על ידי מפתחים אנושיים. היא אינה יכולה להמציא כלים משלה או לצאת מגבולות התחום שהוגדרו. במקום זאת, היא מצטיינת בתזמור דינמי של המשאבים הזמינים.
הבדלים מרכזיים מצורות מתקדמות יותר של בינה מלאכותית כוללים:
- אוטונומיה ספציפית לתחום: מערכות Agentic RAG מתמקדות בהשגת מטרות שהוגדרו על ידי המשתמש בתוך תחום ידוע, תוך שימוש באסטרטגיות כמו שכתוב שאילתות או בחירת כלים כדי לשפר תוצאות.
- תלות בתשתית: יכולות המערכת תלויות בכלים ובנתונים ששולבו על ידי מפתחים. היא אינה יכולה לחרוג מגבולות אלה ללא התערבות אנושית.
- כיבוד גבולות בטיחות: הנחיות אתיות, כללי ציות ומדיניות עסקית נותרים חשובים מאוד. החופש של הסוכן תמיד מוגבל על ידי אמצעי בטיחות ומנגנוני פיקוח (בתקווה).
מקרי שימוש מעשיים וערך
Agentic RAG מצטיין בתרחישים הדורשים שיפור איטרטיבי ודיוק:
- סביבות שבהן הדיוק הוא בראש סדר העדיפויות: בבדיקות ציות, ניתוח רגולטורי או מחקר משפטי, המודל האג’נטי יכול לאמת עובדות שוב ושוב, להתייעץ עם מקורות מרובים ולשכתב שאילתות עד שהוא מפיק תשובה שנבדקה ביסודיות.
- אינטראקציות מורכבות עם מסדי נתונים: כאשר עובדים עם נתונים מובנים שבהם שאילתות עשויות להיכשל לעיתים קרובות או לדרוש התאמה, המערכת יכולה לשפר את השאילתות שלה באופן עצמאי באמצעות Azure SQL או Microsoft Fabric OneLake, ולהבטיח שהשליפה הסופית תואמת את כוונת המשתמש.
- תהליכי עבודה ממושכים: סשנים ארוכים יותר עשויים להתפתח ככל שמידע חדש עולה. Agentic RAG יכול לשלב באופן מתמשך נתונים חדשים, לשנות אסטרטגיות ככל שהוא לומד יותר על מרחב הבעיה.
ממשל, שקיפות ואמון
ככל שמערכות אלו הופכות לאוטונומיות יותר בתהליך ההסקה שלהן, ממשל ושקיפות הם קריטיים:
- הסקה ניתנת להסבר: המודל יכול לספק תיעוד של השאילתות שביצע, המקורות שבהם התייעץ ושלבי ההסקה שנקט כדי להגיע למסקנה. כלים כמו Azure AI Content Safety ו-Azure AI Tracing / GenAIOps יכולים לעזור לשמור על שקיפות ולמתן סיכונים.
- שליטה בהטיות ושליפה מאוזנת: מפתחים יכולים לכוון אסטרטגיות שליפה כדי להבטיח שמקורות נתונים מאוזנים ונציגים יילקחו בחשבון, ולבצע ביקורות שוטפות על הפלטים כדי לזהות הטיות או דפוסים מוטים באמצעות מודלים מותאמים לארגוני מדע נתונים מתקדמים המשתמשים ב-Azure Machine Learning.
- פיקוח אנושי וציות: למשימות רגישות, סקירה אנושית נותרת חיונית. Agentic RAG אינו מחליף שיקול דעת אנושי בהחלטות קריטיות—הוא משלים אותו על ידי אספקת אפשרויות שנבדקו ביסודיות.
שימוש בכלים המספקים תיעוד ברור של פעולות הוא חיוני. בלעדיהם, איתור באגים בתהליך רב-שלבי עשוי להיות קשה מאוד. ראו את הדוגמה הבאה מ-Literal AI (החברה מאחורי Chainlit) עבור ריצת סוכן:


סיכום
Agentic RAG מייצג התפתחות טבעית באופן שבו מערכות בינה מלאכותית מטפלות במשימות מורכבות ועשירות בנתונים. על ידי אימוץ דפוס אינטראקציה מחזורי, בחירה אוטונומית של כלים ושיפור שאילתות עד להשגת תוצאה איכותית, המערכת מתקדמת מעבר לביצוע הנחיות סטטיות והופכת למקבלת החלטות אדפטיבית ומודעת להקשר. בעוד שהיא עדיין מוגבלת על ידי תשתיות שהוגדרו על ידי בני אדם והנחיות אתיות, יכולותיה האג’נטיות מאפשרות אינטראקציות עשירות, דינמיות ובסופו של דבר שימושיות יותר עם בינה מלאכותית עבור ארגונים ומשתמשי קצה.
יש לכם שאלות נוספות על Agentic RAG?
הצטרפו ל-Azure AI Foundry Discord כדי לפגוש לומדים נוספים,
יישום RAG (חיפוש מוגבר יצירה) עם שירות Azure OpenAI: למדו כיצד להשתמש בנתונים שלכם עם שירות Azure OpenAI. מודול זה של Microsoft Learn מספק מדריך מקיף ליישום RAG
מאמרים אקדמיים
שיעור קודם
תבנית עיצוב לשימוש בכלים
שיעור הבא
בניית סוכני AI אמינים
כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.