
(या धड्याचा व्हिडिओ पाहण्यासाठी वरील प्रतिमा क्लिक करा)
एजेन्टिक RAG
हा धडा Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) याबद्दल सखोल आढावा देतो — एक उदयोन्मुख AI पॅराडाइम जिथे मोठी भाषा मॉडेल्स (LLMs) स्वतः त्यांच्या पुढील पावले नियोजन करतात आणि बाह्य स्रोतांमधून माहिती आकृष्ट करतात. स्थिर retrieval-then-read पॅटर्नशी भिन्न, एजेन्टिक RAG मध्ये LLM ची पुनरावर्ती कॉल्स, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असतो. सिस्टीम निकालांचे मूल्यांकन करते, क्वेरीज सुधारते, जर आवश्यक असेल तर अतिरिक्त टूल्स कॉल करते आणि समाधानकारक समाधान मिळेपर्यंत हा चक्र चालू ठेवते.
परिचय
हा धडा खालील गोष्टी कव्हर करेल
- एजेन्टिक RAG समजून घ्या: बाह्य डेटा स्रोतांमधून माहिती घेणार्या आणि स्वतः पुढील पावले नियोजन करणाऱ्या मोठ्या भाषा मॉडेल्सच्या (LLMs) उदयोन्मुख पॅराडाइमनबद्दल शिका.
- पुनरावर्ती मेकर-चेकर शैली समजून घ्या: LLM कडे पुनरावर्ती कॉल्सचा लूप, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असलेला चक्र, जे अचूकता सुधारण्यासाठी आणि malformed क्वेरीज हाताळण्यासाठी डिझाइन केले आहे, हे समजून घ्या.
- व्यवहारिक अनुप्रयोग शोधा: जिथे एजेन्टिक RAG उत्कृष्ट ठरतो अशा परिस्थिती ओळखा, जसे की correctness-first वातावरण, क्लिष्ट डेटाबेस संवाद आणि विस्तारित वर्कफ्लो.
शिकण्याचे उद्दिष्ट
हा धडा पूर्ण केल्यानंतर, तुम्हाला हे माहित असेल/समजेल:
- एजेन्टिक RAG समजणे: बाह्य डेटा स्रोतांमधून माहिती आकृष्ट करताना मोठी भाषा मॉडेल्स (LLMs) स्वतः पुढील पावले नियोजन करतात अशा उदयोन्मुख AI पॅराडाइमनबद्दल शिका.
- पुनरावर्ती मेकर-चेकर शैली: LLM कडे पुनरावर्ती कॉल्सचा लूप, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असलेल्या संकल्पनेची समज मिळवा, ज्यामुळे अचूकता सुधारते आणि malformed क्वेरीज हाताळता येतात.
- तर्कसंगती प्रक्रियेवर स्वामित्व: समस्यांवर कसे पध्दतीने पुढे जावे हे ठरवण्याबाबत सिस्टीमच्या स्वविवेकाबद्दल समजून घ्या, पूर्वनिर्धारित मार्गावर अवलंबून न राहता निर्णय घेते.
- वर्कफ्लो: समजून घ्या की एक एजेन्टिक मॉडेल स्वतंत्रपणे मार्केट ट्रेंड रिपोर्ट्स प्राप्त करणे, स्पर्धक डेटा ओळखणे, अंतर्गत विक्री मीट्रिक्सचे समन्वय करणे, निष्कर्षांचे संश्लेषण करणे आणि रणनीतीचे मूल्यमापन कसे करते.
- पुनरावर्ती लूप्स, टूल एकत्रीकरण आणि मेमरी: सिस्टीमच्या लूप्ड इंटरऍक्शन पॅटर्नवर अवलंबित्व, पावले दरम्यान स्थिती आणि मेमरी राखणे जेणेकरून पुनरावृत्ती टाळता येईल आणि सूचित निर्णय घेता येतील, हे शिका.
- अपयश मोड्स आणि स्वयं-शुध्दीकरण हाताळणे: सिस्टीमच्या मजबूत स्वयं-शुध्दीकरण यंत्रणांचा अभ्यास करा, ज्यामध्ये पुन्हा विचार करणे आणि रीक्वेरी करणे, डायग्नोस्टिक टूल्स वापरणे आणि मानवी देखरेखीवर अवलंबून राहणे यांचा समावेश आहे.
- एजन्सीची सीमा: डोमेन-विशिष्ट स्वायत्तता, इन्फ्रास्ट्रक्चरवर अवलंबित्व आणि गार्डरेल्सचे पालन या बाबींवर लक्ष केंद्रित करून Agentic RAG च्या मर्यादा समजून घ्या.
- व्यावहारिक उपयोग प्रकरणे आणि मूल्य: जिथे एजेन्टिक RAG उत्कृष्ट ठरतो अशा परिस्थिती ओळखा, जसे की correctness-first वातावरण, क्लिष्ट डेटाबेस संवाद आणि विस्तारित वर्कफ्लो.
- शासन, पारदर्शकता आणि विश्वास: स्पष्टीकरणक्षम तर्कसंगती, पूर्वाग्रह नियंत्रण आणि मानवी देखरेखीचा समावेश करून शासन व पारदर्शकतेचे महत्त्व समजून घ्या.
एजेन्टिक RAG म्हणजे काय?
Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) ही एक उदयोन्मुख AI पॅराडाइम आहे जिथे मोठी भाषा मॉडेल्स (LLMs) स्वतः पुढील पावले नियोजन करतात आणि बाह्य स्रोतांमधून माहिती आकृष्ट करतात. स्थिर retrieval-then-read पॅटर्नशी भिन्न, एजेन्टिक RAG मध्ये LLM ची पुनरावर्ती कॉल्स, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असतो. सिस्टीम मिळालेल्या निकालांचे मूल्यांकन करते, क्वेरीज सुधारते, गरज भासल्यास अतिरिक्त टूल्स कॉल करते आणि समाधानकारक उत्तर मिळेपर्यंत हा चक्र चालू ठेवते. या पुनरावर्ती “मेकर-चेकर” शैलीमुळे अचूकता सुधारते, malformed क्वेरीज हाताळता येतात आणि उच्च-गुणवत्तेचे निकाल सुनिश्चित होतात.
सिस्टीम सक्रियपणे तिच्या तर्कसंगती प्रक्रियेवर स्वामित्व ठेवते — अपयशी क्वेरीज पुन्हा लिहिते, वेगवेगळ्या पुनर्प्राप्ती पद्धती निवडते, आणि Azure AI Search मधील वेक्टर शोध, SQL डेटाबेस किंवा कस्टम APIs सारख्या अनेक टूल्स एकत्र करणे यांचा समावेश करते — उत्तर अंतिम करण्यापूर्वी. एजेन्टिक सिस्टीमचे वेगळेपणा म्हणजे तिची स्वतःच्या तर्कसंगती प्रक्रियेवर स्वामित्व घेण्याची क्षमता. पारंपरिक RAG अंमलबजावण्या पूर्व-निर्धारित मार्गांवर अवलंबून असतात, परंतु एजेन्टिक सिस्टीम स्वतः सापडलेल्या माहितीच्या गुणवत्तेनुसार पावले ठरवते.
एजेन्टिक Retrieval-Augmented Generation (एजेन्टिक RAG) ची व्याख्या
Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) ही AI विकासातील एक उदयोन्मुख पद्धत आहे जिथे LLMs फक्त बाह्य डेटा स्रोतांमधून माहिती खेचत नाहीत तर स्वतः पुढील पावलेही नियोजित करतात. स्थिर retrieval-then-read पॅटर्न किंवा काळजीपूर्वक स्क्रिप्ट केलेल्या प्रॉम्प्ट स्रेन्ल्सपेक्षा वेगळे, एजेन्टिक RAG मध्ये LLM कडे पुनरावर्ती कॉल्सचा लूप असतो, ज्यामध्ये टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुटचा समावेश असतो. प्रत्येक टप्प्यावर सिस्टीम मिळालेल्या निकालांचे मूल्यांकन करते, क्वेरीज सुधाराव्या का हे ठरवते, गरज भासल्यास अतिरिक्त टूल्स कॉल करते आणि समाधानकारक तोडगा मिळेपर्यंत हा चक्र चालू ठेवते.
ही पुनरावर्ती “मेकर-चेकर” ऑपरेशन शैली अचूकता सुधारण्यासाठी, संरचित डेटाबेससाठी malformed क्वेरीज (उदा. NL2SQL) हाताळण्यासाठी आणि संतुलित, उच्च-गुणवत्तेचे निकाल सुनिश्चित करण्यासाठी डिझाइन केलेली आहे. फक्त काळजीपूर्वक इंजिनिअर केलेल्या प्रॉम्प्ट चेनवर अवलंबून राहण्याऐवजी, सिस्टीम सक्रियपणे तिच्या तर्कसंगती प्रक्रियेवर स्वामित्व ठेवते. हे अपयशी ठरणाऱ्या क्वेरीज पुन्हा लिहू शकते, वेगवेगळ्या पुनर्प्राप्ती पद्धती निवडू शकते, आणि Azure AI Search मधील वेक्टर शोध, SQL डेटाबेस, किंवा कस्टम APIs सारखे अनेक टूल्स एकत्र करू शकते — उत्तर अंतिम करण्यापूर्वी. त्यामुळे अत्यंत जटिल ऑर्केस्ट्रेशन फ्रेमवर्कची आवश्यकता नाहीशी होते. त्याऐवजी, “LLM call → tool use → LLM call → …” असा तुलनेने सोपा लूप देखील परिष्कृत आणि चांगल्या आधारावर आधारित आउटपुट देऊ शकतो.

तर्कसंगती प्रक्रियेवर स्वामित्व
एखादी सिस्टीम “एजेन्टिक” बनवणारी वेगळ्या ओळख म्हणजे तिची तर्कसंगती प्रक्रियेवर स्वामित्व घेण्याची क्षमता. पारंपरिक RAG अंमलबजावण्या बहुतेक वेळा मॉडेलसाठी मानवीकडून आधीच मार्ग ठरवण्यावर अवलंबून असतात: काय पुनर्प्राप्त करायचे आणि कधी ते साखळी-आउटलाइन करणार्या chain-of-thought द्वारे दाखवले जाते.
पण जेव्हा एखादी सिस्टीम खरोखरच एजेन्टिक असते, ती समस्या कशी हाताळायची हे आंतरिकपणे ठरवते. ती फक्त स्क्रिप्ट चालवत नसते; ती स्वतःच्या विवेकानुसार मिळालेल्या माहितीच्या गुणवत्तेनुसार पावले ठरवते.
उदाहरणार्थ, जर त्याला उत्पादन लॉन्च रणनीती तयार करण्यास सांगितले तर तो संपूर्ण संशोधन आणि निर्णय-प्रक्रियेची कार्यप्रणाली स्पेलआउट करणाऱ्या प्रॉम्प्टवर पूर्णपणे अवलंबून राहणार नाही. त्याऐवजी, एजेन्टिक मॉडेल स्वतंत्रपणे खालील गोष्टी ठरवू शकते:
- Bing Web Grounding वापरून सध्याच्या बाजार ट्रेंड रिपोर्ट्स प्राप्त करा
- Azure AI Search वापरून संबंधित स्पर्धक डेटा ओळखा.
- Azure SQL Database वापरून ऐतिहासिक अंतर्गत विक्री मीट्रिक्सचे समन्वय करा.
- Azure OpenAI Service द्वारे समन्वित धोरणात निष्कर्षांचे संश्लेषण करा.
- रणनीतीतील अंतर किंवा विसंगतींसाठी मूल्यमापन करा, जर आवश्यक असेल तर आणखी एक पुनर्प्राप्ती फेरी सुरू करा.
या सर्व टप्प्यां — क्वेरीज सुधारणा करणे, स्रोत निवडणे, उत्तराबद्दल “संतुष्ट” होईपर्यंत पुनरावृत्ती करणे — हे मानवाने पूर्व-स्क्रिप्ट केलेले नसून मॉडेलद्वारे ठरवले जातात.
पुनरावर्ती लूप्स, टूल एकत्रीकरण, आणि मेमरी

एजेन्टिक सिस्टीम लूप्ड इंटरऍक्शन पॅटर्नवर अवलंबून असते:
- प्रारंभिक कॉल: वापरकर्त्याचे उद्दिष्ट (उदा. वापरकर्ता प्रॉम्प्ट) LLM कडे सादर केले जाते.
- टूल कॉल: जर मॉडेलने गहाळ माहिती किंवा अस्पष्ट सूचनांचे आढळले तर ते संदर्भ गोळा करण्यासाठी टूल किंवा पुनर्प्राप्ती पद्धत—जसे की वेक्टर डेटाबेस क्वेरी (उदा. Azure AI Search Hybrid search over private data) किंवा संरचित SQL कॉल—निवडते.
- मूल्यमापन आणि सुधारणा: परत आलेल्या डेटाचे पुनरावलोकन केल्यानंतर, मॉडेल ठरवते की माहिती पुरेशी आहे की नाही. नसल्यास, ते क्वेरी सुधारते, वेगळे टूल वापरून पाहते किंवा आपली पध्दत समायोजित करते.
- संतुष्ट होईपर्यंत पुनरावृत्ती: मॉडेलला अंतिम, नीट विचार केलेले उत्तर देण्यासाठी पुरेशी स्पष्टता आणि पुरावे उपलब्ध असल्याचे ठरवण्यापर्यंत हा चक्र चालू राहतो.
- मेमरी आणि स्थिती: सिस्टीम पावले दरम्यान स्थिती आणि मेमरी राखते, त्यामुळे ते मागील प्रयत्न आणि त्यांचे निकाल लक्षात ठेवू शकते, पुनरावृत्ती टाळू शकते आणि अन पुढे जाऊन अधिक माहितीच्या आधारे निर्णय घेते.
कालांतराने, हे विकसित होत जाणारे समजण्याचे भाव निर्माण करते, जे मॉडेलला जटिल, बहु-टप्प्यांच्या कामांना मानवाने सतत हस्तक्षेप न करता किंवा प्रॉम्प्ट पुन्हा तयार न करता सहज मार्गदर्शन करण्यास सक्षम करते.
अपयश मोड्स आणि स्वयं-शुध्दीकरण हाताळणे
एजेन्टिक RAG ची स्वायत्तता मजबूत स्वयं-शुध्दीकरण यंत्रणाही समाविष्ट करते. जेव्हा सिस्टीम अडचणीत येते — उदा. अप्रासंगिक दस्तऐवज प्राप्त करणे किंवा malformed क्वेरीजचा सामना करणे — तेव्हा ती:
- पुनरावृत्ती आणि पुन्हा क्वेरी करणे: कमी-मूल्याचे प्रतिसाद देण्याऐवजी, मॉडेल नवीन शोध धोरणे वापरते, डेटाबेस क्वेरीज पुन्हा लिहिते, किंवा पर्यायी डेटासेटकडे पाहते.
- डायग्नोस्टिक टूल्स वापरणे: सिस्टीमला तिच्या तर्कसंगती टप्प्यांचे डीबग करण्यात किंवा प्राप्त केलेल्या डेटाची शुद्धता पडताळण्यात मदत करण्यासाठी अतिरिक्त फंक्शन्स कॉल करता येतात. Robust observability आणि monitoring सक्षम करण्यासाठी Azure AI Tracing सारखे टूल्स महत्त्वाचे ठरतात.
- मानवी देखरेखीवर अवलंबणे: उच्च-जोखमीच्या किंवा पुन्हा अपयशी ठरत असलेल्या परिस्थितीत, मॉडेल अनिश्चितता दर्शवून मानवी मार्गदर्शनाची विनंती करेल. एकदा मानवाने दुरुस्तीचे फीडबॅक दिले की मॉडेल पुढे जाऊन त्या धड्यापासून शिकू शकते.
हा पुनरावर्ती आणि गतीशील दृष्टिकोन मॉडेलला सतत सुधारण्यास परवानगी देतो, ज्यामुळे हे एक-शॉट सिस्टीम नाही तर दिलेल्या सत्रादरम्यान आपल्या चुकांमधून शिकणारी प्रणाली ठरते.

एजन्सीची सीमा
टास्कच्या आत असलेल्या स्वायत्ततेनंतरही, Agentic RAG हे Artificial General Intelligence शी समतुल्य नाही. त्याच्या “एजेन्टिक” क्षमताः मानव विकासकांनी प्रदान केलेल्या टूल्स, डेटा स्रोत आणि धोरणांपुरते मर्यादित असतात. ते स्वतःचे टूल्स शोधून काढू किंवा सेट केलेल्या डोमेन मर्यादेबाहेर जाऊ शकत नाही. त्याऐवजी, ते हातात असलेल्या संसाधनांचे डायनामिक ऑर्केस्ट्रेशन चांगल्या प्रकारे करते.
अधिक प्रगत AI स्वरूपांपासूनचे मुख्य भेद:
- डोमेन-विशिष्ट स्वायत्तता: एजेन्टिक RAG सिस्टीम वापरकर्ता-परिभाषित उद्दिष्टे ज्ञात डोमेनमध्ये साध्य करण्यावर केंद्रित असतात, आणि परिणाम सुधारण्यासाठी क्वेरी री-राइटिंग किंवा टूल निवडण्यासारख्या धोरणांचा अवलंब करतात.
- इन्फ्रास्ट्रक्चर-आधारित: सिस्टीमच्या क्षमतांचा आधार विकासकांनी एकत्र केलेल्या टूल्स आणि डेटावर असतो. मानवाच्या हस्तक्षेपाशिवाय ती या मर्यादांना ओलांडू शकत नाही.
- गार्डरेल्सचा आदर: नैतिक मार्गदर्शक तत्त्वे, अनुपालन नियम आणि व्यवसाय धोरणे महत्त्वाचीच राहतात. एजंटची स्वातंत्र्य नेहमी सुरक्षा उपाय आणि देखरेख यांच्या मर्यादांनी नियंत्रित असते (आशेने).
व्यावहारिक उपयोग प्रकरणे आणि मूल्य
एजेन्टिक RAG पुनरावर्ती सुधारणा आणि अचूकता आवश्यक असलेल्या परिस्थितींमध्ये उत्कृष्ट ठरतो:
- अचूकता-प्राधान्य वातावरणे: अनुपालन तपासणी, नियामक विश्लेषण किंवा कायदेशीर संशोधनात, एजेन्टिक मॉडेल तथ्ये वारंवार पडताळू शकते, अनेक स्रोतांचा संदर्भ घेऊ शकते आणि पुन्हा क्वेरी करून पूर्णपणे तपासलेले उत्तर तयार करू शकते.
- कठीण डेटाबेस इंटरऍक्शन्स: ज्याठिकाणी संरचित डेटाबरोबर काम करताना क्वेरीज बर्याचदा अयशस्वी होऊ शकतात किंवा समायोजित करण्याची गरज असते, तेव्हा सिस्टीम Azure SQL किंवा Microsoft Fabric OneLake वापरून स्वायत्तपणे आपली क्वेरी सुधारू शकते, ज्यामुळे अंतिम पुनर्प्राप्ती वापरकर्त्याच्या हेतूस अनुरूप होते.
- विस्तारित वर्कफ्लो: दीर्घकालीन सत्र नवीन माहिती समोर आल्यावर विकसित होऊ शकतात. एजेन्टिक RAG सतत नवीन डेटा समाविष्ट करू शकते आणि समस्येच्या क्षेत्राबद्दल अधिक जाणून घेतल्यानंतर धोरणे बदलू शकते.
शासन, पारदर्शकता आणि विश्वास
जसे हे सिस्टीम त्यांच्या तर्कसंगतीत अधिक स्वायत्त होत आहेत, तसे शासन आणि पारदर्शकता अत्यावश्यक ठरतात:
- स्पष्टीकरणक्षम तर्कसंगती: मॉडेल केलेल्या क्वेरीजचा ट्रेल, सल्ला घेतलेले स्रोत आणि निष्कर्षापर्यंत पोहोचण्यासाठी घेतलेले तर्कसंगती टप्पे हे सर्व ऑडिट ट्रेल प्रदान करू शकतात. Azure AI Content Safety आणि Azure AI Tracing / GenAIOps सारखी टूल्स पारदर्शकता राखण्यात आणि जोखमी कमी करण्यात मदत करू शकतात.
- पूर्वाग्रह नियंत्रण आणि संतुलित पुनर्प्राप्ती: विकासक पुनर्प्राप्ती धोरणे ट्यून करू शकतात जेणेकरून संतुलित, प्रतिनिधी डेटा स्रोतांचा विचार होईल, आणि Azure Machine Learning वापरणाऱ्या प्रगत डेटा सायन्स संघांसाठी सानुकूल मॉडेलद्वारे नियमितपणे आउटपुट ऑडिट केले जाऊ शकतात.
- मानवी देखरेख आणि अनुपालन: संवेदनशील कामांसाठी मानवी पुनरावलोकन आवश्यक राहते. एजेन्टिक RAG उच्च-जोखमीच्या निर्णयांत मानवी निर्णायकत्व कधीही पूर्णपणे बदलत नाही — ते त्याचे समर्थन करून अधिक तंतोतंत, तपासलेले पर्याय देते.
कायम असणारी नोंद ठेवणारी टूल्स असणे आवश्यक आहे. त्याशिवाय, बहु-टप्प्याच्या प्रक्रियेचे डीबग करणे फार कठीण होऊ शकते. Literal AI (company behind Chainlit) कडून खालील Agent run उदाहरण पहा:

निष्कर्ष
एजेन्टिक RAG हा AI सिस्टीम ज्या प्रकारे जटिल, डेटा-गहन कामे हाताळतात त्या मार्गातील नैसर्गिक विकासाचे प्रतिनिधित्व करतो. लूप्ड इंटरऍक्शन पॅटर्न अवलंबणे, स्वायत्तपणे टूल्स निवडणे, आणि उच्च-गुणवत्तेचा निकाल मिळेपर्यंत क्वेरीज सुधारत राहणे यामुळे सिस्टीम स्थिर प्रॉम्प्ट-फॉलोइंग पलीकडे जाऊन अधिक अनुकूलित, संदर्भ-जन्य निर्णय-कर्त्या बनते. तरीही मानवी-निर्धारित इन्फ्रास्ट्रक्चर व नैतिक मार्गदर्शक तत्त्वांच्या मर्यादांमध्ये बंदिस्त असले तरी, ही एजेन्टिक क्षमता उद्योग आणि अंतिम वापरकर्त्यांसाठी अधिक समृद्ध, गतिशील आणि उपयुक्त AI परस्परसंवाद सक्षम करते.
एजेन्टिक RAG बद्दल अधिक प्रश्न आहेत का?
Microsoft Foundry Discord मध्ये सामील व्हा, इतर शिकणाऱ्यांना भेटा, ऑफिस ऑवर्स अटेंड करा आणि आपल्या AI Agents संबंधित प्रश्नांची उत्तरे मिळवा.
अतिरिक्त संसाधने
अकादमिक पेपर्स
मागील धडा
Tool Use Design Pattern
पुढील धडा
Building Trustworthy AI Agents
अस्वीकरण:
हा दस्तऐवज AI अनुवाद सेवा Co-op Translator (https://github.com/Azure/co-op-translator) वापरून अनुवादित केला गेला आहे. आम्ही अचूकतेसाठी प्रयत्न करतो, परंतु कृत्रिम अनुवादात त्रुटी किंवा अचूकतेची कमतरता असू शकते, याची कृपया नोंद घ्या. मूळ भाषेतील दस्तऐवज अधिकृत स्रोत म्हणून मानला पाहिजे. महत्वाची माहिती असल्यास व्यावसायिक मानवी अनुवादाची शिफारस केली जाते. या अनुवादाच्या वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमजुतींसाठी किंवा चुकीच्या अर्थव्याख्यांसाठी आम्ही जबाबदार नाही.