
(इस पाठ का वीडियो देखने के लिए ऊपर दिए गए चित्र पर क्लिक करें)
Agentic RAG
यह पाठ Agentic Retrieval-Augmented Generation (Agentic RAG) का एक व्यापक अवलोकन प्रदान करता है, जो एक उभरता हुआ AI मॉडल है जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी स्रोतों से जानकारी प्राप्त करते हैं। स्थैतिक retrieval-then-read पैटर्न के विपरीत, Agentic RAG में LLM को आवृत्त कॉल शामिल हैं, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। सिस्टम परिणामों का मूल्यांकन करता है, प्रश्नों को परिष्कृत करता है, आवश्यकता पड़ने पर अतिरिक्त टूल बुलाता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान नहीं मिल जाता।
परिचय
इस पाठ में निम्नलिखित बातें शामिल होंगी
- Agentic RAG को समझना: इस उभरते हुए AI मॉडल को सीखें जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी डेटा स्रोतों से जानकारी प्राप्त करते हैं।
- आवृत्त Maker-Checker शैली को समझना: LLM को आवृत्त कॉल की श्रृंखला को समझें, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ होती हैं, जिनका उद्देश्य शुद्धता बढ़ाना और त्रुटिपूर्ण प्रश्नों को संभालना है।
- व्यावहारिक अनुप्रयोगों का अन्वेषण: उन परिदृश्यों की पहचान करें जहाँ Agentic RAG उत्कृष्ट है, जैसे कि correctness-first वातावरण, जटिल डेटाबेस इंटरैक्शन, और विस्तारित वर्कफ़्लोज़।
सीखने के लक्ष्य
इस पाठ को पूरा करने के बाद, आप जानेंगे / समझेंगे:
- Agentic RAG की समझ: AI में इस उभरते हुए मॉडल को सीखें जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी डेटा स्रोतों से जानकारी प्राप्त करते हैं।
- आवृत्त Maker-Checker शैली: LLM को आवृत्त कॉल की श्रृंखला को समझें, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ होती हैं, जिसे शुद्धता बढ़ाने और त्रुटिपूर्ण प्रश्नों को संभालने के लिए डिज़ाइन किया गया है।
- तर्क प्रक्रिया का स्वामित्व: सिस्टम की उस क्षमता को समझें जो अपने तर्क प्रक्रिया का मालिकाना हक रखती है, समस्याओं का समाधान कैसे करना है, इस पर निर्णय लेती है बिना पूर्व-निर्धारित मार्गों पर निर्भर हुए।
- वर्कफ़्लो: समझें कि एक एजेंटिक मॉडल स्वतंत्र रूप से कैसे बाज़ार के रुझान रिपोर्ट्स प्राप्त करता है, प्रतिस्पर्धी डेटा की पहचान करता है, आंतरिक बिक्री मेट्रिक्स का सहसंबंध करता है, निष्कर्षों को समेकित करता है, और रणनीति का मूल्यांकन करता है।
- आवृत्त चक्र, टूल एकीकरण, और मेमोरी: जानें कि सिस्टम निर्भर रहता है एक आवृत्त इंटरैक्शन पैटर्न पर, जो चरणों के बीच स्थिति और मेमोरी बनाए रखता है ताकि पुनरावृत्ति वाले चक्र से बचा जा सके और सूचित निर्णय लिए जा सकें।
- विफलता के तरीकों को संभालना और स्व-सुधार: सिस्टम की सशक्त स्व-सुधार तंत्रों का अन्वेषण करें, जिसमें पुनरावृत्ति और पुनः प्रश्न करना, निदान उपकरणों का उपयोग, और मानवीय निरीक्षण पर लौटना शामिल है।
- एजेंसी की सीमाएँ: Agentic RAG की सीमाओं को समझें, जो डोमेन-विशिष्ट स्वायत्तता, संरचना निर्भरता, और सुरक्षा नियमों के सम्मान पर केंद्रित हैं।
- व्यावहारिक उपयोग के मामले और मूल्य: उन परिदृश्यों को पहचानें जहाँ Agentic RAG उत्कृष्ट है, जैसे correctness-first वातावरण, जटिल डेटाबेस इंटरैक्शन, और विस्तारित वर्कफ़्लोज़।
- संचालन, पारदर्शिता, और विश्वास: शासन और पारदर्शिता के महत्व को जानें, जिसमें व्याख्यात्मक तर्क, पक्षपात नियंत्रण, और मानवीय निरीक्षण शामिल हैं।
Agentic RAG क्या है?
Agentic Retrieval-Augmented Generation (Agentic RAG) एक उभरता हुआ AI मॉडल है जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी स्रोतों से जानकारी प्राप्त करते हैं। स्थैतिक retrieval-then-read पैटर्न के विपरीत, Agentic RAG में LLM को आवृत्त कॉल शामिल हैं, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। सिस्टम परिणामों का मूल्यांकन करता है, प्रश्नों को परिष्कृत करता है, आवश्यकता पड़ने पर अतिरिक्त टूल बुलाता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए। यह आवृत्त “maker-checker” शैली शुद्धता को बेहतर बनाती है, त्रुटिपूर्ण प्रश्नों को संभालती है, और उच्च गुणवत्ता वाले परिणाम सुनिश्चित करती है।
सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व रखता है, विफल प्रश्नों को फिर से लिखता है, विभिन्न पुनः प्राप्ति विधियों का चयन करता है, और कई टूल्स को एकीकृत करता है — जैसे Azure AI Search में वेक्टर खोज, SQL डेटाबेस, या कस्टम API — अपने उत्तर को अंतिम रूप देने से पहले। एक एजेंटिक सिस्टम की विशिष्ट विशेषता इसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता है। पारंपरिक RAG कार्यान्वयन पूर्व-निर्धारित मार्गों पर निर्भर करते हैं, लेकिन एक एजेंटिक सिस्टम स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर कदमों की श्रृंखला निर्धारित करता है जो यह पाता है।
Agentic Retrieval-Augmented Generation (Agentic RAG) की परिभाषा
Agentic Retrieval-Augmented Generation (Agentic RAG) AI विकास में एक उभरता हुआ मॉडल है जहाँ LLM केवल बाहरी डेटा स्रोतों से जानकारी प्राप्त नहीं करता बल्कि स्वायत्त रूप से अपने अगले कदमों की योजना भी बनाता है। स्थैतिक retrieval-then-read पैटर्न या सावधानीपूर्वक स्क्रिप्टेड प्रॉम्प्ट अनुक्रमों के विपरीत, Agentic RAG में LLM को आवृत्त कॉल की एक लूप शामिल होती है, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। हर मोड़ पर, सिस्टम प्राप्त परिणामों का मूल्यांकन करता है, यह तय करता है कि क्या अपने प्रश्नों को परिष्कृत करना है, आवश्यकता पड़ने पर अतिरिक्त टूल करता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए।
यह आवृत्त “maker-checker” शैली संचालन को बेहतर बनाने, संरचित डेटाबेस (जैसे NL2SQL) के लिए त्रुटिपूर्ण प्रश्नों को संभालने, और संतुलित, उच्च गुणवत्ता वाले परिणाम सुनिश्चित करने के लिए डिज़ाइन की गई है। केवल सावधानीपूर्वक डिज़ाइन किए गए प्रॉम्प्ट श्रृंखलाओं पर निर्भर रहने के बजाय, सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व रखता है। यह विफल प्रश्नों को फिर से लिख सकता है, विभिन्न पुनः प्राप्ति विधियां चुन सकता है, और कई टूल्स जैसे Azure AI Search में वेक्टर खोज, SQL डेटाबेस, या कस्टम API एकीकृत कर सकता है — अपने उत्तर को अंतिम रूप देने से पहले। यह अत्यधिक जटिल ऑर्केस्ट्रेशन फ्रेमवर्क की आवश्यकता को समाप्त करता है। इसके बजाय, “LLM कॉल → टूल उपयोग → LLM कॉल → …” का एक अपेक्षाकृत सरल लूप परिष्कृत और अच्छी तरह से आधारित आउटपुट दे सकता है।

तर्क प्रक्रिया का स्वामित्व लेना
जिस गुण ने एक सिस्टम को “agentic” बना दिया है वह है उसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता। पारंपरिक RAG कार्यान्वयन अक्सर मॉडल के लिए एक मार्ग मानवीय रूप से पूर्व निर्धारित करते हैं: एक chain-of-thought जो यह बताती है कि क्या प्राप्त करना है और कब।
लेकिन जब एक सिस्टम वास्तव में agentic होता है, तो वह आंतरिक रूप से तय करता है कि समस्या को कैसे सुलझाना है। यह केवल एक स्क्रिप्ट निष्पादित नहीं कर रहा होता; यह स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर कदमों की श्रृंखला निर्धारित करता है जो वह पाता है।
उदाहरण के लिए, यदि इसे एक उत्पाद लॉन्च रणनीति बनाने के लिए कहा जाता है, तो यह पूरी रिसर्च और निर्णय प्रक्रिया को स्पेल आउट करने वाले प्रॉम्प्ट पर केवल निर्भर नहीं करता। इसके बजाय, एजेंटिक मॉडल स्वतंत्र रूप से निर्णय लेता है कि:
- Bing Web Grounding का उपयोग करके वर्तमान बाज़ार रुझान रिपोर्ट प्राप्त करें
- Azure AI Search का उपयोग करके प्रासंगिक प्रतिस्पर्धी डेटा की पहचान करें।
- Azure SQL Database का उपयोग करके ऐतिहासिक आंतरिक बिक्री मेट्रिक्स का सहसंबंध करें।
- Azure OpenAI Service के माध्यम से निष्कर्षों को एक समन्वित रणनीति में संकलित करें।
- रणनीति का ऐसे अंतराल या असंगतियों के लिए मूल्यांकन करें, यदि आवश्यक हो तो पुनः प्राप्ति के लिए एक और दौर को प्रेरित करें।
ये सभी कदम—प्रश्नों को परिष्कृत करना, स्रोत चुनना, जब तक उत्तर से “संतुष्ट” न हो तब तक आवृत्ति करना—मॉडल द्वारा तय किए जाते हैं, न कि किसी मानव द्वारा पूर्व-निर्धारित स्क्रिप्ट के तहत।
आवृत्त लूप, टूल एकीकरण, और मेमोरी

एक एजेंटिक सिस्टम एक आवृत्त इंटरैक्शन पैटर्न पर निर्भर करता है:
- प्रारंभिक कॉल: उपयोगकर्ता का लक्ष्य (उर्फ़ उपयोगकर्ता प्रॉम्प्ट) LLM को प्रस्तुत किया जाता है।
- टूल आह्वान: यदि मॉडल को गुमराह करने वाली जानकारी या अस्पष्ट निर्देश मिलते हैं, तो यह एक टूल या पुनः प्राप्ति विधि चुनता है—जैसे वेक्टर डेटाबेस क्वेरी (उदाहरण के लिए Azure AI Search Hybrid search निजी डेटा पर) या संरचित SQL कॉल—अधिक संदर्भ प्राप्त करने के लिए।
- मूल्यांकन और परिष्करण: लौटाए गए डेटा की समीक्षा के बाद, मॉडल यह तय करता है कि क्या जानकारी पर्याप्त है। यदि नहीं, तो यह प्रश्न को परिष्कृत करता है, कोई दूसरा टूल आजमाता है, या अपनी पद्धति समायोजित करता है।
- संतुष्ट होने तक पुनरावृत्ति: यह चक्र तब तक जारी रहता है जब तक मॉडल यह निर्धारित न कर ले कि उसके पास अंतिम, सुविचारित उत्तर देने के लिए पर्याप्त स्पष्टता और प्रमाण हैं।
- मेमोरी और स्थिति: क्योंकि सिस्टम चरणों के बीच स्थिति और मेमोरी बनाए रखता है, यह पिछली कोशिशों और उनके परिणामों को याद रख सकता है, पुनरावृत्ति वाले चक्र से बच सकता है और आगे सूचित निर्णय ले सकता है।
समय के साथ, यह विकसित होती समझ की भावना पैदा करता है, जिससे मॉडल जटिल, बहु-चरणीय कार्यों को बिना किसी मानवीय हस्तक्षेप या प्रॉम्प्ट को बार-बार पुन:निर्मित किए नेविगेट कर सकता है।
विफलता के तरीके संभालना और स्व-सुधार
Agentic RAG की स्वायत्तता सशक्त स्व-सुधार तंत्र भी शामिल करती है। जब सिस्टम गुमराह करता है—जैसे अप्रासंगिक दस्तावेज़ पुनः प्राप्त करना या त्रुटिपूर्ण प्रश्नों का सामना करना—तो यह कर सकता है:
- पुनरावृत्ति और पुनः प्रश्न करना: कम मूल्य वाले प्रतिक्रियाएँ लौटाने के बजाय, मॉडल नई खोज रणनीतियाँ आजमाता है, डेटाबेस प्रश्नों को फिर से लिखता है, या वैकल्पिक डेटा सेट देखता है।
- निदानात्मक टूल्स का उपयोग: सिस्टम अतिरिक्त फ़ंक्शन कर सकता है जो इसे अपने तर्क चरणों को डिबग करने या पुनः प्राप्त डेटा की शुद्धता की पुष्टि करने में मदद करें। Azure AI Tracing जैसे टूल्स मजबूत पर्यवेक्षण और निगरानी को सक्षम बनाने के लिए महत्वपूर्ण होंगे।
- मानव निरीक्षण पर निर्भरता: उच्च-दांव वाले या बार-बार विफल हो रहे परिदृश्यों के लिए, मॉडल अनिश्चितता को चिन्हित कर सकता है और मानवीय मार्गदर्शन का अनुरोध कर सकता है। एक बार जब मानव सुधारात्मक प्रतिक्रिया प्रदान करता है, तो मॉडल इसे भविष्य में शामिल कर सकता है।
यह आवृत्त और गतिशील दृष्टिकोण मॉडल को लगातार सुधार करने की अनुमति देता है, यह सुनिश्चित करता है कि यह केवल एक-बार उपयोग की प्रणाली न हो बल्कि एक ऐसी प्रणाली हो जो एक सत्र के दौरान अपनी गलतियों से सीखती रहे।

एजेंसी की सीमाएँ
हालांकि यह एक कार्य के भीतर स्वायत्त है, Agentic RAG कृत्रिम सामान्य बुद्धिमत्ता के समान नहीं है। इसकी “agentic” क्षमताएँ टूल, डेटा स्रोत, और मानव डेवलपर्स द्वारा प्रदान की गई नीतियों तक सीमित हैं। यह अपने टूल्स को आविष्कार नहीं कर सकता या उन डोमेन सीमाओं से बाहर कदम नहीं रख सकता जो सेट की गई हैं। बल्कि, यह उपलब्ध संसाधनों को गतिशील रूप से व्यवस्थित करने में माहिर है।
अधिक उन्नत AI रूपों से मुख्य अंतर शामिल हैं:
- डोमेन-विशिष्ट स्वायत्तता: Agentic RAG सिस्टम उपयोगकर्ता द्वारा परिभाषित लक्ष्यों को ज्ञात डोमेन के भीतर प्राप्त करने पर केंद्रित होते हैं, परिणामों में सुधार के लिए प्रश्न पुनर्लेखन या टूल चयन जैसी रणनीतियों का उपयोग करते हैं।
- संसाधन-निर्भर: सिस्टम की क्षमताएँ डेवलपर्स द्वारा एकीकृत किए गए टूल्स और डेटा पर निर्भर हैं। यह मानवीय हस्तक्षेप के बिना इन सीमाओं को पार नहीं कर सकता।
- सेफ्टी गार्डरेल का सम्मान: नैतिक दिशानिर्देश, अनुपालन नियम, और व्यावसायिक नीतियाँ बहुत महत्वपूर्ण बनी रहती हैं। एजेंट की स्वतंत्रता हमेशा सुरक्षा उपायों और पर्यवेक्षण तंत्रों (आशा है) द्वारा प्रतिबंधित होती है।
व्यावहारिक उपयोग के मामले और मूल्य
Agentic RAG उन परिदृश्यों में उत्कृष्ट है जहाँ आवृत्त परिष्करण और सटीकता आवश्यक है:
- Correctness-First वातावरण: अनुपालन जांच, विनियामक विश्लेषण, या कानूनी शोध में, एजेंटिक मॉडल कई बार तथ्यों की पुष्टि कर सकता है, अनेक स्रोतों से परामर्श कर सकता है, और तब तक प्रश्नों को फिर से लिख सकता है जब तक वह पूरी तरह से जांचा गया उत्तर प्राप्त न कर ले।
- जटिल डेटाबेस इंटरैक्शन: जब संरचित डेटा से निपटना होता है जहाँ प्रश्न अक्सर विफल हो सकते हैं या समायोजन की आवश्यकता होती है, सिस्टम स्वतंत्र रूप से Azure SQL या Microsoft Fabric OneLake का उपयोग करते हुए अपने प्रश्नों को परिष्कृत कर सकता है, यह सुनिश्चित करते हुए कि अंतिम पुनः प्राप्ति उपयोगकर्ता के इरादे के अनुसार है।
- विस्तारित वर्कफ़्लोज़: लंबी चलने वाली सत्र नई जानकारी प्रकट होने के साथ विकसित हो सकती हैं। Agentic RAG लगातार नए डेटा को सम्मिलित कर सकता है, और समस्या क्षेत्र के बारे में अधिक जानने के साथ रणनीतियों को परिवर्तित कर सकता है।
संचालन, पारदर्शिता, और विश्वास
जैसे-जैसे ये सिस्टम अपनी तर्क प्रक्रिया में अधिक स्वायत्त हो जाते हैं, शासन और पारदर्शिता महत्वपूर्ण हो जाते हैं:
- व्याख्यात्मक तर्क: मॉडल उन प्रश्नों का ऑडिट ट्रेल प्रदान कर सकता है जिन्हें उसने किया, जिन स्रोतों से उसने परामर्श किया, और वह तर्क प्रक्रिया जिसे उसने अपने निष्कर्ष तक पहुँचने के लिए उपयोग किया। Azure AI Content Safety और Azure AI Tracing / GenAIOps जैसे टूल पारदर्शिता बनाए रखने और जोखिमों को कम करने में मदद करेंगे।
- पक्षपात नियंत्रण और संतुलित पुनः प्राप्ति: डेवलपर्स पुनः प्राप्ति रणनीतियों को ट्र्यून कर सकते हैं ताकि संतुलित, प्रतिनिधि डेटा स्रोतों पर विचार किया जाए, और नियमित रूप से आउटपुट का ऑडिट कर सकते हैं ताकि पक्षपात या विचलित पैटर्न का पता लगाया जा सके, विशेष रूप से Azure Machine Learning का उपयोग करने वाले उन्नत डेटा साइंस संगठनों के लिए कस्टम मॉडल के साथ।
- मानव पर्यवेक्षण और अनुपालन: संवेदनशील कार्यों के लिए, मानवीय समीक्षा आवश्यक रहती है। Agentic RAG उच्च-दांव वाले निर्णयों में मानवीय निर्णय को प्रतिस्थापित नहीं करता—बल्कि उसे अधिक व्यापक रूप से जांचे गए विकल्प प्रदान करके बढ़ाता है।
ऐसे टूल होना आवश्यक है जो कार्रवाइयों का स्पष्ट रिकॉर्ड प्रदान करें। इनके बिना, एक बहु-चरणीय प्रक्रिया का डिबग करना बहुत कठिन हो सकता है। नीचे Literal AI (जो Chainlit के पीछे कंपनी है) से Agent रन का एक उदाहरण देखें:

निष्कर्ष
Agentic RAG जटिल, डेटा-गहन कार्यों को संभालने में AI सिस्टम के प्राकृतिक विकास का प्रतिनिधित्व करता है। एक आवृत्त इंटरैक्शन पैटर्न अपनाकर, स्वायत्त रूप से टूल का चयन करके, और उच्च गुणवत्ता वाले परिणाम प्राप्त होने तक प्रश्नों को परिष्कृत करके, सिस्टम स्थैतिक प्रॉम्प्ट-अनुकरण से आगे बढ़कर अधिक अनुकूल, संदर्भ-सचेत निर्णय निर्माता बन जाता है। जबकि यह अभी भी मानवीय रूप से परिभाषित बुनियादी ढांचे और नैतिक दिशानिर्देशों द्वारा सीमित है, ये एजेंटिक क्षमताएँ उद्यमों और अंतिम उपयोगकर्ताओं दोनों के लिए अधिक समृद्ध, अधिक गतिशील, और अंततः अधिक उपयोगी AI इंटरैक्शन सक्षम करती हैं।
Agentic RAG के बारे में और प्रश्न हैं?
Microsoft Foundry Discord में शामिल हों अन्य शिक्षार्थियों से मिलने, कार्यालय समय में भाग लेने और अपने AI एजेंट्स के सवालों के उत्तर पाने के लिए।
अतिरिक्त संसाधन
शैक्षणिक पेपर
पिछला पाठ
Tool Use Design Pattern
अगला पाठ
विश्वसनीय AI एजेंट्स का निर्माण
अस्वीकरण:
इस दस्तावेज़ का अनुवाद AI अनुवाद सेवा Co-op Translator का उपयोग करके किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या असंगतियाँ हो सकती हैं। मूल दस्तावेज़ अपनी मूल भाषा में ही प्राधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से हुए किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।