
(ऊपर दी गई छवि पर क्लिक करें इस पाठ का वीडियो देखने के लिए)
एजेंटिक RAG
यह पाठ एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) का एक व्यापक अवलोकन प्रदान करता है, जो एक उभरता हुआ एआई दृष्टिकोण है, जिसमें बड़े भाषा मॉडल (LLMs) बाहरी स्रोतों से जानकारी खींचते हुए स्वायत्त रूप से अपने अगले कदम की योजना बनाते हैं। स्थिर रिट्रीवल-फिर-रीड पैटर्न के विपरीत, एजेंटिक RAG में LLM के लिए बार-बार कॉल करना शामिल है, जो टूल या फंक्शन कॉल और संरचित आउटपुट के साथ मिश्रित होता है। सिस्टम परिणामों का मूल्यांकन करता है, क्वेरी को परिष्कृत करता है, यदि आवश्यक हो तो अतिरिक्त टूल का उपयोग करता है, और तब तक इस चक्र को जारी रखता है जब तक कि एक संतोषजनक समाधान प्राप्त न हो जाए।
परिचय
इस पाठ में आप सीखेंगे:
- एजेंटिक RAG को समझें: एआई में उभरते दृष्टिकोण के बारे में जानें, जहां बड़े भाषा मॉडल (LLMs) बाहरी डेटा स्रोतों से जानकारी खींचते हुए स्वायत्त रूप से अपने अगले कदम की योजना बनाते हैं।
- इटरेटिव मेकर-चेकर स्टाइल को समझें: LLM के लिए बार-बार कॉल करने के चक्र को समझें, जो टूल या फंक्शन कॉल और संरचित आउटपुट के साथ मिश्रित होता है, जिसे सटीकता सुधारने और गलत क्वेरी को संभालने के लिए डिज़ाइन किया गया है।
- व्यावहारिक अनुप्रयोगों का अन्वेषण करें: उन परिदृश्यों की पहचान करें जहां एजेंटिक RAG उत्कृष्ट प्रदर्शन करता है, जैसे सटीकता-प्रथम वातावरण, जटिल डेटाबेस इंटरैक्शन, और विस्तारित वर्कफ़्लो।
सीखने के लक्ष्य
इस पाठ को पूरा करने के बाद, आप निम्नलिखित को जानेंगे/समझेंगे:
- एजेंटिक RAG को समझना: एआई में उभरते दृष्टिकोण के बारे में जानें, जहां बड़े भाषा मॉडल (LLMs) बाहरी डेटा स्रोतों से जानकारी खींचते हुए स्वायत्त रूप से अपने अगले कदम की योजना बनाते हैं।
- इटरेटिव मेकर-चेकर स्टाइल: LLM के लिए बार-बार कॉल करने के चक्र की अवधारणा को समझें, जो टूल या फंक्शन कॉल और संरचित आउटपुट के साथ मिश्रित होता है, जिसे सटीकता सुधारने और गलत क्वेरी को संभालने के लिए डिज़ाइन किया गया है।
- तर्क प्रक्रिया का स्वामित्व: सिस्टम की इस क्षमता को समझें कि यह अपनी तर्क प्रक्रिया का स्वामित्व लेता है, यह तय करता है कि समस्याओं से कैसे निपटना है, बिना पूर्व-निर्धारित पथों पर निर्भर हुए।
- वर्कफ़्लो: समझें कि एक एजेंटिक मॉडल स्वतंत्र रूप से बाजार प्रवृत्ति रिपोर्ट प्राप्त करने, प्रतिस्पर्धी डेटा की पहचान करने, आंतरिक बिक्री मेट्रिक्स को सहसंबंधित करने, निष्कर्षों को संश्लेषित करने और रणनीति का मूल्यांकन करने का निर्णय कैसे लेता है।
- इटरेटिव लूप्स, टूल इंटीग्रेशन, और मेमोरी: सिस्टम की लूप्ड इंटरैक्शन पैटर्न पर निर्भरता के बारे में जानें, जो दोहराव वाले लूप से बचने और सूचित निर्णय लेने के लिए चरणों में स्थिति और मेमोरी बनाए रखता है।
- विफलता मोड और आत्म-सुधार को संभालना: सिस्टम के मजबूत आत्म-सुधार तंत्र का अन्वेषण करें, जिसमें पुनरावृत्ति और पुनः-क्वेरी करना, डायग्नोस्टिक टूल का उपयोग करना, और मानव निरीक्षण पर वापस जाना शामिल है।
- एजेंसी की सीमाएं: एजेंटिक RAG की सीमाओं को समझें, जो डोमेन-विशिष्ट स्वायत्तता, बुनियादी ढांचे पर निर्भरता, और गार्डरेल्स के प्रति सम्मान पर केंद्रित हैं।
- व्यावहारिक उपयोग के मामले और मूल्य: उन परिदृश्यों की पहचान करें जहां एजेंटिक RAG उत्कृष्ट प्रदर्शन करता है, जैसे सटीकता-प्रथम वातावरण, जटिल डेटाबेस इंटरैक्शन, और विस्तारित वर्कफ़्लो।
- गवर्नेंस, पारदर्शिता, और विश्वास: गवर्नेंस और पारदर्शिता के महत्व के बारे में जानें, जिसमें व्याख्यात्मक तर्क, पूर्वाग्रह नियंत्रण, और मानव निरीक्षण शामिल हैं।
एजेंटिक RAG क्या है?
एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) एक उभरता हुआ एआई दृष्टिकोण है, जिसमें बड़े भाषा मॉडल (LLMs) बाहरी स्रोतों से जानकारी खींचते हुए स्वायत्त रूप से अपने अगले कदम की योजना बनाते हैं। स्थिर रिट्रीवल-फिर-रीड पैटर्न के विपरीत, एजेंटिक RAG में LLM के लिए बार-बार कॉल करना शामिल है, जो टूल या फंक्शन कॉल और संरचित आउटपुट के साथ मिश्रित होता है। सिस्टम परिणामों का मूल्यांकन करता है, क्वेरी को परिष्कृत करता है, यदि आवश्यक हो तो अतिरिक्त टूल का उपयोग करता है, और तब तक इस चक्र को जारी रखता है जब तक कि एक संतोषजनक समाधान प्राप्त न हो जाए।
यह पुनरावृत्त “मेकर-चेकर” शैली सटीकता में सुधार करने, संरचित डेटाबेस (जैसे NL2SQL) के लिए गलत क्वेरी को संभालने, और उच्च-गुणवत्ता वाले परिणाम सुनिश्चित करने के लिए डिज़ाइन की गई है। पारंपरिक RAG कार्यान्वयन पूर्व-निर्धारित पथों पर निर्भर करते हैं, लेकिन एक एजेंटिक सिस्टम स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर चरणों के अनुक्रम को निर्धारित करता है जो इसे मिलती है।
एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) की परिभाषा
एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) एआई विकास में एक उभरता हुआ दृष्टिकोण है, जिसमें LLMs न केवल बाहरी डेटा स्रोतों से जानकारी खींचते हैं, बल्कि स्वायत्त रूप से अपने अगले कदम की योजना भी बनाते हैं। स्थिर रिट्रीवल-फिर-रीड पैटर्न या सावधानीपूर्वक स्क्रिप्टेड प्रॉम्प्ट अनुक्रमों के विपरीत, एजेंटिक RAG में LLM के लिए बार-बार कॉल करना शामिल है, जो टूल या फंक्शन कॉल और संरचित आउटपुट के साथ मिश्रित होता है।
हर चरण में, सिस्टम प्राप्त परिणामों का मूल्यांकन करता है, यह तय करता है कि क्वेरी को परिष्कृत करना है या नहीं, यदि आवश्यक हो तो अतिरिक्त टूल का उपयोग करता है, और तब तक इस चक्र को जारी रखता है जब तक कि एक संतोषजनक समाधान प्राप्त न हो जाए।
यह पुनरावृत्त “मेकर-चेकर” शैली सटीकता में सुधार करने, संरचित डेटाबेस (जैसे NL2SQL) के लिए गलत क्वेरी को संभालने, और उच्च-गुणवत्ता वाले परिणाम सुनिश्चित करने के लिए डिज़ाइन की गई है।

तर्क प्रक्रिया का स्वामित्व
एजेंटिक सिस्टम की सबसे विशिष्ट गुणवत्ता यह है कि यह अपनी तर्क प्रक्रिया का स्वामित्व लेता है। पारंपरिक RAG कार्यान्वयन अक्सर इस बात पर निर्भर करते हैं कि मनुष्य मॉडल के लिए एक पथ को पूर्व-निर्धारित करें: एक चेन-ऑफ-थॉट जो यह बताता है कि क्या और कब पुनः प्राप्त करना है।
लेकिन जब एक सिस्टम वास्तव में एजेंटिक होता है, तो यह आंतरिक रूप से तय करता है कि समस्या से कैसे निपटना है। यह केवल एक स्क्रिप्ट को निष्पादित नहीं कर रहा है; यह स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर चरणों के अनुक्रम को निर्धारित कर रहा है जो इसे मिलती है।
उदाहरण के लिए, यदि इसे एक उत्पाद लॉन्च रणनीति बनाने के लिए कहा जाता है, तो यह केवल एक प्रॉम्प्ट पर निर्भर नहीं करता है जो पूरे शोध और निर्णय लेने के वर्कफ़्लो को स्पष्ट करता है। इसके बजाय, एजेंटिक मॉडल स्वतंत्र रूप से निर्णय लेता है:
- वर्तमान बाजार प्रवृत्ति रिपोर्ट प्राप्त करना (Bing Web Grounding का उपयोग करके)
- प्रासंगिक प्रतिस्पर्धी डेटा की पहचान करना (Azure AI Search का उपयोग करके)
- ऐतिहासिक आंतरिक बिक्री मेट्रिक्स को सहसंबंधित करना (Azure SQL Database का उपयोग करके)
- निष्कर्षों को एक सुसंगत रणनीति में संश्लेषित करना (Azure OpenAI Service के माध्यम से)
- रणनीति में अंतराल या असंगतियों का मूल्यांकन करना, यदि आवश्यक हो तो पुनः प्राप्ति का एक और दौर शुरू करना
ये सभी चरण—क्वेरी को परिष्कृत करना, स्रोतों का चयन करना, उत्तर से “संतुष्ट” होने तक पुनरावृत्ति करना—मॉडल द्वारा तय किए जाते हैं, न कि किसी मनुष्य द्वारा पूर्व-लिखित।
इटरेटिव लूप्स, टूल इंटीग्रेशन, और मेमोरी

एक एजेंटिक सिस्टम एक लूप्ड इंटरैक्शन पैटर्न पर निर्भर करता है:
- प्रारंभिक कॉल: उपयोगकर्ता का लक्ष्य (उर्फ उपयोगकर्ता प्रॉम्प्ट) LLM को प्रस्तुत किया जाता है।
- टूल का उपयोग: यदि मॉडल को जानकारी की कमी या अस्पष्ट निर्देश मिलते हैं, तो यह एक टूल या पुनः प्राप्ति विधि का चयन करता है—जैसे एक वेक्टर डेटाबेस क्वेरी (उदा. Azure AI Search हाइब्रिड सर्च निजी डेटा पर) या एक संरचित SQL कॉल—अधिक संदर्भ प्राप्त करने के लिए।
- मूल्यांकन और परिष्करण: लौटाए गए डेटा की समीक्षा करने के बाद, मॉडल तय करता है कि जानकारी पर्याप्त है या नहीं। यदि नहीं, तो यह क्वेरी को परिष्कृत करता है, एक अलग टूल आज़माता है, या अपने दृष्टिकोण को समायोजित करता है।
- संतुष्ट होने तक दोहराएं: यह चक्र तब तक जारी रहता है जब तक मॉडल यह निर्धारित नहीं कर लेता कि उसके पास एक अंतिम, सुविचारित उत्तर देने के लिए पर्याप्त स्पष्टता और साक्ष्य हैं।
- मेमोरी और स्थिति: क्योंकि सिस्टम चरणों में स्थिति और मेमोरी बनाए रखता है, यह पिछले प्रयासों और उनके परिणामों को याद कर सकता है, दोहराव वाले लूप से बच सकता है, और जैसे-जैसे यह आगे बढ़ता है, अधिक सूचित निर्णय ले सकता है।
समय के साथ, यह एक विकसित समझ की भावना पैदा करता है, जिससे मॉडल को जटिल, बहु-चरणीय कार्यों को नेविगेट करने में सक्षम बनाता है, बिना किसी मनुष्य को लगातार हस्तक्षेप करने या प्रॉम्प्ट को फिर से आकार देने की आवश्यकता के।
विफलता मोड और आत्म-सुधार को संभालना
एजेंटिक RAG की स्वायत्तता में मजबूत आत्म-सुधार तंत्र भी शामिल हैं। जब सिस्टम गतिरोध पर पहुंचता है—जैसे अप्रासंगिक दस्तावेज़ प्राप्त करना या गलत क्वेरी का सामना करना—तो यह:
- पुनरावृत्ति और पुनः-क्वेरी: कम मूल्य वाले उत्तर लौटाने के बजाय, मॉडल नई खोज रणनीतियों का प्रयास करता है, डेटाबेस क्वेरी को फिर से लिखता है, या वैकल्पिक डेटा सेट देखता है।
- डायग्नोस्टिक टूल का उपयोग: सिस्टम अतिरिक्त कार्यों को आमंत्रित कर सकता है जो इसे अपने तर्क चरणों को डिबग करने या पुनः प्राप्त डेटा की शुद्धता की पुष्टि करने में मदद करने के लिए डिज़ाइन किए गए हैं।
- मानव निरीक्षण पर वापस जाना: उच्च-दांव या बार-बार विफल होने वाले परिदृश्यों के लिए, मॉडल अनिश्चितता को चिह्नित कर सकता है और मानव मार्गदर्शन का अनुरोध कर सकता है।

एजेंसी की सीमाएं
हालांकि एक कार्य के भीतर इसकी स्वायत्तता है, एजेंटिक RAG कृत्रिम सामान्य बुद्धिमत्ता के समान नहीं है। इसकी “एजेंटिक” क्षमताएं मानव डेवलपर्स द्वारा प्रदान किए गए टूल, डेटा स्रोतों, और नीतियों तक ही सीमित हैं।
व्यावहारिक उपयोग के मामले और मूल्य
एजेंटिक RAG उन परिदृश्यों में उत्कृष्ट प्रदर्शन करता है जहां पुनरावृत्ति और सटीकता की आवश्यकता होती है:
- सटीकता-प्रथम वातावरण: अनुपालन जांच, नियामक विश्लेषण, या कानूनी शोध में, एजेंटिक मॉडल बार-बार तथ्यों की पुष्टि कर सकता है, कई स्रोतों से परामर्श कर सकता है, और एक पूरी तरह से सत्यापित उत्तर तैयार करने तक क्वेरी को फिर से लिख सकता है।
- जटिल डेटाबेस इंटरैक्शन: संरचित डेटा के साथ काम करते समय, जहां क्वेरी अक्सर विफल हो सकती है या समायोजन की आवश्यकता हो सकती है, सिस्टम स्वायत्त रूप से अपनी क्वेरी को परिष्कृत कर सकता है।
- विस्तारित वर्कफ़्लो: लंबे समय तक चलने वाले सत्रों में, जैसे-जैसे नई जानकारी सामने आती है, एजेंटिक RAG लगातार नए डेटा को शामिल कर सकता है।
गवर्नेंस, पारदर्शिता, और विश्वास
जैसे-जैसे ये सिस्टम अपने तर्क में अधिक स्वायत्त होते जाते हैं, गवर्नेंस और पारदर्शिता महत्वपूर्ण हो जाती है:
- व्याख्यात्मक तर्क: मॉडल एक ऑडिट ट्रेल प्रदान कर सकता है।
- पूर्वाग्रह नियंत्रण और संतुलित पुनः प्राप्ति: डेवलपर्स पुनः प्राप्ति रणनीतियों को ट्यून कर सकते हैं।
- मानव निरीक्षण और अनुपालन: संवेदनशील कार्यों के लिए, मानव समीक्षा आवश्यक बनी रहती है।


निष्कर्ष
एजेंटिक RAG जटिल, डेटा-गहन कार्यों को संभालने में एआई सिस्टम के विकास का एक स्वाभाविक चरण है।
एजेंटिक RAG के बारे में और प्रश्न हैं?
Azure AI Foundry Discord से जुड़ें।
अतिरिक्त संसाधन
-
Azure OpenAI सेवा के साथ Retrieval Augmented Generation (RAG) लागू करें: जानें कि Azure OpenAI सेवा के साथ अपने डेटा का उपयोग कैसे करें। यह Microsoft Learn मॉड्यूल RAG को लागू करने पर एक व्यापक मार्गदर्शिका प्रदान करता है।
शैक्षणिक शोध पत्र
पिछला पाठ
Tool Use Design Pattern
अगला पाठ
Trustworthy AI Agents बनाना
अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।