ai-agents-for-beginners

एजेंटिक RAG

(इस पाठ का वीडियो देखने के लिए ऊपर दी गई छवि पर क्लिक करें)

एजेंटिक RAG

यह पाठ एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) का व्यापक परिचय प्रदान करता है, जो एक उभरता हुआ AI पैटर्न है जिसमें बड़े भाषा मॉडल (LLMs) बाहरी स्रोतों से जानकारी प्राप्त करते हुए स्वायत्त रूप से अपने अगले कदमों की योजना बनाते हैं। स्थिर रिट्रीवल-फिर-पढ़ने वाले पैटर्न के विपरीत, एजेंटिक RAG में LLM के लिए बार-बार कॉल करना शामिल है, जिसमें टूल या फंक्शन कॉल और संरचित आउटपुट शामिल होते हैं। सिस्टम परिणामों का मूल्यांकन करता है, क्वेरी को परिष्कृत करता है, आवश्यक होने पर अतिरिक्त टूल का उपयोग करता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए।

परिचय

इस पाठ में शामिल हैं:

सीखने के लक्ष्य

इस पाठ को पूरा करने के बाद, आप जानेंगे/समझेंगे:

एजेंटिक RAG क्या है?

एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) एक उभरता हुआ AI पैटर्न है जिसमें बड़े भाषा मॉडल (LLMs) बाहरी स्रोतों से जानकारी प्राप्त करते हुए स्वायत्त रूप से अपने अगले कदमों की योजना बनाते हैं। स्थिर रिट्रीवल-फिर-पढ़ने वाले पैटर्न के विपरीत, एजेंटिक RAG में LLM के लिए बार-बार कॉल करना शामिल है, जिसमें टूल या फंक्शन कॉल और संरचित आउटपुट शामिल होते हैं। सिस्टम परिणामों का मूल्यांकन करता है, क्वेरी को परिष्कृत करता है, आवश्यक होने पर अतिरिक्त टूल का उपयोग करता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए। यह पुनरावृत्त “मेकर-चेकर्स” शैली सहीता में सुधार करती है, खराब क्वेरी को संभालती है, और उच्च-गुणवत्ता वाले परिणाम सुनिश्चित करती है।

सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व लेता है, असफल क्वेरी को फिर से लिखता है, विभिन्न रिट्रीवल विधियों का चयन करता है, और कई टूल को एकीकृत करता है—जैसे कि Azure AI Search में वेक्टर सर्च, SQL डेटाबेस, या कस्टम APIs—अपने उत्तर को अंतिम रूप देने से पहले। एक एजेंटिक सिस्टम की विशिष्ट गुणवत्ता इसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता है। पारंपरिक RAG कार्यान्वयन पूर्व-निर्धारित मार्गों पर निर्भर करते हैं, लेकिन एक एजेंटिक सिस्टम स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर चरणों का अनुक्रम निर्धारित करता है जो इसे मिलती है।

एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) को परिभाषित करना

एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (Agentic RAG) AI विकास में एक उभरता हुआ पैटर्न है जिसमें LLMs न केवल बाहरी डेटा स्रोतों से जानकारी प्राप्त करते हैं बल्कि स्वायत्त रूप से अपने अगले कदमों की योजना भी बनाते हैं। स्थिर रिट्रीवल-फिर-पढ़ने वाले पैटर्न या सावधानीपूर्वक स्क्रिप्टेड प्रॉम्प्ट अनुक्रमों के विपरीत, एजेंटिक RAG में LLM के लिए पुनरावृत्त कॉल का एक लूप शामिल होता है, जिसमें टूल या फंक्शन कॉल और संरचित आउटपुट शामिल होते हैं। हर मोड़ पर, सिस्टम प्राप्त परिणामों का मूल्यांकन करता है, यह तय करता है कि क्या क्वेरी को परिष्कृत करना है, आवश्यक होने पर अतिरिक्त टूल का उपयोग करता है, और इस चक्र को तब तक जारी रखता है जब तक कि यह एक संतोषजनक समाधान प्राप्त न कर ले।

यह पुनरावृत्त “मेकर-चेकर्स” शैली संचालन की सहीता में सुधार करने, संरचित डेटाबेस (जैसे NL2SQL) के लिए खराब क्वेरी को संभालने, और संतुलित, उच्च-गुणवत्ता वाले परिणाम सुनिश्चित करने के लिए डिज़ाइन की गई है। सावधानीपूर्वक इंजीनियर प्रॉम्प्ट चेन पर पूरी तरह से निर्भर होने के बजाय, सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व लेता है। यह असफल क्वेरी को फिर से लिख सकता है, विभिन्न रिट्रीवल विधियों का चयन कर सकता है, और कई टूल को एकीकृत कर सकता है—जैसे कि Azure AI Search में वेक्टर सर्च, SQL डेटाबेस, या कस्टम APIs—अपने उत्तर को अंतिम रूप देने से पहले। इससे अत्यधिक जटिल ऑर्केस्ट्रेशन फ्रेमवर्क की आवश्यकता समाप्त हो जाती है। इसके बजाय, “LLM कॉल → टूल उपयोग → LLM कॉल → …” का एक अपेक्षाकृत सरल लूप परिष्कृत और अच्छी तरह से आधारित आउटपुट प्रदान कर सकता है।

एजेंटिक RAG कोर लूप

तर्क प्रक्रिया का स्वामित्व लेना

जो गुणवत्ता एक सिस्टम को “एजेंटिक” बनाती है, वह इसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता है। पारंपरिक RAG कार्यान्वयन अक्सर मॉडल के लिए एक पूर्व-निर्धारित मार्ग पर निर्भर करते हैं: एक विचार श्रृंखला जो यह बताती है कि क्या प्राप्त करना है और कब। लेकिन जब एक सिस्टम वास्तव में एजेंटिक होता है, तो यह आंतरिक रूप से तय करता है कि समस्या से कैसे निपटना है। यह केवल एक स्क्रिप्ट को निष्पादित नहीं कर रहा है; यह स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर चरणों का अनुक्रम निर्धारित कर रहा है जो इसे मिलती है। उदाहरण के लिए, यदि इसे एक उत्पाद लॉन्च रणनीति बनाने के लिए कहा जाता है, तो यह केवल एक प्रॉम्प्ट पर निर्भर नहीं करता है जो पूरे शोध और निर्णय लेने के वर्कफ़्लो को स्पष्ट करता है। इसके बजाय, एजेंटिक मॉडल स्वतंत्र रूप से निर्णय लेता है:

  1. Bing Web Grounding का उपयोग करके वर्तमान बाजार प्रवृत्ति रिपोर्ट प्राप्त करें।
  2. Azure AI Search का उपयोग करके प्रासंगिक प्रतिस्पर्धी डेटा की पहचान करें।
  3. Azure SQL Database का उपयोग करके ऐतिहासिक आंतरिक बिक्री मेट्रिक्स को सहसंबंधित करें।
  4. Azure OpenAI Service के माध्यम से समन्वित एक सुसंगत रणनीति में निष्कर्षों को संश्लेषित करें।
  5. रणनीति में अंतराल या असंगतियों का मूल्यांकन करें, यदि आवश्यक हो तो पुनः प्राप्ति का एक और दौर शुरू करें। इन सभी चरणों—क्वेरी को परिष्कृत करना, स्रोतों का चयन करना, उत्तर से “संतुष्ट” होने तक पुनरावृत्ति करना—मॉडल द्वारा तय किए जाते हैं, न कि किसी मानव द्वारा पूर्व-स्क्रिप्टेड।

पुनरावृत्त लूप्स, टूल इंटीग्रेशन, और मेमोरी

टूल इंटीग्रेशन आर्किटेक्चर

एक एजेंटिक सिस्टम एक लूप्ड इंटरैक्शन पैटर्न पर निर्भर करता है:

समय के साथ, यह एक विकसित समझ की भावना पैदा करता है, जिससे मॉडल जटिल, बहु-चरणीय कार्यों को नेविगेट कर सकता है, बिना किसी मानव के लगातार हस्तक्षेप या प्रॉम्प्ट को फिर से आकार देने की आवश्यकता के।

विफलता मोड और आत्म-सुधार को संभालना

एजेंटिक RAG की स्वायत्तता में मजबूत आत्म-सुधार तंत्र भी शामिल हैं। जब सिस्टम मृत अंत पर पहुंचता है—जैसे कि अप्रासंगिक दस्तावेज़ प्राप्त करना या खराब क्वेरी का सामना करना—तो यह कर सकता है:

यह पुनरावृत्त और गतिशील दृष्टिकोण मॉडल को लगातार सुधारने की अनुमति देता है, यह सुनिश्चित करता है कि यह केवल एक बार का सिस्टम नहीं है बल्कि एक ऐसा सिस्टम है जो एक दिए गए सत्र के दौरान अपनी गलतियों से सीखता है।

आत्म-सुधार तंत्र

एजेंसी की सीमाएं

एक कार्य के भीतर इसकी स्वायत्तता के बावजूद, एजेंटिक RAG कृत्रिम सामान्य बुद्धिमत्ता के समान नहीं है। इसकी “एजेंटिक” क्षमताएं मानव डेवलपर्स द्वारा प्रदान किए गए टूल, डेटा स्रोतों, और नीतियों तक सीमित हैं। यह अपने स्वयं के टूल का आविष्कार नहीं कर सकता या उन डोमेन सीमाओं से बाहर नहीं जा सकता जो सेट की गई हैं। बल्कि, यह हाथ में उपलब्ध संसाधनों को गतिशील रूप से व्यवस्थित करने में उत्कृष्टता प्राप्त करता है। अधिक उन्नत AI रूपों से प्रमुख अंतर में शामिल हैं:

  1. डोमेन-विशिष्ट स्वायत्तता: एजेंटिक RAG सिस्टम ज्ञात डोमेन के भीतर उपयोगकर्ता-परिभाषित लक्ष्यों को प्राप्त करने पर केंद्रित हैं, जैसे कि क्वेरी को फिर से लिखना या टूल चयन का उपयोग करके परिणामों में सुधार करना।
  2. बुनियादी ढांचे पर निर्भर: सिस्टम की क्षमताएं डेवलपर्स द्वारा एकीकृत टूल और डेटा पर निर्भर करती हैं। यह मानव हस्तक्षेप के बिना इन सीमाओं को पार नहीं कर सकता।
  3. गार्डरेल्स का सम्मान: नैतिक दिशानिर्देश, अनुपालन नियम, और व्यावसायिक नीतियां बहुत महत्वपूर्ण बनी रहती हैं। एजेंट की स्वतंत्रता हमेशा सुरक्षा उपायों और निरीक्षण तंत्र द्वारा सीमित होती है (उम्मीद है?)

व्यावहारिक उपयोग के मामले और मूल्य

एजेंटिक RAG उन परिदृश्यों में उत्कृष्ट प्रदर्शन करता है जिनमें पुनरावृत्ति परिष्करण और सटीकता की आवश्यकता होती है:

  1. सहीता-प्रथम वातावरण: अनुपालन जांच, नियामक विश्लेषण, या कानूनी शोध में, एजेंटिक मॉडल बार-बार तथ्यों की पुष्टि कर सकता है, कई स्रोतों से परामर्श कर सकता है, और एक पूरी तरह से सत्यापित उत्तर उत्पन्न करने तक क्वेरी को फिर से लिख सकता है।
  2. जटिल डेटाबेस इंटरैक्शन: संरचित डेटा से निपटने के दौरान जहां क्वेरी अक्सर विफल हो सकती है या समायोजन की आवश्यकता हो सकती है, सिस्टम Azure SQL या Microsoft Fabric OneLake का उपयोग करके अपनी क्वेरी को स्वायत्त रूप से परिष्कृत कर सकता है, यह सुनिश्चित करते हुए कि अंतिम रिट्रीवल उपयोगकर्ता के इरादे के साथ मेल खाता है।
  3. विस्तारित वर्कफ़्लो: लंबे समय तक चलने वाले सत्र नए जानकारी के उभरने के साथ विकसित हो सकते हैं। एजेंटिक RAG लगातार नए डेटा को शामिल कर सकता है, समस्या क्षेत्र के बारे में अधिक जानने के साथ रणनीतियों को बदल सकता है।

गवर्नेंस, पारदर्शिता, और विश्वास

जैसे-जैसे ये सिस्टम अपनी तर्क प्रक्रिया में अधिक स्वायत्त होते जाते हैं, गवर्नेंस और पारदर्शिता महत्वपूर्ण हैं:

ऐसे टूल का होना जो क्रिय

शैक्षणिक शोध पत्र

पिछला पाठ

टूल उपयोग डिज़ाइन पैटर्न

अगला पाठ

विश्वसनीय AI एजेंट्स बनाना


अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।