ai-agents-for-beginners

Agentic RAG

(इस पाठ का वीडियो देखने के लिए ऊपर दिए गए चित्र पर क्लिक करें)

Agentic RAG

यह पाठ Agentic Retrieval-Augmented Generation (Agentic RAG) का एक व्यापक अवलोकन प्रदान करता है, जो एक उभरता हुआ AI मॉडल है जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी स्रोतों से जानकारी प्राप्त करते हैं। स्थैतिक retrieval-then-read पैटर्न के विपरीत, Agentic RAG में LLM को आवृत्त कॉल शामिल हैं, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। सिस्टम परिणामों का मूल्यांकन करता है, प्रश्नों को परिष्कृत करता है, आवश्यकता पड़ने पर अतिरिक्त टूल बुलाता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान नहीं मिल जाता।

परिचय

इस पाठ में निम्नलिखित बातें शामिल होंगी

सीखने के लक्ष्य

इस पाठ को पूरा करने के बाद, आप जानेंगे / समझेंगे:

Agentic RAG क्या है?

Agentic Retrieval-Augmented Generation (Agentic RAG) एक उभरता हुआ AI मॉडल है जहाँ बड़े भाषा मॉडल (LLMs) स्वचालित रूप से अपने अगले कदमों की योजना बनाते हैं जबकि वे बाहरी स्रोतों से जानकारी प्राप्त करते हैं। स्थैतिक retrieval-then-read पैटर्न के विपरीत, Agentic RAG में LLM को आवृत्त कॉल शामिल हैं, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। सिस्टम परिणामों का मूल्यांकन करता है, प्रश्नों को परिष्कृत करता है, आवश्यकता पड़ने पर अतिरिक्त टूल बुलाता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए। यह आवृत्त “maker-checker” शैली शुद्धता को बेहतर बनाती है, त्रुटिपूर्ण प्रश्नों को संभालती है, और उच्च गुणवत्ता वाले परिणाम सुनिश्चित करती है।

सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व रखता है, विफल प्रश्नों को फिर से लिखता है, विभिन्न पुनः प्राप्ति विधियों का चयन करता है, और कई टूल्स को एकीकृत करता है — जैसे Azure AI Search में वेक्टर खोज, SQL डेटाबेस, या कस्टम API — अपने उत्तर को अंतिम रूप देने से पहले। एक एजेंटिक सिस्टम की विशिष्ट विशेषता इसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता है। पारंपरिक RAG कार्यान्वयन पूर्व-निर्धारित मार्गों पर निर्भर करते हैं, लेकिन एक एजेंटिक सिस्टम स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर कदमों की श्रृंखला निर्धारित करता है जो यह पाता है।

Agentic Retrieval-Augmented Generation (Agentic RAG) की परिभाषा

Agentic Retrieval-Augmented Generation (Agentic RAG) AI विकास में एक उभरता हुआ मॉडल है जहाँ LLM केवल बाहरी डेटा स्रोतों से जानकारी प्राप्त नहीं करता बल्कि स्वायत्त रूप से अपने अगले कदमों की योजना भी बनाता है। स्थैतिक retrieval-then-read पैटर्न या सावधानीपूर्वक स्क्रिप्टेड प्रॉम्प्ट अनुक्रमों के विपरीत, Agentic RAG में LLM को आवृत्त कॉल की एक लूप शामिल होती है, जो टूल या फ़ंक्शन कॉल और संरचित आउटपुट के साथ बिंदीदार होती हैं। हर मोड़ पर, सिस्टम प्राप्त परिणामों का मूल्यांकन करता है, यह तय करता है कि क्या अपने प्रश्नों को परिष्कृत करना है, आवश्यकता पड़ने पर अतिरिक्त टूल करता है, और तब तक इस चक्र को जारी रखता है जब तक कि संतोषजनक समाधान प्राप्त न हो जाए।

यह आवृत्त “maker-checker” शैली संचालन को बेहतर बनाने, संरचित डेटाबेस (जैसे NL2SQL) के लिए त्रुटिपूर्ण प्रश्नों को संभालने, और संतुलित, उच्च गुणवत्ता वाले परिणाम सुनिश्चित करने के लिए डिज़ाइन की गई है। केवल सावधानीपूर्वक डिज़ाइन किए गए प्रॉम्प्ट श्रृंखलाओं पर निर्भर रहने के बजाय, सिस्टम सक्रिय रूप से अपनी तर्क प्रक्रिया का स्वामित्व रखता है। यह विफल प्रश्नों को फिर से लिख सकता है, विभिन्न पुनः प्राप्ति विधियां चुन सकता है, और कई टूल्स जैसे Azure AI Search में वेक्टर खोज, SQL डेटाबेस, या कस्टम API एकीकृत कर सकता है — अपने उत्तर को अंतिम रूप देने से पहले। यह अत्यधिक जटिल ऑर्केस्ट्रेशन फ्रेमवर्क की आवश्यकता को समाप्त करता है। इसके बजाय, “LLM कॉल → टूल उपयोग → LLM कॉल → …” का एक अपेक्षाकृत सरल लूप परिष्कृत और अच्छी तरह से आधारित आउटपुट दे सकता है।

Agentic RAG Core Loop

तर्क प्रक्रिया का स्वामित्व लेना

जिस गुण ने एक सिस्टम को “agentic” बना दिया है वह है उसकी तर्क प्रक्रिया का स्वामित्व लेने की क्षमता। पारंपरिक RAG कार्यान्वयन अक्सर मॉडल के लिए एक मार्ग मानवीय रूप से पूर्व निर्धारित करते हैं: एक chain-of-thought जो यह बताती है कि क्या प्राप्त करना है और कब। लेकिन जब एक सिस्टम वास्तव में agentic होता है, तो वह आंतरिक रूप से तय करता है कि समस्या को कैसे सुलझाना है। यह केवल एक स्क्रिप्ट निष्पादित नहीं कर रहा होता; यह स्वायत्त रूप से उस जानकारी की गुणवत्ता के आधार पर कदमों की श्रृंखला निर्धारित करता है जो वह पाता है। उदाहरण के लिए, यदि इसे एक उत्पाद लॉन्च रणनीति बनाने के लिए कहा जाता है, तो यह पूरी रिसर्च और निर्णय प्रक्रिया को स्पेल आउट करने वाले प्रॉम्प्ट पर केवल निर्भर नहीं करता। इसके बजाय, एजेंटिक मॉडल स्वतंत्र रूप से निर्णय लेता है कि:

  1. Bing Web Grounding का उपयोग करके वर्तमान बाज़ार रुझान रिपोर्ट प्राप्त करें
  2. Azure AI Search का उपयोग करके प्रासंगिक प्रतिस्पर्धी डेटा की पहचान करें।
  3. Azure SQL Database का उपयोग करके ऐतिहासिक आंतरिक बिक्री मेट्रिक्स का सहसंबंध करें।
  4. Azure OpenAI Service के माध्यम से निष्कर्षों को एक समन्वित रणनीति में संकलित करें।
  5. रणनीति का ऐसे अंतराल या असंगतियों के लिए मूल्यांकन करें, यदि आवश्यक हो तो पुनः प्राप्ति के लिए एक और दौर को प्रेरित करें। ये सभी कदम—प्रश्नों को परिष्कृत करना, स्रोत चुनना, जब तक उत्तर से “संतुष्ट” न हो तब तक आवृत्ति करना—मॉडल द्वारा तय किए जाते हैं, न कि किसी मानव द्वारा पूर्व-निर्धारित स्क्रिप्ट के तहत।

आवृत्त लूप, टूल एकीकरण, और मेमोरी

Tool Integration Architecture

एक एजेंटिक सिस्टम एक आवृत्त इंटरैक्शन पैटर्न पर निर्भर करता है:

समय के साथ, यह विकसित होती समझ की भावना पैदा करता है, जिससे मॉडल जटिल, बहु-चरणीय कार्यों को बिना किसी मानवीय हस्तक्षेप या प्रॉम्प्ट को बार-बार पुन:निर्मित किए नेविगेट कर सकता है।

विफलता के तरीके संभालना और स्व-सुधार

Agentic RAG की स्वायत्तता सशक्त स्व-सुधार तंत्र भी शामिल करती है। जब सिस्टम गुमराह करता है—जैसे अप्रासंगिक दस्तावेज़ पुनः प्राप्त करना या त्रुटिपूर्ण प्रश्नों का सामना करना—तो यह कर सकता है:

यह आवृत्त और गतिशील दृष्टिकोण मॉडल को लगातार सुधार करने की अनुमति देता है, यह सुनिश्चित करता है कि यह केवल एक-बार उपयोग की प्रणाली न हो बल्कि एक ऐसी प्रणाली हो जो एक सत्र के दौरान अपनी गलतियों से सीखती रहे।

Self Correction Mechanism

एजेंसी की सीमाएँ

हालांकि यह एक कार्य के भीतर स्वायत्त है, Agentic RAG कृत्रिम सामान्य बुद्धिमत्ता के समान नहीं है। इसकी “agentic” क्षमताएँ टूल, डेटा स्रोत, और मानव डेवलपर्स द्वारा प्रदान की गई नीतियों तक सीमित हैं। यह अपने टूल्स को आविष्कार नहीं कर सकता या उन डोमेन सीमाओं से बाहर कदम नहीं रख सकता जो सेट की गई हैं। बल्कि, यह उपलब्ध संसाधनों को गतिशील रूप से व्यवस्थित करने में माहिर है। अधिक उन्नत AI रूपों से मुख्य अंतर शामिल हैं:

  1. डोमेन-विशिष्ट स्वायत्तता: Agentic RAG सिस्टम उपयोगकर्ता द्वारा परिभाषित लक्ष्यों को ज्ञात डोमेन के भीतर प्राप्त करने पर केंद्रित होते हैं, परिणामों में सुधार के लिए प्रश्न पुनर्लेखन या टूल चयन जैसी रणनीतियों का उपयोग करते हैं।
  2. संसाधन-निर्भर: सिस्टम की क्षमताएँ डेवलपर्स द्वारा एकीकृत किए गए टूल्स और डेटा पर निर्भर हैं। यह मानवीय हस्तक्षेप के बिना इन सीमाओं को पार नहीं कर सकता।
  3. सेफ्टी गार्डरेल का सम्मान: नैतिक दिशानिर्देश, अनुपालन नियम, और व्यावसायिक नीतियाँ बहुत महत्वपूर्ण बनी रहती हैं। एजेंट की स्वतंत्रता हमेशा सुरक्षा उपायों और पर्यवेक्षण तंत्रों (आशा है) द्वारा प्रतिबंधित होती है।

व्यावहारिक उपयोग के मामले और मूल्य

Agentic RAG उन परिदृश्यों में उत्कृष्ट है जहाँ आवृत्त परिष्करण और सटीकता आवश्यक है:

  1. Correctness-First वातावरण: अनुपालन जांच, विनियामक विश्लेषण, या कानूनी शोध में, एजेंटिक मॉडल कई बार तथ्यों की पुष्टि कर सकता है, अनेक स्रोतों से परामर्श कर सकता है, और तब तक प्रश्नों को फिर से लिख सकता है जब तक वह पूरी तरह से जांचा गया उत्तर प्राप्त न कर ले।
  2. जटिल डेटाबेस इंटरैक्शन: जब संरचित डेटा से निपटना होता है जहाँ प्रश्न अक्सर विफल हो सकते हैं या समायोजन की आवश्यकता होती है, सिस्टम स्वतंत्र रूप से Azure SQL या Microsoft Fabric OneLake का उपयोग करते हुए अपने प्रश्नों को परिष्कृत कर सकता है, यह सुनिश्चित करते हुए कि अंतिम पुनः प्राप्ति उपयोगकर्ता के इरादे के अनुसार है।
  3. विस्तारित वर्कफ़्लोज़: लंबी चलने वाली सत्र नई जानकारी प्रकट होने के साथ विकसित हो सकती हैं। Agentic RAG लगातार नए डेटा को सम्मिलित कर सकता है, और समस्या क्षेत्र के बारे में अधिक जानने के साथ रणनीतियों को परिवर्तित कर सकता है।

संचालन, पारदर्शिता, और विश्वास

जैसे-जैसे ये सिस्टम अपनी तर्क प्रक्रिया में अधिक स्वायत्त हो जाते हैं, शासन और पारदर्शिता महत्वपूर्ण हो जाते हैं:

ऐसे टूल होना आवश्यक है जो कार्रवाइयों का स्पष्ट रिकॉर्ड प्रदान करें। इनके बिना, एक बहु-चरणीय प्रक्रिया का डिबग करना बहुत कठिन हो सकता है। नीचे Literal AI (जो Chainlit के पीछे कंपनी है) से Agent रन का एक उदाहरण देखें:

AgentRunExample

निष्कर्ष

Agentic RAG जटिल, डेटा-गहन कार्यों को संभालने में AI सिस्टम के प्राकृतिक विकास का प्रतिनिधित्व करता है। एक आवृत्त इंटरैक्शन पैटर्न अपनाकर, स्वायत्त रूप से टूल का चयन करके, और उच्च गुणवत्ता वाले परिणाम प्राप्त होने तक प्रश्नों को परिष्कृत करके, सिस्टम स्थैतिक प्रॉम्प्ट-अनुकरण से आगे बढ़कर अधिक अनुकूल, संदर्भ-सचेत निर्णय निर्माता बन जाता है। जबकि यह अभी भी मानवीय रूप से परिभाषित बुनियादी ढांचे और नैतिक दिशानिर्देशों द्वारा सीमित है, ये एजेंटिक क्षमताएँ उद्यमों और अंतिम उपयोगकर्ताओं दोनों के लिए अधिक समृद्ध, अधिक गतिशील, और अंततः अधिक उपयोगी AI इंटरैक्शन सक्षम करती हैं।

Agentic RAG के बारे में और प्रश्न हैं?

Microsoft Foundry Discord में शामिल हों अन्य शिक्षार्थियों से मिलने, कार्यालय समय में भाग लेने और अपने AI एजेंट्स के सवालों के उत्तर पाने के लिए।

अतिरिक्त संसाधन

शैक्षणिक पेपर

पिछला पाठ

Tool Use Design Pattern

अगला पाठ

विश्वसनीय AI एजेंट्स का निर्माण


अस्वीकरण:
इस दस्तावेज़ का अनुवाद AI अनुवाद सेवा Co-op Translator का उपयोग करके किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या असंगतियाँ हो सकती हैं। मूल दस्तावेज़ अपनी मूल भाषा में ही प्राधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से हुए किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।