ai-agents-for-beginners

एजेन्टिक RAG

(या धड्याचा व्हिडिओ पाहण्यासाठी वरील प्रतिमा क्लिक करा)

एजेन्टिक RAG

हा धडा Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) याबद्दल सखोल आढावा देतो — एक उदयोन्मुख AI पॅराडाइम जिथे मोठी भाषा मॉडेल्स (LLMs) स्वतः त्यांच्या पुढील पावले नियोजन करतात आणि बाह्य स्रोतांमधून माहिती आकृष्ट करतात. स्थिर retrieval-then-read पॅटर्नशी भिन्न, एजेन्टिक RAG मध्ये LLM ची पुनरावर्ती कॉल्स, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असतो. सिस्टीम निकालांचे मूल्यांकन करते, क्वेरीज सुधारते, जर आवश्यक असेल तर अतिरिक्त टूल्स कॉल करते आणि समाधानकारक समाधान मिळेपर्यंत हा चक्र चालू ठेवते.

परिचय

हा धडा खालील गोष्टी कव्हर करेल

शिकण्याचे उद्दिष्ट

हा धडा पूर्ण केल्यानंतर, तुम्हाला हे माहित असेल/समजेल:

एजेन्टिक RAG म्हणजे काय?

Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) ही एक उदयोन्मुख AI पॅराडाइम आहे जिथे मोठी भाषा मॉडेल्स (LLMs) स्वतः पुढील पावले नियोजन करतात आणि बाह्य स्रोतांमधून माहिती आकृष्ट करतात. स्थिर retrieval-then-read पॅटर्नशी भिन्न, एजेन्टिक RAG मध्ये LLM ची पुनरावर्ती कॉल्स, टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुट यांचा समावेश असतो. सिस्टीम मिळालेल्या निकालांचे मूल्यांकन करते, क्वेरीज सुधारते, गरज भासल्यास अतिरिक्त टूल्स कॉल करते आणि समाधानकारक उत्तर मिळेपर्यंत हा चक्र चालू ठेवते. या पुनरावर्ती “मेकर-चेकर” शैलीमुळे अचूकता सुधारते, malformed क्वेरीज हाताळता येतात आणि उच्च-गुणवत्तेचे निकाल सुनिश्चित होतात.

सिस्टीम सक्रियपणे तिच्या तर्कसंगती प्रक्रियेवर स्वामित्व ठेवते — अपयशी क्वेरीज पुन्हा लिहिते, वेगवेगळ्या पुनर्प्राप्ती पद्धती निवडते, आणि Azure AI Search मधील वेक्टर शोध, SQL डेटाबेस किंवा कस्टम APIs सारख्या अनेक टूल्स एकत्र करणे यांचा समावेश करते — उत्तर अंतिम करण्यापूर्वी. एजेन्टिक सिस्टीमचे वेगळेपणा म्हणजे तिची स्वतःच्या तर्कसंगती प्रक्रियेवर स्वामित्व घेण्याची क्षमता. पारंपरिक RAG अंमलबजावण्या पूर्व-निर्धारित मार्गांवर अवलंबून असतात, परंतु एजेन्टिक सिस्टीम स्वतः सापडलेल्या माहितीच्या गुणवत्तेनुसार पावले ठरवते.

एजेन्टिक Retrieval-Augmented Generation (एजेन्टिक RAG) ची व्याख्या

Agentic Retrieval-Augmented Generation (एजेन्टिक RAG) ही AI विकासातील एक उदयोन्मुख पद्धत आहे जिथे LLMs फक्त बाह्य डेटा स्रोतांमधून माहिती खेचत नाहीत तर स्वतः पुढील पावलेही नियोजित करतात. स्थिर retrieval-then-read पॅटर्न किंवा काळजीपूर्वक स्क्रिप्ट केलेल्या प्रॉम्प्ट स्रेन्ल्सपेक्षा वेगळे, एजेन्टिक RAG मध्ये LLM कडे पुनरावर्ती कॉल्सचा लूप असतो, ज्यामध्ये टूल किंवा फंक्शन कॉल्स आणि संरचित आउटपुटचा समावेश असतो. प्रत्येक टप्प्यावर सिस्टीम मिळालेल्या निकालांचे मूल्यांकन करते, क्वेरीज सुधाराव्या का हे ठरवते, गरज भासल्यास अतिरिक्त टूल्स कॉल करते आणि समाधानकारक तोडगा मिळेपर्यंत हा चक्र चालू ठेवते.

ही पुनरावर्ती “मेकर-चेकर” ऑपरेशन शैली अचूकता सुधारण्यासाठी, संरचित डेटाबेससाठी malformed क्वेरीज (उदा. NL2SQL) हाताळण्यासाठी आणि संतुलित, उच्च-गुणवत्तेचे निकाल सुनिश्चित करण्यासाठी डिझाइन केलेली आहे. फक्त काळजीपूर्वक इंजिनिअर केलेल्या प्रॉम्प्ट चेनवर अवलंबून राहण्याऐवजी, सिस्टीम सक्रियपणे तिच्या तर्कसंगती प्रक्रियेवर स्वामित्व ठेवते. हे अपयशी ठरणाऱ्या क्वेरीज पुन्हा लिहू शकते, वेगवेगळ्या पुनर्प्राप्ती पद्धती निवडू शकते, आणि Azure AI Search मधील वेक्टर शोध, SQL डेटाबेस, किंवा कस्टम APIs सारखे अनेक टूल्स एकत्र करू शकते — उत्तर अंतिम करण्यापूर्वी. त्यामुळे अत्यंत जटिल ऑर्केस्ट्रेशन फ्रेमवर्कची आवश्यकता नाहीशी होते. त्याऐवजी, “LLM call → tool use → LLM call → …” असा तुलनेने सोपा लूप देखील परिष्कृत आणि चांगल्या आधारावर आधारित आउटपुट देऊ शकतो.

एजेन्टिक RAG मुख्य लूप

तर्कसंगती प्रक्रियेवर स्वामित्व

एखादी सिस्टीम “एजेन्टिक” बनवणारी वेगळ्या ओळख म्हणजे तिची तर्कसंगती प्रक्रियेवर स्वामित्व घेण्याची क्षमता. पारंपरिक RAG अंमलबजावण्या बहुतेक वेळा मॉडेलसाठी मानवीकडून आधीच मार्ग ठरवण्यावर अवलंबून असतात: काय पुनर्प्राप्त करायचे आणि कधी ते साखळी-आउटलाइन करणार्‍या chain-of-thought द्वारे दाखवले जाते. पण जेव्हा एखादी सिस्टीम खरोखरच एजेन्टिक असते, ती समस्या कशी हाताळायची हे आंतरिकपणे ठरवते. ती फक्त स्क्रिप्ट चालवत नसते; ती स्वतःच्या विवेकानुसार मिळालेल्या माहितीच्या गुणवत्तेनुसार पावले ठरवते. उदाहरणार्थ, जर त्याला उत्पादन लॉन्च रणनीती तयार करण्यास सांगितले तर तो संपूर्ण संशोधन आणि निर्णय-प्रक्रियेची कार्यप्रणाली स्पेलआउट करणाऱ्या प्रॉम्प्टवर पूर्णपणे अवलंबून राहणार नाही. त्याऐवजी, एजेन्टिक मॉडेल स्वतंत्रपणे खालील गोष्टी ठरवू शकते:

  1. Bing Web Grounding वापरून सध्याच्या बाजार ट्रेंड रिपोर्ट्स प्राप्त करा
  2. Azure AI Search वापरून संबंधित स्पर्धक डेटा ओळखा.
  3. Azure SQL Database वापरून ऐतिहासिक अंतर्गत विक्री मीट्रिक्सचे समन्वय करा.
  4. Azure OpenAI Service द्वारे समन्वित धोरणात निष्कर्षांचे संश्लेषण करा.
  5. रणनीतीतील अंतर किंवा विसंगतींसाठी मूल्यमापन करा, जर आवश्यक असेल तर आणखी एक पुनर्प्राप्ती फेरी सुरू करा. या सर्व टप्प्यां — क्वेरीज सुधारणा करणे, स्रोत निवडणे, उत्तराबद्दल “संतुष्ट” होईपर्यंत पुनरावृत्ती करणे — हे मानवाने पूर्व-स्क्रिप्ट केलेले नसून मॉडेलद्वारे ठरवले जातात.

पुनरावर्ती लूप्स, टूल एकत्रीकरण, आणि मेमरी

टूल समाकलन आर्किटेक्चर

एजेन्टिक सिस्टीम लूप्ड इंटरऍक्शन पॅटर्नवर अवलंबून असते:

कालांतराने, हे विकसित होत जाणारे समजण्याचे भाव निर्माण करते, जे मॉडेलला जटिल, बहु-टप्प्यांच्या कामांना मानवाने सतत हस्तक्षेप न करता किंवा प्रॉम्प्ट पुन्हा तयार न करता सहज मार्गदर्शन करण्यास सक्षम करते.

अपयश मोड्स आणि स्वयं-शुध्दीकरण हाताळणे

एजेन्टिक RAG ची स्वायत्तता मजबूत स्वयं-शुध्दीकरण यंत्रणाही समाविष्ट करते. जेव्हा सिस्टीम अडचणीत येते — उदा. अप्रासंगिक दस्तऐवज प्राप्त करणे किंवा malformed क्वेरीजचा सामना करणे — तेव्हा ती:

हा पुनरावर्ती आणि गतीशील दृष्टिकोन मॉडेलला सतत सुधारण्यास परवानगी देतो, ज्यामुळे हे एक-शॉट सिस्टीम नाही तर दिलेल्या सत्रादरम्यान आपल्या चुकांमधून शिकणारी प्रणाली ठरते.

स्व-दुरुस्ती यंत्रणा

एजन्सीची सीमा

टास्कच्या आत असलेल्या स्वायत्ततेनंतरही, Agentic RAG हे Artificial General Intelligence शी समतुल्य नाही. त्याच्या “एजेन्टिक” क्षमताः मानव विकासकांनी प्रदान केलेल्या टूल्स, डेटा स्रोत आणि धोरणांपुरते मर्यादित असतात. ते स्वतःचे टूल्स शोधून काढू किंवा सेट केलेल्या डोमेन मर्यादेबाहेर जाऊ शकत नाही. त्याऐवजी, ते हातात असलेल्या संसाधनांचे डायनामिक ऑर्केस्ट्रेशन चांगल्या प्रकारे करते. अधिक प्रगत AI स्वरूपांपासूनचे मुख्य भेद:

  1. डोमेन-विशिष्ट स्वायत्तता: एजेन्टिक RAG सिस्टीम वापरकर्ता-परिभाषित उद्दिष्टे ज्ञात डोमेनमध्ये साध्य करण्यावर केंद्रित असतात, आणि परिणाम सुधारण्यासाठी क्वेरी री-राइटिंग किंवा टूल निवडण्यासारख्या धोरणांचा अवलंब करतात.
  2. इन्फ्रास्ट्रक्चर-आधारित: सिस्टीमच्या क्षमतांचा आधार विकासकांनी एकत्र केलेल्या टूल्स आणि डेटावर असतो. मानवाच्या हस्तक्षेपाशिवाय ती या मर्यादांना ओलांडू शकत नाही.
  3. गार्डरेल्सचा आदर: नैतिक मार्गदर्शक तत्त्वे, अनुपालन नियम आणि व्यवसाय धोरणे महत्त्वाचीच राहतात. एजंटची स्वातंत्र्य नेहमी सुरक्षा उपाय आणि देखरेख यांच्या मर्यादांनी नियंत्रित असते (आशेने).

व्यावहारिक उपयोग प्रकरणे आणि मूल्य

एजेन्टिक RAG पुनरावर्ती सुधारणा आणि अचूकता आवश्यक असलेल्या परिस्थितींमध्ये उत्कृष्ट ठरतो:

  1. अचूकता-प्राधान्य वातावरणे: अनुपालन तपासणी, नियामक विश्लेषण किंवा कायदेशीर संशोधनात, एजेन्टिक मॉडेल तथ्ये वारंवार पडताळू शकते, अनेक स्रोतांचा संदर्भ घेऊ शकते आणि पुन्हा क्वेरी करून पूर्णपणे तपासलेले उत्तर तयार करू शकते.
  2. कठीण डेटाबेस इंटरऍक्शन्स: ज्याठिकाणी संरचित डेटाबरोबर काम करताना क्वेरीज बर्‍याचदा अयशस्वी होऊ शकतात किंवा समायोजित करण्याची गरज असते, तेव्हा सिस्टीम Azure SQL किंवा Microsoft Fabric OneLake वापरून स्वायत्तपणे आपली क्वेरी सुधारू शकते, ज्यामुळे अंतिम पुनर्प्राप्ती वापरकर्त्याच्या हेतूस अनुरूप होते.
  3. विस्तारित वर्कफ्लो: दीर्घकालीन सत्र नवीन माहिती समोर आल्यावर विकसित होऊ शकतात. एजेन्टिक RAG सतत नवीन डेटा समाविष्ट करू शकते आणि समस्येच्या क्षेत्राबद्दल अधिक जाणून घेतल्यानंतर धोरणे बदलू शकते.

शासन, पारदर्शकता आणि विश्वास

जसे हे सिस्टीम त्यांच्या तर्कसंगतीत अधिक स्वायत्त होत आहेत, तसे शासन आणि पारदर्शकता अत्यावश्यक ठरतात:

कायम असणारी नोंद ठेवणारी टूल्स असणे आवश्यक आहे. त्याशिवाय, बहु-टप्प्याच्या प्रक्रियेचे डीबग करणे फार कठीण होऊ शकते. Literal AI (company behind Chainlit) कडून खालील Agent run उदाहरण पहा:

Agent रन उदाहरण

निष्कर्ष

एजेन्टिक RAG हा AI सिस्टीम ज्या प्रकारे जटिल, डेटा-गहन कामे हाताळतात त्या मार्गातील नैसर्गिक विकासाचे प्रतिनिधित्व करतो. लूप्ड इंटरऍक्शन पॅटर्न अवलंबणे, स्वायत्तपणे टूल्स निवडणे, आणि उच्च-गुणवत्तेचा निकाल मिळेपर्यंत क्वेरीज सुधारत राहणे यामुळे सिस्टीम स्थिर प्रॉम्प्ट-फॉलोइंग पलीकडे जाऊन अधिक अनुकूलित, संदर्भ-जन्य निर्णय-कर्त्या बनते. तरीही मानवी-निर्धारित इन्फ्रास्ट्रक्चर व नैतिक मार्गदर्शक तत्त्वांच्या मर्यादांमध्ये बंदिस्त असले तरी, ही एजेन्टिक क्षमता उद्योग आणि अंतिम वापरकर्त्यांसाठी अधिक समृद्ध, गतिशील आणि उपयुक्त AI परस्परसंवाद सक्षम करते.

एजेन्टिक RAG बद्दल अधिक प्रश्न आहेत का?

Microsoft Foundry Discord मध्ये सामील व्हा, इतर शिकणाऱ्यांना भेटा, ऑफिस ऑवर्स अटेंड करा आणि आपल्या AI Agents संबंधित प्रश्नांची उत्तरे मिळवा.

अतिरिक्त संसाधने

अकादमिक पेपर्स

मागील धडा

Tool Use Design Pattern

पुढील धडा

Building Trustworthy AI Agents


अस्वीकरण: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator (https://github.com/Azure/co-op-translator) वापरून अनुवादित केला गेला आहे. आम्ही अचूकतेसाठी प्रयत्न करतो, परंतु कृत्रिम अनुवादात त्रुटी किंवा अचूकतेची कमतरता असू शकते, याची कृपया नोंद घ्या. मूळ भाषेतील दस्तऐवज अधिकृत स्रोत म्हणून मानला पाहिजे. महत्वाची माहिती असल्यास व्यावसायिक मानवी अनुवादाची शिफारस केली जाते. या अनुवादाच्या वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमजुतींसाठी किंवा चुकीच्या अर्थव्याख्यांसाठी आम्ही जबाबदार नाही.