ai-agents-for-beginners

एजेंटिक प्रोटोकॉल्स (MCP, A2A और NLWeb) का उपयोग करना

एजेंटिक प्रोटोकॉल्स

(ऊपर दी गई छवि पर क्लिक करें इस पाठ का वीडियो देखने के लिए)

जैसे-जैसे AI एजेंट्स का उपयोग बढ़ रहा है, वैसे-वैसे ऐसे प्रोटोकॉल्स की आवश्यकता भी बढ़ रही है जो मानकीकरण, सुरक्षा और खुले नवाचार का समर्थन सुनिश्चित करें। इस पाठ में, हम तीन प्रोटोकॉल्स के बारे में जानेंगे जो इस आवश्यकता को पूरा करने की कोशिश कर रहे हैं - मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP), एजेंट टू एजेंट (A2A) और नेचुरल लैंग्वेज वेब (NLWeb)।

परिचय

इस पाठ में, हम कवर करेंगे:

• कैसे MCP AI एजेंट्स को बाहरी टूल्स और डेटा तक पहुंचने की अनुमति देता है ताकि वे उपयोगकर्ता के कार्य पूरे कर सकें।

• कैसे A2A विभिन्न AI एजेंट्स के बीच संचार और सहयोग को सक्षम बनाता है।

• कैसे NLWeb किसी भी वेबसाइट पर प्राकृतिक भाषा इंटरफेस लाता है, जिससे AI एजेंट्स सामग्री को खोजने और उसके साथ इंटरैक्ट करने में सक्षम होते हैं।

सीखने के लक्ष्य

पहचानें MCP, A2A और NLWeb का मुख्य उद्देश्य और AI एजेंट्स के संदर्भ में उनके लाभ।

समझाएं कि प्रत्येक प्रोटोकॉल LLMs, टूल्स और अन्य एजेंट्स के बीच संचार और इंटरैक्शन को कैसे सक्षम बनाता है।

पता लगाएं कि जटिल एजेंटिक सिस्टम बनाने में प्रत्येक प्रोटोकॉल की अलग-अलग भूमिकाएं क्या हैं।

मॉडल कॉन्टेक्स्ट प्रोटोकॉल

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) एक ओपन स्टैंडर्ड है जो LLMs को संदर्भ और टूल्स प्रदान करने के लिए एप्लिकेशन के लिए एक मानकीकृत तरीका प्रदान करता है। यह AI एजेंट्स को विभिन्न डेटा स्रोतों और टूल्स से जुड़ने के लिए एक “यूनिवर्सल एडाप्टर” प्रदान करता है।

आइए MCP के घटकों, सीधे API उपयोग की तुलना में इसके लाभ, और AI एजेंट्स MCP सर्वर का उपयोग कैसे कर सकते हैं, इसका एक उदाहरण देखें।

MCP के मुख्य घटक

MCP क्लाइंट-सर्वर आर्किटेक्चर पर काम करता है और इसके मुख्य घटक हैं:

होस्ट्स: LLM एप्लिकेशन (जैसे VSCode जैसे कोड एडिटर) जो MCP सर्वर से कनेक्शन शुरू करते हैं।

क्लाइंट्स: होस्ट एप्लिकेशन के भीतर घटक जो सर्वरों के साथ एक-से-एक कनेक्शन बनाए रखते हैं।

सर्वर्स: हल्के प्रोग्राम जो विशिष्ट क्षमताओं को उजागर करते हैं।

प्रोटोकॉल में तीन मुख्य प्रिमिटिव्स शामिल हैं, जो MCP सर्वर की क्षमताएं हैं:

टूल्स: ये अलग-अलग क्रियाएं या कार्य हैं जिन्हें AI एजेंट किसी कार्य को पूरा करने के लिए कॉल कर सकता है। उदाहरण के लिए, एक मौसम सेवा “मौसम प्राप्त करें” टूल प्रदान कर सकती है, या एक ई-कॉमर्स सर्वर “उत्पाद खरीदें” टूल प्रदान कर सकता है। MCP सर्वर प्रत्येक टूल का नाम, विवरण और इनपुट/आउटपुट स्कीमा अपनी क्षमताओं की सूची में विज्ञापित करता है।

संसाधन: ये केवल-पढ़ने योग्य डेटा आइटम या दस्तावेज़ हैं जिन्हें MCP सर्वर प्रदान कर सकता है, और क्लाइंट्स उन्हें मांग पर प्राप्त कर सकते हैं। उदाहरणों में फ़ाइल सामग्री, डेटाबेस रिकॉर्ड या लॉग फ़ाइलें शामिल हैं। संसाधन टेक्स्ट (जैसे कोड या JSON) या बाइनरी (जैसे इमेज या PDF) हो सकते हैं।

प्रॉम्प्ट्स: ये पूर्वनिर्धारित टेम्पलेट्स हैं जो सुझाए गए प्रॉम्प्ट्स प्रदान करते हैं, जिससे अधिक जटिल वर्कफ़्लो संभव हो पाते हैं।

MCP के लाभ

MCP AI एजेंट्स के लिए महत्वपूर्ण लाभ प्रदान करता है:

डायनामिक टूल डिस्कवरी: एजेंट्स सर्वर से उपलब्ध टूल्स की सूची और उनके कार्यों के विवरण को डायनामिक रूप से प्राप्त कर सकते हैं। यह पारंपरिक APIs के विपरीत है, जो अक्सर एकीकरण के लिए स्थिर कोडिंग की आवश्यकता होती है, जिसका अर्थ है कि किसी भी API परिवर्तन के लिए कोड अपडेट की आवश्यकता होती है। MCP “एक बार एकीकृत करें” दृष्टिकोण प्रदान करता है, जिससे अधिक अनुकूलता होती है।

LLMs के बीच इंटरऑपरेबिलिटी: MCP विभिन्न LLMs के साथ काम करता है, जिससे बेहतर प्रदर्शन के लिए कोर मॉडल को स्विच करने की लचीलापन मिलती है।

मानकीकृत सुरक्षा: MCP एक मानक प्रमाणीकरण विधि शामिल करता है, जिससे अतिरिक्त MCP सर्वरों तक पहुंच जोड़ने पर स्केलेबिलिटी में सुधार होता है। यह विभिन्न पारंपरिक APIs के लिए अलग-अलग कुंजियों और प्रमाणीकरण प्रकारों को प्रबंधित करने की तुलना में सरल है।

MCP का उदाहरण

MCP डायग्राम

कल्पना करें कि एक उपयोगकर्ता MCP द्वारा संचालित AI सहायक का उपयोग करके एक फ्लाइट बुक करना चाहता है।

  1. कनेक्शन: AI सहायक (MCP क्लाइंट) एक एयरलाइन द्वारा प्रदान किए गए MCP सर्वर से जुड़ता है।

  2. टूल डिस्कवरी: क्लाइंट एयरलाइन के MCP सर्वर से पूछता है, “आपके पास कौन-कौन से टूल्स उपलब्ध हैं?” सर्वर “फ्लाइट खोजें” और “फ्लाइट बुक करें” जैसे टूल्स के साथ जवाब देता है।

  3. टूल इनवोकेशन: फिर आप AI सहायक से पूछते हैं, “कृपया पोर्टलैंड से होनोलूलू के लिए फ्लाइट खोजें।” AI सहायक, अपने LLM का उपयोग करते हुए, पहचानता है कि उसे “फ्लाइट खोजें” टूल को कॉल करना है और MCP सर्वर को प्रासंगिक पैरामीटर (उद्गम, गंतव्य) पास करता है।

  4. निष्पादन और प्रतिक्रिया: MCP सर्वर, एक रैपर के रूप में कार्य करते हुए, एयरलाइन के आंतरिक बुकिंग API को वास्तविक कॉल करता है। फिर यह फ्लाइट जानकारी (जैसे JSON डेटा) प्राप्त करता है और इसे AI सहायक को वापस भेजता है।

  5. आगे की बातचीत: AI सहायक फ्लाइट विकल्प प्रस्तुत करता है। एक बार जब आप एक फ्लाइट चुनते हैं, तो सहायक उसी MCP सर्वर पर “फ्लाइट बुक करें” टूल को कॉल कर सकता है, बुकिंग पूरी कर सकता है।

एजेंट-टू-एजेंट प्रोटोकॉल (A2A)

जहां MCP LLMs को टूल्स से जोड़ने पर केंद्रित है, वहीं एजेंट-टू-एजेंट (A2A) प्रोटोकॉल इसे एक कदम आगे ले जाता है, जिससे विभिन्न AI एजेंट्स के बीच संचार और सहयोग संभव हो पाता है। A2A विभिन्न संगठनों, वातावरण और तकनीकी स्टैक्स में AI एजेंट्स को जोड़ता है ताकि एक साझा कार्य पूरा किया जा सके।

हम A2A के घटकों और लाभों की जांच करेंगे, साथ ही यह हमारे यात्रा एप्लिकेशन में कैसे लागू हो सकता है इसका एक उदाहरण देखेंगे।

A2A के मुख्य घटक

A2A एजेंट्स के बीच संचार को सक्षम करने और उन्हें उपयोगकर्ता के उप-कार्य को पूरा करने के लिए एक साथ काम करने पर केंद्रित है। प्रोटोकॉल का प्रत्येक घटक इसमें योगदान देता है:

एजेंट कार्ड

जैसे MCP सर्वर टूल्स की सूची साझा करता है, वैसे ही एक एजेंट कार्ड में होता है:

एजेंट एक्जीक्यूटर

एजेंट एक्जीक्यूटर उपयोगकर्ता चैट के संदर्भ को रिमोट एजेंट तक पास करने के लिए जिम्मेदार होता है, ताकि रिमोट एजेंट यह समझ सके कि कौन सा कार्य पूरा करना है। A2A सर्वर में, एक एजेंट अपने स्वयं के बड़े भाषा मॉडल (LLM) का उपयोग करके आने वाले अनुरोधों को पार्स करता है और अपने आंतरिक टूल्स का उपयोग करके कार्यों को निष्पादित करता है।

आर्टिफैक्ट

एक बार जब रिमोट एजेंट अनुरोधित कार्य पूरा कर लेता है, तो उसका कार्य उत्पाद एक आर्टिफैक्ट के रूप में बनाया जाता है। आर्टिफैक्ट में एजेंट के कार्य का परिणाम, क्या पूरा किया गया इसका विवरण, और प्रोटोकॉल के माध्यम से भेजा गया टेक्स्ट संदर्भ शामिल होता है। आर्टिफैक्ट भेजे जाने के बाद, रिमोट एजेंट के साथ कनेक्शन तब तक बंद रहता है जब तक कि उसकी फिर से आवश्यकता न हो।

इवेंट क्यू

यह घटक अपडेट्स को संभालने और संदेश पास करने के लिए उपयोग किया जाता है। यह उत्पादन में एजेंटिक सिस्टम के लिए विशेष रूप से महत्वपूर्ण है ताकि एजेंट्स के बीच कनेक्शन कार्य पूरा होने से पहले बंद न हो, खासकर जब कार्य पूरा होने में अधिक समय लग सकता है।

A2A के लाभ

बेहतर सहयोग: यह विभिन्न विक्रेताओं और प्लेटफॉर्म्स के एजेंट्स को इंटरैक्ट करने, संदर्भ साझा करने और एक साथ काम करने में सक्षम बनाता है, जिससे पारंपरिक रूप से डिस्कनेक्टेड सिस्टम्स में सहज ऑटोमेशन संभव हो पाता है।

मॉडल चयन की लचीलता: प्रत्येक A2A एजेंट यह तय कर सकता है कि वह अपने अनुरोधों को पूरा करने के लिए कौन सा LLM उपयोग करता है, जिससे एजेंट के अनुरूप या फाइन-ट्यून किए गए मॉडल का उपयोग संभव हो पाता है, जो MCP परिदृश्यों में एकल LLM कनेक्शन के विपरीत है।

बिल्ट-इन प्रमाणीकरण: प्रमाणीकरण सीधे A2A प्रोटोकॉल में एकीकृत होता है, जिससे एजेंट इंटरैक्शन के लिए एक मजबूत सुरक्षा ढांचा प्रदान होता है।

A2A का उदाहरण

A2A डायग्राम

आइए हमारे यात्रा बुकिंग परिदृश्य को विस्तारित करें, लेकिन इस बार A2A का उपयोग करके।

  1. मल्टी-एजेंट को उपयोगकर्ता का अनुरोध: एक उपयोगकर्ता “ट्रैवल एजेंट” A2A क्लाइंट/एजेंट के साथ इंटरैक्ट करता है, शायद यह कहकर, “कृपया अगले सप्ताह होनोलूलू के लिए पूरी यात्रा बुक करें, जिसमें फ्लाइट्स, एक होटल और एक रेंटल कार शामिल हो।”

  2. ट्रैवल एजेंट द्वारा ऑर्केस्ट्रेशन: ट्रैवल एजेंट इस जटिल अनुरोध को प्राप्त करता है। यह कार्य के बारे में तर्क करने और यह निर्धारित करने के लिए अपने LLM का उपयोग करता है कि उसे अन्य विशेषज्ञ एजेंट्स के साथ इंटरैक्ट करना होगा।

  3. इंटर-एजेंट संचार: ट्रैवल एजेंट फिर A2A प्रोटोकॉल का उपयोग करके डाउनस्ट्रीम एजेंट्स से जुड़ता है, जैसे “एयरलाइन एजेंट,” “होटल एजेंट,” और “कार रेंटल एजेंट,” जो विभिन्न कंपनियों द्वारा बनाए गए हैं।

  4. प्रतिनिधित कार्य निष्पादन: ट्रैवल एजेंट इन विशेषज्ञ एजेंट्स को विशिष्ट कार्य भेजता है (जैसे, “होनोलूलू के लिए फ्लाइट्स खोजें,” “एक होटल बुक करें,” “एक कार किराए पर लें”)। इन विशेषज्ञ एजेंट्स, अपने स्वयं के LLMs चलाते हुए और अपने स्वयं के टूल्स का उपयोग करते हुए (जो MCP सर्वर्स भी हो सकते हैं), बुकिंग के अपने विशिष्ट हिस्से को पूरा करते हैं।

  5. समेकित प्रतिक्रिया: एक बार जब सभी डाउनस्ट्रीम एजेंट्स अपने कार्य पूरे कर लेते हैं, तो ट्रैवल एजेंट परिणामों (फ्लाइट विवरण, होटल पुष्टि, कार रेंटल बुकिंग) को संकलित करता है और उपयोगकर्ता को एक व्यापक, चैट-शैली प्रतिक्रिया भेजता है।

नेचुरल लैंग्वेज वेब (NLWeb)

वेबसाइटें लंबे समय से उपयोगकर्ताओं के लिए इंटरनेट पर जानकारी और डेटा तक पहुंचने का प्राथमिक तरीका रही हैं।

आइए NLWeb के विभिन्न घटकों, NLWeb के लाभों और हमारे यात्रा एप्लिकेशन के माध्यम से NLWeb कैसे काम करता है इसका एक उदाहरण देखें।

NLWeb के घटक

NLWeb का उदाहरण

NLWeb

हमारे यात्रा बुकिंग वेबसाइट को फिर से देखें, लेकिन इस बार यह NLWeb द्वारा संचालित है।

  1. डेटा इनजेशन: यात्रा वेबसाइट के मौजूदा उत्पाद कैटलॉग (जैसे, फ्लाइट लिस्टिंग्स, होटल विवरण, टूर पैकेज) Schema.org का उपयोग करके या RSS फीड्स के माध्यम से स्वरूपित किए जाते हैं। NLWeb के टूल्स इस संरचित डेटा को इनजेस्ट करते हैं, एम्बेडिंग्स बनाते हैं, और उन्हें स्थानीय या रिमोट वेक्टर डेटाबेस में संग्रहीत करते हैं।

  2. प्राकृतिक भाषा क्वेरी (मानव): एक उपयोगकर्ता वेबसाइट पर जाता है और, मेनू नेविगेट करने के बजाय, चैट इंटरफेस में टाइप करता है: “मुझे अगले सप्ताह होनोलूलू में एक फैमिली-फ्रेंडली होटल ढूंढें जिसमें पूल हो।”

  3. NLWeb प्रोसेसिंग: NLWeb एप्लिकेशन इस क्वेरी को प्राप्त करता है। यह क्वेरी को समझने के लिए एक LLM को भेजता है और साथ ही अपने वेक्टर डेटाबेस में प्रासंगिक होटल लिस्टिंग्स खोजता है।

  4. सटीक परिणाम: LLM डेटाबेस से खोज परिणामों की व्याख्या करने में मदद करता है, “फैमिली-फ्रेंडली,” “पूल,” और “होनोलूलू” मानदंडों के आधार पर सर्वोत्तम मेलों की पहचान करता है, और फिर एक प्राकृतिक भाषा प्रतिक्रिया स्वरूपित करता है। महत्वपूर्ण रूप से, प्रतिक्रिया वेबसाइट के कैटलॉग से वास्तविक होटलों का उल्लेख करती है, काल्पनिक जानकारी से बचते हुए।

  5. AI एजेंट इंटरैक्शन: क्योंकि NLWeb एक MCP सर्वर के रूप में कार्य करता है, एक बाहरी AI ट्रैवल एजेंट भी इस वेबसाइट के NLWeb इंस्टेंस से जुड़ सकता है। AI एजेंट तब सीधे वेबसाइट से ask MCP विधि का उपयोग करके क्वेरी कर सकता है: ask("क्या होनोलूलू क्षेत्र में कोई वेगन-फ्रेंडली रेस्तरां हैं जो होटल द्वारा अनुशंसित हैं?")। NLWeb इंस्टेंस इसे प्रोसेस करेगा, अपने डेटाबेस का उपयोग करके रेस्तरां जानकारी (यदि लोड की गई हो) का लाभ उठाएगा, और एक संरचित JSON


अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।