ai-agents-for-beginners

एजेंटिक प्रोटोकॉल्स (MCP, A2A और NLWeb) का उपयोग करना

एजेंटिक प्रोटोकॉल्स

जैसे-जैसे AI एजेंट्स का उपयोग बढ़ रहा है, वैसे-वैसे ऐसे प्रोटोकॉल्स की आवश्यकता भी बढ़ रही है जो मानकीकरण, सुरक्षा और खुला नवाचार सुनिश्चित करें। इस पाठ में, हम तीन प्रोटोकॉल्स के बारे में जानेंगे जो इस आवश्यकता को पूरा करने की कोशिश कर रहे हैं - मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP), एजेंट टू एजेंट (A2A) और नेचुरल लैंग्वेज वेब (NLWeb)।

परिचय

इस पाठ में, हम कवर करेंगे:

• कैसे MCP AI एजेंट्स को बाहरी टूल्स और डेटा तक पहुंच प्रदान करता है ताकि वे उपयोगकर्ता के कार्य पूरे कर सकें।

• कैसे A2A विभिन्न AI एजेंट्स के बीच संचार और सहयोग को सक्षम बनाता है।

• कैसे NLWeb किसी भी वेबसाइट पर प्राकृतिक भाषा इंटरफेस लाता है, जिससे AI एजेंट्स सामग्री को खोज और इंटरैक्ट कर सकते हैं।

सीखने के लक्ष्य

पहचानें MCP, A2A और NLWeb का मुख्य उद्देश्य और AI एजेंट्स के संदर्भ में उनके लाभ।

समझाएं कि प्रत्येक प्रोटोकॉल LLMs, टूल्स और अन्य एजेंट्स के बीच संचार और इंटरैक्शन को कैसे सक्षम बनाता है।

पहचानें कि जटिल एजेंटिक सिस्टम बनाने में प्रत्येक प्रोटोकॉल की अलग-अलग भूमिकाएं क्या हैं।

मॉडल कॉन्टेक्स्ट प्रोटोकॉल

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) एक ओपन स्टैंडर्ड है जो LLMs को संदर्भ और टूल्स प्रदान करने के लिए एक मानकीकृत तरीका प्रदान करता है। यह AI एजेंट्स को विभिन्न डेटा स्रोतों और टूल्स से जुड़ने के लिए एक “यूनिवर्सल एडाप्टर” प्रदान करता है।

आइए MCP के घटकों, सीधे API उपयोग की तुलना में इसके लाभ, और AI एजेंट्स MCP सर्वर का उपयोग कैसे कर सकते हैं, इसका एक उदाहरण देखें।

MCP के मुख्य घटक

MCP क्लाइंट-सर्वर आर्किटेक्चर पर काम करता है और इसके मुख्य घटक हैं:

होस्ट्स: LLM एप्लिकेशन (जैसे VSCode जैसे कोड एडिटर) जो MCP सर्वर से कनेक्शन शुरू करते हैं।

क्लाइंट्स: होस्ट एप्लिकेशन के भीतर घटक जो सर्वर्स के साथ एक-से-एक कनेक्शन बनाए रखते हैं।

सर्वर्स: हल्के प्रोग्राम्स जो विशिष्ट क्षमताओं को उजागर करते हैं।

प्रोटोकॉल में तीन मुख्य प्रिमिटिव्स शामिल हैं, जो MCP सर्वर की क्षमताएं हैं:

टूल्स: ये विशिष्ट क्रियाएं या कार्य हैं जिन्हें AI एजेंट्स किसी कार्य को पूरा करने के लिए कॉल कर सकते हैं। उदाहरण के लिए, एक मौसम सेवा “मौसम प्राप्त करें” टूल प्रदान कर सकती है, या एक ई-कॉमर्स सर्वर “उत्पाद खरीदें” टूल प्रदान कर सकता है। MCP सर्वर्स प्रत्येक टूल का नाम, विवरण और इनपुट/आउटपुट स्कीमा अपनी क्षमताओं की सूची में विज्ञापित करते हैं।

संसाधन: ये केवल-पढ़ने योग्य डेटा आइटम या दस्तावेज़ हैं जिन्हें MCP सर्वर प्रदान कर सकता है, और क्लाइंट्स उन्हें मांग पर प्राप्त कर सकते हैं। उदाहरणों में फ़ाइल सामग्री, डेटाबेस रिकॉर्ड्स, या लॉग फ़ाइलें शामिल हैं। संसाधन टेक्स्ट (जैसे कोड या JSON) या बाइनरी (जैसे इमेज या PDFs) हो सकते हैं।

प्रॉम्प्ट्स: ये पूर्वनिर्धारित टेम्पलेट्स हैं जो सुझाए गए प्रॉम्प्ट्स प्रदान करते हैं, जिससे अधिक जटिल वर्कफ़्लो संभव हो पाते हैं।

MCP के लाभ

MCP AI एजेंट्स के लिए महत्वपूर्ण लाभ प्रदान करता है:

डायनामिक टूल डिस्कवरी: एजेंट्स सर्वर से उपलब्ध टूल्स की सूची और उनके कार्यों के विवरण को डायनामिक रूप से प्राप्त कर सकते हैं। यह पारंपरिक APIs के विपरीत है, जो अक्सर इंटीग्रेशन के लिए स्थिर कोडिंग की आवश्यकता होती है, और किसी भी API परिवर्तन के लिए कोड अपडेट की आवश्यकता होती है। MCP “एक बार इंटीग्रेट करें” दृष्टिकोण प्रदान करता है, जिससे अधिक अनुकूलता मिलती है।

LLMs के बीच इंटरऑपरेबिलिटी: MCP विभिन्न LLMs के साथ काम करता है, जिससे बेहतर प्रदर्शन के लिए कोर मॉडल को स्विच करने की लचीलापन मिलती है।

मानकीकृत सुरक्षा: MCP एक मानक प्रमाणीकरण विधि शामिल करता है, जिससे अतिरिक्त MCP सर्वर्स तक पहुंच जोड़ने पर स्केलेबिलिटी में सुधार होता है। यह विभिन्न पारंपरिक APIs के लिए अलग-अलग कुंजियों और प्रमाणीकरण प्रकारों को प्रबंधित करने की तुलना में सरल है।

MCP का उदाहरण

MCP डायग्राम

कल्पना करें कि एक उपयोगकर्ता MCP द्वारा संचालित AI सहायक का उपयोग करके एक फ्लाइट बुक करना चाहता है।

  1. कनेक्शन: AI सहायक (MCP क्लाइंट) एक एयरलाइन द्वारा प्रदान किए गए MCP सर्वर से जुड़ता है।

  2. टूल डिस्कवरी: क्लाइंट एयरलाइन के MCP सर्वर से पूछता है, “आपके पास कौन-कौन से टूल्स उपलब्ध हैं?” सर्वर “फ्लाइट खोजें” और “फ्लाइट बुक करें” जैसे टूल्स के साथ जवाब देता है।

  3. टूल इनवोकेशन: आप AI सहायक से कहते हैं, “पोर्टलैंड से होनोलूलू के लिए फ्लाइट खोजें।” AI सहायक, अपने LLM का उपयोग करते हुए, पहचानता है कि उसे “फ्लाइट खोजें” टूल को कॉल करना है और MCP सर्वर को प्रासंगिक पैरामीटर (उद्गम, गंतव्य) पास करता है।

  4. निष्पादन और प्रतिक्रिया: MCP सर्वर, एक रैपर के रूप में कार्य करते हुए, एयरलाइन के आंतरिक बुकिंग API को वास्तविक कॉल करता है। फिर यह फ्लाइट जानकारी (जैसे JSON डेटा) प्राप्त करता है और इसे AI सहायक को वापस भेजता है।

  5. आगे की बातचीत: AI सहायक फ्लाइट विकल्प प्रस्तुत करता है। एक बार जब आप एक फ्लाइट चुनते हैं, तो सहायक उसी MCP सर्वर पर “फ्लाइट बुक करें” टूल को कॉल कर सकता है, बुकिंग पूरी कर सकता है।

एजेंट-टू-एजेंट प्रोटोकॉल (A2A)

जहां MCP LLMs को टूल्स से जोड़ने पर केंद्रित है, वहीं एजेंट-टू-एजेंट (A2A) प्रोटोकॉल इसे एक कदम आगे ले जाता है और विभिन्न AI एजेंट्स के बीच संचार और सहयोग को सक्षम बनाता है। A2A विभिन्न संगठनों, वातावरण और तकनीकी स्टैक्स में AI एजेंट्स को जोड़ता है ताकि एक साझा कार्य पूरा किया जा सके।

हम A2A के घटकों और लाभों की जांच करेंगे, साथ ही हमारे यात्रा एप्लिकेशन में इसे लागू करने का एक उदाहरण देखेंगे।

A2A के मुख्य घटक

A2A एजेंट्स के बीच संचार को सक्षम करने और उन्हें उपयोगकर्ता के उप-कार्य को पूरा करने के लिए एक साथ काम करने पर केंद्रित है। प्रोटोकॉल का प्रत्येक घटक इसमें योगदान देता है:

एजेंट कार्ड

जैसे MCP सर्वर टूल्स की सूची साझा करता है, वैसे ही एक एजेंट कार्ड में होता है:     ◦ एजेंट का नाम।
    ◦ सामान्य कार्यों का विवरण जो वह पूरा करता है।
    ◦ विशिष्ट कौशलों की सूची विवरणों के साथ, ताकि अन्य एजेंट्स (या यहां तक कि मानव उपयोगकर्ता) समझ सकें कि कब और क्यों वे उस एजेंट को कॉल करना चाहेंगे।
    ◦ एजेंट का वर्तमान एंडपॉइंट URL
    ◦ एजेंट का संस्करण और क्षमताएं, जैसे स्ट्रीमिंग प्रतिक्रियाएं और पुश नोटिफिकेशन।

एजेंट एक्जीक्यूटर

एजेंट एक्जीक्यूटर उपयोगकर्ता चैट का संदर्भ दूरस्थ एजेंट को पास करने के लिए जिम्मेदार होता है। दूरस्थ एजेंट को यह समझने के लिए इसकी आवश्यकता होती है कि कौन सा कार्य पूरा करना है। A2A सर्वर में, एक एजेंट अपने स्वयं के बड़े भाषा मॉडल (LLM) का उपयोग करके आने वाले अनुरोधों को पार्स करता है और अपने आंतरिक टूल्स का उपयोग करके कार्यों को निष्पादित करता है।

आर्टिफैक्ट

एक बार जब दूरस्थ एजेंट अनुरोधित कार्य पूरा कर लेता है, तो उसका कार्य उत्पाद एक आर्टिफैक्ट के रूप में बनाया जाता है। आर्टिफैक्ट में एजेंट के कार्य का परिणाम, क्या पूरा किया गया इसका विवरण, और प्रोटोकॉल के माध्यम से भेजा गया टेक्स्ट संदर्भ शामिल होता है। आर्टिफैक्ट भेजे जाने के बाद, दूरस्थ एजेंट के साथ कनेक्शन तब तक बंद रहता है जब तक कि उसकी फिर से आवश्यकता न हो।

इवेंट क्यू

यह घटक अपडेट्स को संभालने और संदेश पास करने के लिए उपयोग किया जाता है। यह उत्पादन में एजेंटिक सिस्टम्स के लिए विशेष रूप से महत्वपूर्ण है ताकि एजेंट्स के बीच कनेक्शन कार्य पूरा होने से पहले बंद न हो, खासकर जब कार्य पूरा होने में अधिक समय लग सकता है।

A2A के लाभ

बेहतर सहयोग: यह विभिन्न विक्रेताओं और प्लेटफॉर्म्स के एजेंट्स को इंटरैक्ट करने, संदर्भ साझा करने और एक साथ काम करने में सक्षम बनाता है, पारंपरिक रूप से असंबद्ध सिस्टम्स के बीच सहज ऑटोमेशन को सुविधाजनक बनाता है।

मॉडल चयन की लचीलापन: प्रत्येक A2A एजेंट यह तय कर सकता है कि वह अपने अनुरोधों को पूरा करने के लिए कौन सा LLM उपयोग करता है, जिससे प्रति एजेंट अनुकूलित या फाइन-ट्यून किए गए मॉडल्स की अनुमति मिलती है, जो कुछ MCP परिदृश्यों में एकल LLM कनेक्शन के विपरीत है।

बिल्ट-इन प्रमाणीकरण: प्रमाणीकरण सीधे A2A प्रोटोकॉल में एकीकृत है, एजेंट इंटरैक्शन के लिए एक मजबूत सुरक्षा ढांचा प्रदान करता है।

A2A का उदाहरण

A2A डायग्राम

आइए हमारे यात्रा बुकिंग परिदृश्य को विस्तारित करें, लेकिन इस बार A2A का उपयोग करके।

  1. मल्टी-एजेंट को उपयोगकर्ता अनुरोध: एक उपयोगकर्ता “ट्रैवल एजेंट” A2A क्लाइंट/एजेंट के साथ बातचीत करता है, शायद यह कहते हुए, “कृपया अगले सप्ताह होनोलूलू के लिए एक पूरी यात्रा बुक करें, जिसमें फ्लाइट्स, एक होटल और एक रेंटल कार शामिल हो।”

  2. ट्रैवल एजेंट द्वारा ऑर्केस्ट्रेशन: ट्रैवल एजेंट इस जटिल अनुरोध को प्राप्त करता है। यह कार्य के बारे में तर्क करने और यह निर्धारित करने के लिए अपने LLM का उपयोग करता है कि उसे अन्य विशेषज्ञ एजेंट्स के साथ इंटरैक्ट करने की आवश्यकता है।

  3. इंटर-एजेंट संचार: ट्रैवल एजेंट फिर A2A प्रोटोकॉल का उपयोग करके डाउनस्ट्रीम एजेंट्स से जुड़ता है, जैसे “एयरलाइन एजेंट,” “होटल एजेंट,” और “कार रेंटल एजेंट,” जो विभिन्न कंपनियों द्वारा बनाए गए हैं।

  4. प्रतिनिधित कार्य निष्पादन: ट्रैवल एजेंट इन विशेषज्ञ एजेंट्स को विशिष्ट कार्य भेजता है (जैसे, “होनोलूलू के लिए फ्लाइट्स खोजें,” “एक होटल बुक करें,” “एक कार किराए पर लें”)। इन विशेषज्ञ एजेंट्स, अपने स्वयं के LLMs चलाते हुए और अपने स्वयं के टूल्स का उपयोग करते हुए (जो MCP सर्वर्स भी हो सकते हैं), बुकिंग के अपने विशिष्ट हिस्से को पूरा करते हैं।

  5. समेकित प्रतिक्रिया: एक बार जब सभी डाउनस्ट्रीम एजेंट्स अपने कार्य पूरे कर लेते हैं, तो ट्रैवल एजेंट परिणामों (फ्लाइट विवरण, होटल पुष्टि, कार रेंटल बुकिंग) को संकलित करता है और उपयोगकर्ता को एक व्यापक, चैट-शैली प्रतिक्रिया भेजता है।

नेचुरल लैंग्वेज वेब (NLWeb)

वेबसाइट्स लंबे समय से इंटरनेट पर जानकारी और डेटा तक पहुंचने का प्राथमिक तरीका रही हैं।

आइए NLWeb के विभिन्न घटकों, इसके लाभों और हमारे यात्रा एप्लिकेशन के माध्यम से NLWeb के काम करने का एक उदाहरण देखें।

NLWeb के घटक

NLWeb का उदाहरण

NLWeb

हमारे यात्रा बुकिंग वेबसाइट को फिर से देखें, लेकिन इस बार यह NLWeb द्वारा संचालित है।

  1. डेटा इनजेशन: यात्रा वेबसाइट के मौजूदा उत्पाद कैटलॉग्स (जैसे, फ्लाइट लिस्टिंग्स, होटल विवरण, टूर पैकेज) को Schema.org का उपयोग करके फॉर्मेट किया जाता है या RSS फीड्स के माध्यम से लोड किया जाता है। NLWeb के टूल्स इस संरचित डेटा को इनजेस्ट करते हैं, एम्बेडिंग्स बनाते हैं, और उन्हें स्थानीय या रिमोट वेक्टर डेटाबेस में संग्रहीत करते हैं।

  2. प्राकृतिक भाषा क्वेरी (मानव): एक उपयोगकर्ता वेबसाइट पर जाता है और, मेनू नेविगेट करने के बजाय, चैट इंटरफेस में टाइप करता है: “मुझे अगले सप्ताह के लिए होनोलूलू में एक फैमिली-फ्रेंडली होटल ढूंढें जिसमें पूल हो।”

  3. NLWeb प्रोसेसिंग: NLWeb एप्लिकेशन इस क्वेरी को प्राप्त करता है। यह क्वेरी को समझने के लिए एक LLM को भेजता है और साथ ही अपने वेक्टर डेटाबेस में प्रासंगिक होटल लिस्टिंग्स की खोज करता है।

  4. सटीक परिणाम: LLM डेटाबेस से खोज परिणामों की व्याख्या करने में मदद करता है, “फैमिली-फ्रेंडली,” “पूल,” और “होनोलूलू” मानदंडों के आधार पर सर्वोत्तम मेलों की पहचान करता है, और फिर एक प्राकृतिक भाषा प्रतिक्रिया को फॉर्मेट करता है। महत्वपूर्ण रूप से, प्रतिक्रिया वेबसाइट के कैटलॉग से वास्तविक होटलों का उल्लेख करती है, काल्पनिक जानकारी से बचते हुए।

  5. AI एजेंट इंटरैक्शन: क्योंकि NLWeb एक MCP सर्वर के रूप में कार्य करता है, एक बाहरी AI ट्रैवल एजेंट भी इस वेबसाइट के NLWeb इंस्टेंस से जुड़ सकता है। AI एजेंट तब वेबसाइट को सीधे ask MCP विधि का उपयोग करके क्वेरी कर सकता है: ask("क्या होटल द्वारा सुझाए गए होनोलूलू क्षेत्र में कोई वेगन-फ्रेंडली रेस्तरां हैं?")। NLWeb इंस्टेंस इसे प्रोसेस करेगा, अपने डेटाबेस का उपयोग करके रेस्तरां जानकारी (यदि लोड की गई हो) का लाभ उठाएगा, और एक संरचित JSON प्रतिक्रिया लौटाएगा।

MCP/A2A/NLWeb के बारे में और


अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को आधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।