(उपरोक्त छविमा क्लिक गरेर यस पाठको भिडियो हेर्नुहोस्)
AI एजेण्टहरूको प्रयोग बढ्दै जाँदा, मानकीकरण, सुरक्षा र खुला नवप्रवर्तनलाई सुनिश्चित गर्ने प्रोटोकलहरूको आवश्यकता पनि बढ्छ। यस पाठमा, हामी यी आवश्यकताहरू पूरा गर्न खोज्ने 3 वटा प्रोटोकलहरू — Model Context Protocol (MCP), Agent to Agent (A2A) र Natural Language Web (NLWeb) — कभर गर्नेछौं।
यस पाठमा, हामीले कभर गर्नेछौं:
• कसरी MCP ले AI एजेण्टहरूलाई बाहिरी उपकरण र डाटा पहुँच गर्न अनुमति दिन्छ ताकि प्रयोगकर्ताका कार्यहरू पूरा गर्न सकियोस्।
• कसरी A2A ले विभिन्न AI एजेण्टहरूबीच सञ्चार र सहकार्य सक्षम गर्छ।
• कसरी NLWeb ले कुनै पनि वेब साइटमा प्राकृतिक भाषा अन्तरफलकहरू ल्याउँछ जसले AI एजेण्टहरूलाई सामग्री पत्ता लगाउन र अन्तरक्रिया गर्न सक्षम बनाउँछ।
• पहिचान गर्नुहोस् MCP, A2A, र NLWeb को मूल उद्देश्य र लाभहरू AI एजेण्टहरूको सन्दर्भमा।
• व्याख्या गर्नुहोस् कसरी प्रत्येक प्रोटोकलले LLMs, उपकरणहरू, र अन्य एजेण्टहरूबीच सञ्चार र अन्तरक्रिया सहज बनाउँछ।
• पहिचान गर्नुहोस् प्रत्येक प्रोटोकलले जटिल एजेण्टिक प्रणालीहरू निर्माणमा खेल्ने फरक भूमिकाहरू।
The Model Context Protocol (MCP) एक खुला मानक हो जसले अनुप्रयोगहरूलाई LLM हरूलाई सन्दर्भ र उपकरणहरू प्रदान गर्ने मानकीकृत तरिका उपलब्ध गराउँछ। यसले AI एजेण्टहरूले निरन्तर तरिकाले जडान गर्न सक्ने विभिन्न डाटा स्रोतहरू र उपकरणहरूका लागि “युनिभर्सल एडाप्टर” सक्षम गर्दछ।
हेरौं MCP का घटकहरू, सिधा API प्रयोगको तुलनामा यसको फाइदाहरू, र कसरी AI एजेण्टहरूले MCP सर्भर प्रयोग गर्न सक्छन् भन्ने उदाहरण।
MCP एउटा क्लाइєн्ट-सर्भर आर्किटेक्चर मा काम गर्छ र कोर कम्पोनेन्टहरू यसप्रकार छन्:
• Hosts LLM अनुप्रयोगहरू हुन् (उदाहरणका लागि VSCode जस्तो कोड एडिटर) जसले MCP सर्भरसँग कनेक्शन सुरु गर्छन्।
• Clients होस्ट अनुप्रयोगभित्रका कम्पोनेन्टहरू हुन् जसले सर्भरसँग एक-देखि-एक कनेक्शनहरू कायम राख्छन्।
• Servers हल्का-फुल्का प्रोग्रामहरू हुन् जसले विशिष्ट क्षमताहरू सार्वजनिक गर्छन्।
प्रोटोकलमा तीनवटा कोर प्रिमिटिभहरू समावेश छन् जुन MCP सर्भरका क्षमताहरू हुन्:
• Tools: यी छुट्टै कार्यहरू वा फंक्शनहरू हुन् जुन AI एजेण्टले कुनै काम गर्न कल गर्न सक्छ। उदाहरणका लागि, मौसम सेवा “get weather” उपकरण सार्वजनिक गर्न सक्छ, वा ई-कॉमर्स सर्भरले “purchase product” उपकरण सार्वजनिक गर्न सक्छ। MCP सर्भरहरूले हरेक उपकरणको नाम, वर्णन, र इनपुट/आउटपुट स्कीमा आफ्नो क्षमताहरूको सूचीमा सूचित गर्दछन्।
• Resources: यी पढ्न मात्र मिल्ने डेटा आइटमहरू वा कागजातहरू हुन् जुन एक MCP सर्भरले प्रदान गर्न सक्छ, र क्लाइन्टहरूले तिनीहरूलाई आवश्यक परे अनुरोध गर्न सक्छन्। उदाहरणहरूमा फाइल सामग्रीहरू, डाटाबेस रेकर्डहरू, वा लग फाइलहरू समावेश छन्। Resources टेक्स्ट (जस्तो कोड वा JSON) वा बाइनरी (जस्तो तस्बिर वा PDF) हुन सक्छन्।
• Prompts: यी पूर्वनिर्धारित टेम्प्लेटहरू हुन् जसले सुझाव गरिएको प्रॉम्प्टहरू प्रदान गर्दछन्, जसले जटिल वर्कफ़्लोहरूलाई सम्भव बनाउँछ।
MCP ले AI एजेण्टहरूका लागि उल्लेखनीय फाइदाहरू प्रदान गर्छ:
• डायनामिक टुल डिस्कभरी: एजेण्टहरूले सर्भरबाट उपलब्ध उपकरणहरूको सूची गतिशील रूपमा प्राप्त गर्न सक्छन् र ती के गर्छन् भनेर विवरण पाउन सक्छन्। यसले पारम्परिक API हरूको विपरित काम गर्छ, जसले प्रायः एकीकृत गर्न स्थिर कडिंग आवश्यक पार्छ, जसको अर्थ कुनै API परिवर्तनले कोड अद्यावधिक आवश्यक पर्छ। MCP ले “एक पटक एकीकृत गर्नुहोस्” भन्ने दृष्टिकोण प्रदान गर्छ, जसले ठूलो अनुकूलनशीलता दिन्छ।
• विभिन्न LLM हरूमा अन्तरचालकता: MCP विभिन्न LLM हरूसँग काम गर्छ, जसले राम्रो प्रदर्शनको मूल्यांकन गर्न कोर मोडेल स्विच गर्न लचिलोपन दिन्छ।
• मानकीकृत सुरक्षा: MCP ले मानक प्रमाणीकरण विधि समावेश गर्छ, जसले अतिरिक्त MCP सर्भरहरूमा पहुँच थप्दा स्केलेबिलिटी सुधार्छ। यो विभिन्न पारम्परिक API हरूका लागि विभिन्न कुञ्जी र प्रमाणीकरण प्रकारहरू व्यवस्थापन गर्नुभन्दा सरल छ।

कल्पना गर्नुहोस् कि प्रयोगकर्ताले MCP द्वारा सञ्चालित AI सहायक प्रयोग गरेर उडान बुक गर्न चाहन्छ।
Connection: AI सहायक (MCP क्लाइन्ट) एअरलाइन्सद्वारा प्रदान गरिएको MCP सर्भरसँग जडान गर्दछ।
Tool Discovery: क्लाइन्ट एयरलाइन्सको MCP सर्भरलाई सोध्छ, “तपाईंहरूका कुन उपकरणहरू उपलब्ध छन्?” सर्भरले “search flights” र “book flights” जस्ता उपकरणहरूको उत्तर दिन्छ।
Tool Invocation: त्यसपछि तपाईं AI सहायकलाई भन्नुहुन्छ, “कृपया Portland बाट Honolulu तर्फको उडान खोजिदिनुहोस्।” AI सहायक, यसको LLM प्रयोग गरेर, यो निर्धारण गर्दछ कि यसले “search flights” उपकरण कल गर्न आवश्यक छ र सम्बन्धित प्यारामिटरहरू (उद्गमन, गन्तव्य) MCP सर्भरमा पठाउँछ।
Execution and Response: MCP सर्भरले एक रैपरको रूपमा काम गर्दै एयरलाइन्सको आन्तरिक बुकिंग API लाई वास्तविक कल गर्छ। त्यसपछि यसले उडानको जानकारी (उदाहरणका लागि JSON डेटा) प्राप्त गर्छ र AI सहायकलाई फिर्ता पठाउँछ।
Further Interaction: AI सहायकले उडान विकल्पहरू प्रस्तुत गर्दछ। एकपटक तपाईंले उडान चयन गर्नुभयो भने, सहायकले त्यही MCP सर्भरमा “book flight” उपकरणलाई कल गरेर बुकिंग पूरा गर्न सक्छ।
MCP ले LLM हरूलाई उपकरणहरूमा जडान गर्न केन्द्रित भए पनि, Agent-to-Agent (A2A) प्रोटोकल अर्को चरणतर्फ जान्छ र विभिन्न AI एजेण्टहरूबीच सञ्चार र सहकार्य सक्षम बनाउँछ। A2A ले विभिन्न संगठनहरू, वातावरणहरू र टेक स्ट्याकहरूमा रहेका AI एजेण्टहरूलाई साझा कार्य पूरा गर्न जडान गर्छ।
हामी A2A का कम्पोनेन्टहरू र फाइदाहरू र यसको यात्रा अनुप्रयोगमा कसरी लागू गर्न सकिन्छ भन्ने उदाहरण हेर्नेछौं।
A2A ले एजेण्टहरूबीच सञ्चार सक्षम पार्न र तिनीहरूलाई प्रयोगकर्ताको उप-टास्क पूरा गर्न सँगै काम गर्न केन्द्रित गर्छ। प्रोटोकलका प्रत्येक कम्पोनेन्टले यसमा योगदान पुर्याउँछ:
Agent Card कसरी MCP सर्भरले उपकरणहरूको सूची साझा गर्छ त्यसैगरि:
Agent Executor को जिम्मेवारी हो प्रयोगकर्ताको च्याटको सन्दर्भ रिमोट एजेण्टलाई पास गर्ने। रिमोट एजेण्टलाई यो बुझ्न आवश्यक हुन्छ कि पूरा गर्नुपर्ने कार्य के हो। A2A सर्भरमा, एजेण्टले आफ्नै Large Language Model (LLM) प्रयोग गरेर आउने अनुरोधहरू पार्स गर्छ र आफ्नै आन्तरिक उपकरणहरू प्रयोग गरेर कार्यहरू कार्यान्वयन गर्छ।
एक पटक रिमोट एजेण्टले अनुरोध गरिएको कार्य पूरा गरेपछि, यसको कामको उत्पादनलाई आर्टिफ्याक्टको रूपमा सिर्जना गरिन्छ। आर्टिफ्याक्टले एजेण्टको कामको नतिजा समावेश गर्दछ, के पूरा गरियो भन्ने वर्णन, र प्रोटोकल मार्फत पठाइएको टेक्स्ट सन्दर्भ समावेश गर्दछ। आर्टिफ्याक्ट पठाएपछि, रिमोट एजेण्टसँगको कनेक्शन बन्द गरिन्छ जबसम्म आवश्यक नपर्छ।
यो कम्पोनेन्ट अपडेटहरू ह्यान्डल गर्ने र सन्देशहरू पास गर्ने काममा प्रयोग हुन्छ। विशेष गरी उत्पादनमा, एजेण्टिक प्रणालीहरूका लागि यो महत्वपूर्ण हुन्छ ताकि कार्य पूरा नहुन्जेल एजेण्टहरूबीचको कनेक्शन बन्द नहोस्, विशेषगरी जब कार्य पूरा हुन बढी समय लाग्न सक्छ।
• सशक्त सहकार्य: यसले विभिन्न बेच्ने कम्पनी र प्लेटफर्मका एजेण्टहरूलाई अन्तरक्रिया, सन्दर्भ साझा, र सँगै काम गर्न सक्षम बनाउँछ, जसले परम्परागत रूपमा अलग्गै रहेका प्रणालीहरूबीच सहज स्वचालनलाई सक्षम पार्छ।
• मोडेल चयन लचकता: प्रत्येक A2A एजेण्टले आफ्नै अनुरोधहरूको सेवा गर्न कुन LLM प्रयोग गर्ने निर्णय गर्न सक्छ, जसले प्रत्येक एजेण्टका लागि अनुकूलित वा फाइन-ट्युन गरिएको मोडेलहरू प्रयोग गर्न अनुमति दिन्छ, MCP का केही परिदृश्यहरूमा एउटै LLM जडान भन्दा फरक।
• निविष्ट प्रमाणीकरण: प्रमाणीकरण सिधै A2A प्रोटोकलमा समावेश गरिएको छ, जसले एजेण्ट अन्तरक्रियाहरूका लागि बलियो सुरक्षा फ्रेमवर्क प्रदान गर्छ।

हामी हाम्रो यात्रा बुकिंग परिदृश्यलाई विस्तार गरौं, तर यस पटक A2A प्रयोग गरेर।
प्रयोगकर्ताबाट मल्टि-एजेण्टमा अनुरोध: प्रयोगकर्ताले “Travel Agent” A2A क्लाइन्ट/एजेण्टसँग अन्तरक्रिया गर्दछ, सम्भवतः भनी: “कृपया अर्को हप्ता Honolulu का लागि पूरा यात्रा बुक गर्नुहोस्, उडानहरू, होटल, र भाडाको कार समावेश गरी।”
Travel Agent द्वारा समन्वय: Travel Agent ले यो जटिल अनुरोध प्राप्त गर्दछ। यसको LLM प्रयोग गरेर यो सोच्छ र निर्धारण गर्छ कि यसले अन्य विशिष्टीकृत एजेण्टहरूसँग अन्तरक्रिया गर्न आवश्यक छ।
एजेण्टहरूबीच सञ्चार: Travel Agent त्यसपछि A2A प्रोटोकल प्रयोग गरेर डाउनस्ट्रीम एजेण्टहरूसँग जडान गर्छ, जस्तै “Airline Agent,” “Hotel Agent,” र “Car Rental Agent” जुन विभिन्न कम्पनीहरूले सिर्जना गरेका हुन सक्छन्।
प्रतिनिधित कार्य कार्यान्वयन: Travel Agent ले यी विशिष्टीकृत एजेण्टहरूलाई विशिष्ट कार्यहरू पठाउँछ (उदाहरण: “Find flights to Honolulu,” “Book a hotel,” “Rent a car”)। प्रत्येक विशिष्टीकृत एजेण्टले आफ्नै LLM हरू चलाउँछ र आफ्नै उपकरणहरू प्रयोग गरेर (जुन MCP सर्भरहरू हुन सक्छन्) बुकिंगको आफ्नो भाग सम्पन्न गर्छ।
समेकित प्रतिक्रिया: एक पटक सबै डाउनस्ट्रीम एजेण्टहरूले आफ्नो-आफ्नो कार्यहरू पूरा गरेपछि, Travel Agent ले नतिजाहरू (उडान विवरण, होटल पुष्टिकरण, कार भाडामा रहने बुकिंग) सङ्कलन गर्छ र प्रयोगकर्तालाई एउटा व्यापक, च्याट-शैलीको प्रतिक्रिया पठाउँछ।
वेबसाइटहरू लामो समयदेखि प्रयोगकर्ताहरूलाई इन्टरनेटभरि जानकारी र डाटा पहुँच गर्ने प्राथमिक माध्यम छन्।
अब हामी NLWeb का विभिन्न कम्पोनेन्टहरू, NLWeb का लाभहरू र हाम्रो यात्रा अनुप्रयोगले कसरी NLWeb प्रयोग गर्छ भन्ने उदाहरण हेरौं।
NLWeb Application (Core Service Code): प्राकृतिक भाषा प्रश्नहरू प्रशोधन गर्ने प्रणाली। यसले प्लेटफर्मका विभिन्न भागहरूलाई जडान गरेर प्रतिक्रिया सिर्जना गर्छ। तपाईं यसलाई वेबसाइटको प्राकृतिक भाषा सुविधाहरू चलाउने इन्जिनको रूपमा सोच्न सक्नुहुन्छ।
NLWeb Protocol: यो वेबसाइटसँग प्राकृतिक भाषा अन्तरक्रियाको लागि मूल नियमहरूको सेट हो। यो JSON ढाँचामा प्रतिक्रिया पठाउँछ (अक्सर Schema.org प्रयोग गरेर)। यसको उद्देश्य “AI Web” का लागि सरल आधार निर्माण गर्नु हो, त्यसैगरी HTML ले अनलाइन कागजातहरू साझा गर्न सम्भव बनाएको थियो।
MCP Server (Model Context Protocol Endpoint): प्रत्येक NLWeb सेटअपले एउटै समयमा MCP सर्भर को रूपमा पनि काम गर्छ। यसको अर्थ यो अर्को AI प्रणालीहरूसँग टुल्स (जस्तै “ask” मेथड) र डाटा साझा गर्न सक्छ। व्यवहारमा, यसले वेबसाइटको सामग्री र क्षमता AI एजेण्टहरूको लागि प्रयोगयोग्य बनाउँछ, साइटलाई व्यापक “एजेण्ट इकोसिस्टम” को भाग बनाउन अनुमति दिन्छ।
Embedding Models: यी मोडेलहरू वेबसाइट सामग्रीलाई भेक्टर (embeddings) भनिने संख्यात्मक प्रतिनिधित्वहरूमा रूपान्तरण गर्न प्रयोग गरिन्छ। यी भेक्टरहरूले कम्प्युटरहरूले तुलना र खोज गर्न सक्ने तरिकाले अर्थ समात्दछ। तिनीहरू विशेष डाटाबेसमा स्टोर गरिन्छन्, र प्रयोगकर्ताहरूले कुन embedding मोडेल प्रयोग गर्न चाहन्छन् चयन गर्न सक्छन्।
Vector Database (Retrieval Mechanism): यो डाटाबेसले वेबसाइट सामग्रीका embeddings स्टोर गर्छ। जब कसैले प्रश्न सोध्छ, NLWeb ले भेक्टर डाटाबेस जाँच गरेर सबैभन्दा सान्दर्भिक जानकारी छिटो फेला पार्दछ। यसले सम्भावित उत्तरहरूको छिटो सूची दिन्छ, समानता अनुसार क्रमबद्ध। NLWeb ले Qdrant, Snowflake, Milvus, Azure AI Search, र Elasticsearch जस्ता विभिन्न भेक्टर भण्डारण प्रणालीहरूसँग काम गर्दछ।

फेरि हाम्रो यात्रा बुकिंग वेबसाइटलाई विचार गर्नुहोस्, तर यस पटक यो NLWeb द्वारा सञ्चालित छ।
Data Ingestion: यात्रा वेबसाइटका अवस्थित उत्पादन सूचीहरू (उदाहरण: उडान सूचीहरू, होटल विवरणहरू, टुर प्याकेजहरू) Schema.org प्रयोग गरेर फर्म्याट गरिन्छ वा RSS फिडहरू मार्फत लोड गरिन्छ। NLWeb का उपकरणहरूले यो संरचित डेटा खाने, embeddings सिर्जना गर्ने, र तिनीहरूलाई स्थानीय वा रिमोट भेक्टर डाटाबेसमा भण्डारण गर्ने काम गर्दछन्।
Natural Language Query (Human): एक प्रयोगकर्ता वेबसाइटमा आउँछ र मेनुहरूमा नेभिगेट गर्नुको सट्टा च्याट इन्टरफेसमा टाइप गर्छ: “अर्को हप्ता लागि Honolulu मा परिवारमैत्री होटल पूल सहित खोजिदिनुहोस्।”
NLWeb Processing: NLWeb एप्लिकेशनले यो क्वेरी प्राप्त गर्छ। यसले क्वेरीलाई बुझ्न LLM तर्फ पठाउँछ र एकै समयमा आफ्नो भेक्टर डाटाबेसमा सम्बन्धित होटल सूचीहरूको खोजी गर्छ।
Accurate Results: LLM ले डाटाबेसबाट प्राप्त खोजी नतिजाहरू व्याख्या गर्न मद्दत गर्छ, “family-friendly”, “pool”, र “Honolulu” मापदण्डका आधारमा सबैभन्दा उपयुक्त मिल्नेहरू पहिचान गर्छ, र त्यसपछि प्राकृतिक भाषामा प्रतिक्रिया फर्म्याट गर्छ। महत्वपूर्ण कुरा, प्रतिक्रिया वेबसाइटको क्याटलगबाट वास्तविक होटलहरूलाई सन्दर्भ गर्छ, अनुमानमा बनाइएको जानकारी टार्दै।
AI Agent Interaction: किनभने NLWeb ले MCP सर्भरको रूपमा काम गर्छ, बाह्य AI यात्रा एजेण्टले पनि यो वेबसाइटको NLWeb इन्स्ट्यान्ससँग जडान गर्न सक्छ। AI एजेण्टले त्यसपछि ask("Are there any vegan-friendly restaurants in the Honolulu area recommended by the hotel?") मेथड प्रयोग गरेर सिधै वेबसाइटलाई क्वेरी गर्न सक्छ। NLWeb इन्स्ट्यान्सले यो प्रक्रिया गर्दछ, यसको रेस्टुरेन्ट जानकारीको डाटाबेस (यदि लोड गरिएको छ भने) प्रयोग गरेर, र संरचित JSON प्रतिक्रिया फर्काउँछ।
Microsoft Foundry Discord मा सामेल हुनुहोस् ताकि अन्य सिक्नेहरूलाई भेट्न, कार्यालय घण्टामा भाग लिन र तपाईंका AI एजेण्ट सम्बन्धी प्रश्नहरूको उत्तर पाउन सक्नुहुनेछ।
अस्वीकरण: यो दस्तावेज AI अनुवाद सेवा Co-op Translator (https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको हो। हामी शुद्धताका लागि प्रयत्नशील भए तापनि कृपया जान्नुहोस् कि स्वचालित अनुवादमा त्रुटि वा अशुद्धता हुन सक्नेछ। मूल दस्तावेजलाई यसको मूल भाषामा नै आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीका लागि पेशेवर मानव अनुवाद सिफारिश गरिन्छ। हामी यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याका लागि जिम्मेवार छैनौं।