ai-agents-for-beginners

एजेन्टिक प्रोटोकलहरू (MCP, A2A र NLWeb) प्रयोग गर्दै

एजेन्टिक प्रोटोकलहरू

जसरी AI एजेन्टहरूको प्रयोग बढ्दैछ, त्यसरी नै मानकीकरण, सुरक्षा, र खुला नवप्रवर्तनलाई समर्थन गर्ने प्रोटोकलहरूको आवश्यकता पनि बढ्दैछ। यस पाठमा, हामी तीन प्रोटोकलहरू - मोडेल कन्टेक्स्ट प्रोटोकल (MCP), एजेन्ट टु एजेन्ट (A2A) र नेचुरल ल्याङ्ग्वेज वेब (NLWeb) को बारेमा छलफल गर्नेछौं।

परिचय

यस पाठमा हामीले निम्न विषयहरू समेट्नेछौं:

• कसरी MCP ले AI एजेन्टहरूलाई बाह्य उपकरणहरू र डाटामा पहुँच प्रदान गरेर प्रयोगकर्ताको कार्य पूरा गर्न मद्दत गर्दछ।

• कसरी A2A ले विभिन्न AI एजेन्टहरू बीच संचार र सहकार्यलाई सक्षम बनाउँछ।

• कसरी NLWeb ले कुनै पनि वेबसाइटमा प्राकृतिक भाषा इन्टरफेस ल्याएर AI एजेन्टहरूलाई सामग्री पत्ता लगाउन र अन्तर्क्रिया गर्न सक्षम बनाउँछ।

सिकाइका लक्ष्यहरू

पहिचान गर्नुहोस् MCP, A2A, र NLWeb को मुख्य उद्देश्य र फाइदाहरू AI एजेन्टहरूको सन्दर्भमा।

व्याख्या गर्नुहोस् कसरी प्रत्येक प्रोटोकलले LLMs, उपकरणहरू, र अन्य एजेन्टहरू बीच संचार र अन्तर्क्रिया सहज बनाउँछ।

चिन्हित गर्नुहोस् कसरी प्रत्येक प्रोटोकलले जटिल एजेन्टिक प्रणालीहरू निर्माणमा विशिष्ट भूमिका खेल्छ।

मोडेल कन्टेक्स्ट प्रोटोकल

मोडेल कन्टेक्स्ट प्रोटोकल (MCP) एक खुला मानक हो जसले LLMs लाई सन्दर्भ र उपकरणहरू प्रदान गर्न अनुप्रयोगहरूको लागि मानकीकृत तरिका प्रदान गर्दछ। यसले AI एजेन्टहरूलाई विभिन्न डाटा स्रोतहरू र उपकरणहरूसँग एकसमान तरिकामा जडान गर्न “युनिभर्सल एडाप्टर” सक्षम बनाउँछ।

आउनुहोस् MCP का घटकहरू, प्रत्यक्ष API प्रयोगको तुलनामा फाइदाहरू, र AI एजेन्टहरूले MCP सर्भर कसरी प्रयोग गर्न सक्छन् भन्ने उदाहरण हेरौं।

MCP का मुख्य घटकहरू

MCP क्लाइन्ट-सर्भर आर्किटेक्चर मा सञ्चालन गर्दछ र मुख्य घटकहरू निम्न छन्:

होस्टहरू LLM अनुप्रयोगहरू हुन् (जस्तै, VSCode जस्तो कोड एडिटर) जसले MCP सर्भरसँग जडान सुरु गर्छ।

क्लाइन्टहरू होस्ट अनुप्रयोग भित्रका घटकहरू हुन् जसले सर्भरसँग एक-एक जडान कायम राख्छ।

सर्भरहरू हल्का कार्यक्रमहरू हुन् जसले विशिष्ट क्षमताहरू प्रदान गर्छ।

प्रोटोकलमा तीन मुख्य प्रिमिटिभहरू समावेश छन्, जुन MCP सर्भरको क्षमताहरू हुन्:

टूलहरू: यी छुट्टै कार्यहरू वा कार्यहरू हुन् जुन AI एजेन्टले कार्य गर्न कल गर्न सक्छ। उदाहरणका लागि, मौसम सेवाले “मौसम प्राप्त गर्नुहोस्” टूल प्रदान गर्न सक्छ, वा ई-कमर्स सर्भरले “उत्पादन खरिद गर्नुहोस्” टूल प्रदान गर्न सक्छ। MCP सर्भरहरूले प्रत्येक टूलको नाम, विवरण, र इनपुट/आउटपुट स्किमालाई आफ्नो क्षमताहरूको सूचीमा विज्ञापन गर्छ।

संसाधनहरू: यी पढ्न मात्र मिल्ने डाटा वस्तुहरू वा कागजातहरू हुन् जुन MCP सर्भरले प्रदान गर्न सक्छ, र क्लाइन्टहरूले तिनीहरूलाई माग अनुसार पुनःप्राप्त गर्न सक्छ। उदाहरणहरूमा फाइल सामग्रीहरू, डाटाबेस रेकर्डहरू, वा लग फाइलहरू समावेश छन्। संसाधनहरू पाठ (जस्तै कोड वा JSON) वा बाइनरी (जस्तै छविहरू वा PDFs) हुन सक्छ।

प्रम्प्टहरू: यी पूर्वनिर्धारित टेम्प्लेटहरू हुन् जसले सुझाव दिइएका प्रम्प्टहरू प्रदान गर्छ, जटिल कार्यप्रवाहहरूलाई अनुमति दिन्छ।

MCP का फाइदाहरू

MCP ले AI एजेन्टहरूको लागि महत्वपूर्ण फाइदाहरू प्रदान गर्दछ:

डायनामिक टूल डिस्कभरी: एजेन्टहरूले सर्भरबाट उपलब्ध टूलहरूको सूची र तिनीहरूले के गर्छन् भन्ने विवरण गतिशील रूपमा प्राप्त गर्न सक्छ। यो परम्परागत APIs को विपरीत हो, जसले अक्सर एकीकरणको लागि स्थिर कोडिङ आवश्यक पार्छ, जसको अर्थ कुनै पनि API परिवर्तनले कोड अपडेट आवश्यक पार्छ। MCP ले “एकपटक एकीकृत गर्नुहोस्” दृष्टिकोण प्रदान गर्दछ, जसले बढी अनुकूलता ल्याउँछ।

LLMs बीच अन्तरसञ्चालन: MCP विभिन्न LLMs मा काम गर्दछ, मुख्य मोडेलहरू स्विच गर्न लचिलोता प्रदान गर्दै प्रदर्शनको लागि मूल्याङ्कन गर्न।

मानकीकृत सुरक्षा: MCP ले मानक प्रमाणीकरण विधि समावेश गर्दछ, अतिरिक्त MCP सर्भरहरूमा पहुँच थप्दा स्केलेबिलिटी सुधार गर्दै। यो विभिन्न परम्परागत APIs को लागि विभिन्न कुञ्जीहरू र प्रमाणीकरण प्रकारहरू व्यवस्थापन गर्न भन्दा सरल छ।

MCP उदाहरण

MCP Diagram

कल्पना गर्नुहोस् कि प्रयोगकर्ताले MCP द्वारा संचालित AI सहायक प्रयोग गरेर उडान बुक गर्न चाहन्छ।

  1. जडान: AI सहायक (MCP क्लाइन्ट) एयरलाइनद्वारा प्रदान गरिएको MCP सर्भरसँग जडान गर्दछ।

  2. टूल डिस्कभरी: क्लाइन्टले एयरलाइनको MCP सर्भरलाई सोध्छ, “तपाईंसँग उपलब्ध टूलहरू के छन्?” सर्भरले “उडान खोज्नुहोस्” र “उडान बुक गर्नुहोस्” जस्ता टूलहरू प्रदान गर्दछ।

  3. टूल आह्वान: त्यसपछि तपाईं AI सहायकलाई सोध्नुहुन्छ, “कृपया पोर्टल्यान्डबाट होनोलुलुमा उडान खोज्नुहोस्।” AI सहायकले आफ्नो LLM प्रयोग गरेर “उडान खोज्नुहोस्” टूल कल गर्न आवश्यक छ भनेर पहिचान गर्दछ र सम्बन्धित प्यारामिटरहरू (उत्पत्ति, गन्तव्य) MCP सर्भरमा पास गर्दछ।

  4. कार्यान्वयन र प्रतिक्रिया: MCP सर्भरले वास्तविक एयरलाइनको आन्तरिक बुकिङ API मा कल गर्दछ। यसले उडान जानकारी (जस्तै, JSON डाटा) प्राप्त गर्दछ र AI सहायकलाई फिर्ता पठाउँछ।

  5. थप अन्तर्क्रिया: AI सहायकले उडान विकल्पहरू प्रस्तुत गर्दछ। एकपटक तपाईंले उडान चयन गरेपछि, सहायकले उही MCP सर्भरमा “उडान बुक गर्नुहोस्” टूल आह्वान गर्न सक्छ, बुकिङ पूरा गर्दै।

एजेन्ट-टु-एजेन्ट प्रोटोकल (A2A)

जहाँ MCP ले LLMs लाई उपकरणहरूसँग जडान गर्न केन्द्रित गर्दछ, एजेन्ट-टु-एजेन्ट (A2A) प्रोटोकल यसलाई अर्को स्तरमा लैजान्छ, विभिन्न AI एजेन्टहरू बीच संचार र सहकार्यलाई सक्षम बनाउँदै। A2A ले विभिन्न संगठनहरू, वातावरणहरू, र प्रविधि स्ट्याकहरूमा AI एजेन्टहरूलाई साझा कार्य पूरा गर्न जडान गर्दछ।

हामी A2A का घटकहरू र फाइदाहरूको साथसाथै हाम्रो यात्रा अनुप्रयोगमा यसलाई कसरी लागू गर्न सकिन्छ भन्ने उदाहरणको अध्ययन गर्नेछौं।

A2A का मुख्य घटकहरू

A2A ले एजेन्टहरू बीच संचार सक्षम गर्न र प्रयोगकर्ताको उप-कार्य पूरा गर्न तिनीहरूलाई सँगै काम गर्न केन्द्रित गर्दछ। प्रोटोकलका प्रत्येक घटकले यसमा योगदान पुर्‍याउँछ:

एजेन्ट कार्ड

जसरी MCP सर्भरले टूलहरूको सूची साझा गर्छ, एजेन्ट कार्डमा निम्न समावेश छ:

एजेन्ट कार्यकारी

एजेन्ट कार्यकारीले प्रयोगकर्ताको च्याटको सन्दर्भलाई टाढाको एजेन्टमा पास गर्न जिम्मेवार हुन्छ, टाढाको एजेन्टलाई यो बुझ्न आवश्यक छ कि कुन कार्य पूरा गर्न आवश्यक छ। A2A सर्भरमा, एजेन्टले आफ्नो आन्तरिक उपकरणहरू प्रयोग गरेर कार्यहरू कार्यान्वयन गर्न आउने अनुरोधहरू पार्स गर्न आफ्नो LLM प्रयोग गर्दछ।

आर्टिफ्याक्ट

एकपटक टाढाको एजेन्टले अनुरोधित कार्य पूरा गरेपछि, यसको कार्य उत्पादन आर्टिफ्याक्टको रूपमा सिर्जना हुन्छ। आर्टिफ्याक्टले एजेन्टको कार्यको परिणाम, के पूरा भयो भन्ने विवरण, र प्रोटोकल मार्फत पठाइएको पाठ सन्दर्भ समावेश गर्दछ। आर्टिफ्याक्ट पठाएपछि, टाढाको एजेन्टसँगको जडान आवश्यक नभएसम्म बन्द हुन्छ।

इभेन्ट क्व्यु

यो घटक अपडेटहरू ह्यान्डल गर्न र सन्देशहरू पास गर्न प्रयोग गरिन्छ। यो उत्पादनमा एजेन्टिक प्रणालीहरूको लागि विशेष रूपमा महत्त्वपूर्ण छ ताकि एजेन्टहरू बीचको जडान कार्य पूरा हुनु अघि बन्द नहोस्, विशेष गरी जब कार्य पूरा गर्न समय लाग्न सक्छ।

A2A का फाइदाहरू

सुधारिएको सहकार्य: यसले विभिन्न विक्रेता र प्लेटफर्मका एजेन्टहरूलाई अन्तर्क्रिया गर्न, सन्दर्भ साझा गर्न, र सँगै काम गर्न सक्षम बनाउँछ, परम्परागत रूपमा असम्बद्ध प्रणालीहरूमा सहज स्वचालनलाई सहज बनाउँछ।

मोडेल चयनको लचिलोता: प्रत्येक A2A एजेन्टले आफ्नो अनुरोधहरू सेवा गर्न कुन LLM प्रयोग गर्ने निर्णय गर्न सक्छ, एजेन्टहरू प्रति अनुकूलित वा फाइन-ट्युन गरिएको मोडेलहरू अनुमति दिँदै, केही MCP परिदृश्यहरूमा एकल LLM जडानको विपरीत।

निर्मित प्रमाणीकरण: प्रमाणीकरण A2A प्रोटोकलमा सीधा एकीकृत छ, एजेन्ट अन्तर्क्रियाको लागि बलियो सुरक्षा फ्रेमवर्क प्रदान गर्दै।

A2A उदाहरण

A2A Diagram

आउनुहोस् हाम्रो यात्रा बुकिङ परिदृश्यलाई विस्तार गरौं, तर यस पटक A2A प्रयोग गर्दै।

  1. प्रयोगकर्ताको अनुरोध मल्टि-एजेन्टमा: प्रयोगकर्ता “ट्राभल एजेन्ट” A2A क्लाइन्ट/एजेन्टसँग अन्तर्क्रिया गर्छ, सायद भन्छ, “कृपया होनोलुलुमा अर्को हप्ता उडान, होटल, र भाडाको कार सहित सम्पूर्ण यात्रा बुक गर्नुहोस्।”

  2. ट्राभल एजेन्टद्वारा समन्वय: ट्राभल एजेन्टले यो जटिल अनुरोध प्राप्त गर्दछ। यसले कार्यको बारेमा तर्क गर्न र अन्य विशेषज्ञ एजेन्टहरूसँग अन्तर्क्रिया गर्न आवश्यक छ भनेर निर्धारण गर्न आफ्नो LLM प्रयोग गर्दछ।

  3. एजेन्टहरू बीचको संचार: ट्राभल एजेन्टले A2A प्रोटोकल प्रयोग गरेर डाउनस्ट्रीम एजेन्टहरूसँग जडान गर्दछ, जस्तै “एयरलाइन एजेन्ट,” “होटल एजेन्ट,” र “कार रेन्टल एजेन्ट” जुन विभिन्न कम्पनीहरूले सिर्जना गरेका छन्।

  4. प्रतिनिधि कार्य कार्यान्वयन: ट्राभल एजेन्टले यी विशेषज्ञ एजेन्टहरूलाई विशिष्ट कार्यहरू पठाउँछ (जस्तै, “होनोलुलुमा उडानहरू खोज्नुहोस्,” “होटल बुक गर्नुहोस्,” “कार भाडामा लिनुहोस्”)। यी प्रत्येक विशेषज्ञ एजेन्टहरूले, आफ्नै LLMs चलाउँदै र आफ्नै उपकरणहरू प्रयोग गर्दै (जसले MCP सर्भरहरू पनि हुन सक्छ), बुकिङको विशिष्ट भाग प्रदर्शन गर्दछ।

  5. समेकित प्रतिक्रिया: एकपटक सबै डाउनस्ट्रीम एजेन्टहरूले आफ्नो कार्यहरू पूरा गरेपछि, ट्राभल एजेन्टले परिणामहरू (उडान विवरणहरू, होटल पुष्टि, कार भाडा बुकिङ) संकलन गर्दछ र प्रयोगकर्तालाई व्यापक, च्याट शैली प्रतिक्रिया पठाउँछ।

नेचुरल ल्याङ्ग्वेज वेब (NLWeb)

वेबसाइटहरू लामो समयदेखि इन्टरनेटमा जानकारी र डाटामा पहुँच गर्न प्रयोगकर्ताहरूको प्राथमिक तरिका भएका छन्।

आउनुहोस् NLWeb का विभिन्न घटकहरू, NLWeb का फाइदाहरू, र हाम्रो यात्रा अनुप्रयोगको उदाहरण हेरेर NLWeb कसरी काम गर्छ भन्ने अध्ययन गरौं।

NLWeb का घटकहरू

NLWeb उदाहरणद्वारा

NLWeb

हाम्रो यात्रा बुकिङ वेबसाइटलाई फेरि विचार गर्नुहोस्, तर यस पटक, यो NLWeb द्वारा संचालित छ।

  1. डाटा इन्टेक्सन: यात्रा वेबसाइटको अवस्थित उत्पादन क्याटलगहरू (जस्तै, उडान सूचीहरू, होटल विवरणहरू, टुर प्याकेजहरू) Schema.org प्रयोग गरेर ढाँचाबद्ध गरिन्छ वा RSS फिडहरू मार्फत लोड गरिन्छ। NLWeb का उपकरणहरूले यो संरचित डाटा ग्रहण गर्छ, एम्बेडिङहरू सिर्जना गर्छ, र तिनीहरूलाई स्थानीय वा टाढाको भेक्टर डाटाबेसमा भण्डारण गर्छ।

  2. प्राकृतिक भाषा क्वेरी (मानव): प्रयोगकर्ता वेबसाइटमा जान्छ र मेनुहरू नेभिगेट गर्ने सट्टा च्याट इन्टरफेसमा टाइप गर्छ: “मलाई होनोलुलुमा परिवारमैत्री होटल खोज्नुहोस् जसमा अर्को हप्ता पोखरी होस्।”

  3. NLWeb प्रक्रिया: NLWeb अनुप्रयोगले यो क्वेरी प्राप्त गर्दछ। यसले क्वेरीलाई बुझ्न LLM मा पठाउँछ र एकै समयमा यसको भेक्टर डाटाबेसमा सम्बन्धित होटल सूचीहरूको खोजी गर्छ।

  4. सटीक परिणामहरू: LLM ले डाटाबेसबाट खोज परिणामहरू व्याख्या गर्न मद्दत गर्दछ, “परिवारमैत्री,” “पोखरी,” र “होनोलुलु” मापदण्डहरूमा आधारित उत्कृष्ट मिलानहरू पहिचान गर्दछ, र त्यसपछि प्राकृतिक भाषा प्रतिक्रिया ढाँचाबद्ध गर्दछ। महत्त्वपूर्ण कुरा, प्रतिक्रिया वेबसाइटको क्याटलगबाट वास्तविक होटलहरूलाई सन्दर्भ गर्दछ, बनावटी जानकारीबाट बच्दै।

  5. AI एजेन्ट अन्तर्क्रिया: किनभने NLWeb MCP सर्भरको रूपमा सेवा गर्दछ, बाह्य AI ट्राभल एजेन्टले पनि वेबसाइटको NLWeb उदाहरणसँग जडान गर्न सक्छ। AI एजेन्टले वेबसाइटलाई सिधै सोध्न MCP विधि ask प्रयोग गर्न सक्छ: ask("होटलले सिफारिस गरेका होनोलुलु क्षेत्रमा कुनै भेगन-मैत्री रेस्टुरेन्ट छन्?")। NLWeb उदाहरणले यसलाई प्रक्रिया गर्नेछ, यसको रेस्टुरेन्ट जानकारीको डाटाबेस प्रयोग गरेर (यदि लोड गरिएको छ), र संरचित JSON प्रतिक्रिया फिर्ता गर्नेछ।

MCP/A2A/NLWeb बारे थप प्रश्नहरू छन्?

[Azure AI Foundry Discord](https://aka.ms/ai-ag


अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरी अनुवाद गरिएको हो। हामी यथासम्भव सटीकता सुनिश्चित गर्न प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छन्। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।