ai-agents-for-beginners

एजेंटिक प्रोटोकॉलचा वापर (MCP, A2A आणि NLWeb)

Agentic Protocols

(या धड्याचा व्हिडिओ पाहण्यासाठी वरील चित्रावर क्लिक करा)

AI एजंट्सच्या वापराबरोबरच मानकीकरण, सुरक्षा आणि खुले नवोपक्रम यासाठी प्रोटोकॉलची गरज वाढत आहे. या धड्यात, आपण या गरजेची पूर्तता करण्यासाठी तीन प्रोटोकॉल पहाणार आहोत - मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP), एजंट ते एजंट (A2A) आणि नैसर्गिक भाषा वेब (NLWeb).

परिचय

या धड्यात आपण पाहणार आहोत:

• AI एजंट्सना वापरकर्त्यांच्या कामांचे पूर्ण करण्यासाठी बाह्य साधने आणि डेटा कसा वापरता येतो ते MCP कसे सक्षम करते.

• वेगवेगळ्या AI एजंट्समध्ये संवाद आणि सहकार्य कसे A2A द्वारे शक्य होते.

• कोणत्याही वेबसाइटवर नैसर्गिक भाषा इंटरफेस उपस्थित करून AI एजंट्सना विषय शोधणे व संवाद साधण्यास NLWeb कसे मदत करते.

शिकण्याचे उद्दिष्ट

• AI एजंट्सच्या संदर्भात MCP, A2A, आणि NLWeb चे मुख्य उद्दिष्ट आणि फायदे ओळखणे.

• प्रत्येक प्रोटोकॉल LLMs, साधने आणि इतर एजंट्स दरम्यान संवाद आणि परस्पर क्रिया कशी सुलभ करते ते स्पष्टीकरण करणे.

• जटिल एजेंटिक सिस्टम तयार करण्यामध्ये प्रत्येक प्रोटोकॉलच्या वेगळ्या भूमिका ओळखणे.

मॉडल कॉन्टेक्स्ट प्रोटोकॉल

Model Context Protocol (MCP) हा एक खुला मानक आहे जो अनुप्रयोगांना LLMs साठी संदर्भ आणि साधने प्रदान करण्यासाठी एक प्रमाणित मार्ग देतो. यामुळे विविध डेटा स्रोतांशी आणि साधनांशी एकसारखा कनेक्शन संभवतो, जो AI एजंट्ससाठी “सार्वत्रिक अॅडॉप्टर” प्रमाणे काम करतो.

चला MCP चे घटक, थेट API वापराशी तुलना आणि AI एजंट्स MCP सर्व्हरचा कसा वापर करू शकतात याचे उदाहरण पाहूया.

MCP चे प्राथमिक घटक

MCP क्लायंट-सर्व्हर आर्किटेक्चर वर चालतो आणि प्राथमिक घटक आहेत:

Hosts हे LLM अनुप्रयोग आहेत (उदा. VSCode सारखा कोड संपादक) जे MCP सर्व्हरशी कनेक्शन सुरू करतात.

Clients हे होस्ट अनुप्रयोगातले घटक आहेत जे सर्व्हरशी एकापेक्षा एक कनेक्शन राखतात.

Servers हे हलके प्रोग्राम्स आहेत जे विशिष्ट क्षमता उघडतात.

प्रोटोकॉलमध्ये असलेले तीन मुख्य प्रिमिटिव्ह म्हणजे MCP सर्व्हरच्या क्षमता:

Tools: AI एजंट्स वापरू शकतील ते स्वतंत्र क्रिया किंवा फंक्शन्स. उदा., हवामान सेवा “get weather” टूल देऊ शकते, किंवा ई-कॉमर्स सर्व्हर “purchase product” टूल. MCP सर्व्हर प्रत्येक टूलचे नाव, वर्णन आणि इनपुट/आउटपुट स्कीमा capability सूचीमध्ये जाहीर करतो.

Resources: हे वाचन-फक्त डेटा आयटम किंवा दस्तऐवज आहेत जे MCP सर्व्हर प्रदान करू शकतो, आणि क्लायंट्स विनंतीनुसार ते मिळवू शकतात. उदा. फाइल सामग्री, डेटाबेस नोंदी किंवा लॉग फाइल्स. हे टेक्स्ट किंवा बायनरी स्वरुपात असू शकतात.

Prompts: पूर्वनिर्धारित टेम्प्लेट्स जे अधिक जटिल कार्यप्रवाहासाठी सुचवलेले प्रॉम्प्ट्स देतात.

MCP चे फायदे

MCP AI एजंट्ससाठी महत्वाचे फायदे देतो:

डायनॅमिक टूल शोध: एजंट्सना एका सर्व्हरवरून उपलब्ध साधनांची यादी व त्यांचे वर्णन मिळतात. यामुळे पारंपारिक API सारखे स्थिर कोडिंगची गरज नाही, ज्यामुळे API बदलताना कोड अपडेट करावा लागतो. MCP मध्ये “एकदा समाकलित करा” ही पद्धत आहे, ज्यामुळे जास्त लवचिकता मिळते.

LLMs मध्ये परस्परसंवाद: MCP वेगवेगळ्या LLMs सोबत चालतो, ज्यामुळे चांगली कामगिरी तपासण्यासाठी मुख्य मॉडेल बदलता येते.

मानकीकृत सुरक्षा: MCP मध्ये प्रमाणित केलेले पद्धत आहे, ज्यामुळे नवीन MCP सर्व्हर जोडताना स्केलेबिलिटी सुधारते. पारंपारिक API प्रमाणे विविध कीज व प्रमाणीकरण प्रकार हाताळण्यापेक्षा सोपे.

MCP उदाहरण

MCP Diagram

समजून घ्या एखादा वापरकर्ता MCP ने चालणाऱ्या AI सहाय्यकाचा वापर करून फ्लाइट बुक करू इच्छितो.

  1. कनेक्शन: AI सहाय्यक (MCP क्लायंट) एखाद्या एअरलाईनने दिलेला MCP सर्व्हरशी कनेक्ट होतो.

  2. टूल शोध: क्लायंट एअरलाईनच्या MCP सर्व्हरला विचारतो, “तुमच्याकडे कोणती टूल्स उपलब्ध आहेत?” सर्व्हर “search flights” आणि “book flights” सारखे टूल्स उत्तर म्हणून पाठवतो.

  3. टूलची विनंती: आपण AI सहाय्यकाला म्हणता, “कृपया पोर्टलंड पासून होनोलुलू पर्यंत फ्लाइट शोधा.” AI सहाय्यक त्याचा LLM वापरून “search flights” टूल कॉल करण्याचा निर्णय घेतो व MCP सर्व्हरला आवश्यक पॅरामिटर्स देतो.

  4. कार्यवाहित व प्रतिसाद: MCP सर्व्हर एअरलाईनच्या अंतर्गत बुकिंग API कॉल करतो, फ्लाइट माहिती (उदा. JSON डेटा) प्राप्त करतो व AI सहाय्यकाला परत पाठवतो.

  5. अधिक संवाद: AI सहाय्यक फ्लाइट पर्याय दाखवतो. आपण फ्लाइट निवडल्यानंतर तो “book flight” टूल कॉल करून बुकिंग पूर्ण करेल.

एजंट-टू-एजंट प्रोटोकॉल (A2A)

MCP जिथे LLMs ला साधनांशी जोडते, तिथे Agent-to-Agent (A2A) प्रोटोकॉल वेगळ्या AI एजंट्समध्ये संवाद व सहकार्य आणतो. A2A वेगवेगळ्या संघटना, पर्यावरणे व तंत्रज्ञान स्टॅकवर AI एजंट्सना जोडते आणि कॉमन टास्क पूर्ण करण्यास सक्षम करते.

आपण A2A चे घटक, फायदे आणि आमच्या प्रवास अ‍ॅप्लिकेशनवर त्याचा उपयोग कसा होऊ शकतो ते पाहूया.

A2A चे प्राथमिक घटक

A2A एजंट्समधील संवाद व सहकार्य सक्षम करण्यावर लक्ष केंद्रित करतो. प्रोटोकॉलचे प्रत्येक घटक यासाठी योगदान देतात:

Agent Card

जसे MCP सर्व्हर टूल्सची यादी शेअर करतो, तसे Agent Card मध्ये:

Agent Executor

Agent Executor वापरकर्त्याच्या संवादाचा संदर्भ रिमोट एजंटकडे पाठवण्याचे काम करतो. रिमोट एजंटला टास्क समजून घेण्यासाठी हा संदर्भ आवश्यक असतो. A2A सर्व्हरमध्ये एजंट त्याचा स्वतःचा LLM वापरून येणाऱ्या विनंतीचे विश्लेषण करतो आणि आपले अंतर्गत साधने वापरून टास्क पूर्ण करतो.

Artifact

रिमोट एजंटने टास्क पूर्ण केल्यानंतर त्याचा परिणाम एक artifact म्हणून तयार होतो. artifact मध्ये एजंटच्या कामाचा निकाल, पूर्ण केलेल्या कामाचे वर्णन, आणि प्रोटोकॉलद्वारे पाठवलेला मजकूर संदर्भ असतो. artifact पाठवल्यानंतर एजंटशी कनेक्शन बंद होते जोपर्यंत पुन्हा गरज भासते.

Event Queue

ही प्रणाली अपडेट्स हाताळण्यासाठी व संदेश्या पाठवण्यासाठी वापरली जाते. एजंटिक सिस्टीम्स मध्ये कार्य पूर्ण होईपर्यंत एजंट्समधील कनेक्शन बंद होऊ नये म्हणून हे उत्पादनात महत्वाचे आहे, विशेषतः जेव्हा काम पूर्ण होण्यास वेळ लागतो.

A2A चे फायदे

सुधारित सहकार्य: वेगवेगळ्या विक्रेते व प्लॅटफॉर्म मधील एजंट्स संवाद साधू शकतात, संदर्भ शेअर करू शकतात व एकत्र काम करू शकतात, ज्यामुळे पूर्वी वेगळ्या असलेल्या सिस्टम्स दरम्यान सहज स्वयंचलन शक्य होते.

मॉडेल निवडण्याची लवचिकता: प्रत्येक A2A एजंट आपला LLM निवडतो, ज्यामुळे एजंटनिहाय ऑप्टिमाइझ किंवा फाईन-ट्यून मॉडेल् वापरता येतात, MCP सारख्या एकाच LLM कनेक्शनपेक्षा.

इनबिल्ट प्रमाणीकरण: A2A प्रोटोकॉलमध्ये प्रमाणीकरण समाकलित आहे, ज्यामुळे एजंट संवादासाठी मजबूत सुरक्षा उपलब्ध होते.

A2A उदाहरण

A2A Diagram

आमच्या प्रवास बुकिंग परिस्थितीवर हलकी पकड देऊ, पण यावेळी A2A वापरून.

  1. वापरकर्त्याची विनंती मल्टि-एजंटला: वापरकर्ता “Travel Agent” A2A क्लायंट/एजंटशी संभाषण करतो, “कृपया पुढील आठवड्यासाठी होनोलुलूला पूर्ण ट्रिप बुक करा, फ्लाइट्स, हॉटेल, आणि कार भाड्याने समाविष्ट करा”.

  2. Travel Agent द्वारे नियोजन: Travel Agent या जटिल विनंतीला प्राप्त करतो. त्याचा LLM टास्क समजून घेतो आणि इतर विशेष एजंट्सशी संवाद करण्याची गरज ओळखतो.

  3. एजंटमधील संवाद: Travel Agent नंतर A2A प्रोटोकॉल वापरून downstream एजंट्सशी जोडतो, जसे “Airline Agent”, “Hotel Agent” आणि “Car Rental Agent” ज्यांना वेगवेगळ्या कंपन्यांनी तयार केले आहे.

  4. कार्य सोपवणे: Travel Agent हे विशिष्ट टास्क (उदा., “होनोलुलू साठी फ्लाइट शोधा”, “हॉटेल बुक करा”, “कार भाड्याने घे”) या एजंट्सना देतो. प्रत्येक एजंट त्याचा LLM आणि अंतर्गत साधने (MCP सर्व्हर असू शकतात) वापरून आपला भाग पूर्ण करतो.

  5. एकत्रित प्रतिसाद: सर्व एजंट्स जेव्हा काम पूर्ण करतात, तेव्हा Travel Agent फ्लाइट तपशील, हॉटेल पुष्टी, कार भाड्याने बुकिंग यांचा संकलन करतो व वापरकर्त्यास चॅट-स्टाइल उत्तर पाठवतो.

नैसर्गिक भाषा वेब (NLWeb)

वेबसाइट्स अनेक काळापासून वापरकर्त्यांना इंटरनेटवरील माहिती व डेटा मिळवण्याचा प्राथमिक मार्ग आहेत.

चला NLWeb चे विविध घटक पाहूया, NLWeb चे फायदे व आमच्या प्रवास अ‍ॅप्लिकेशनवर NLWeb चे कार्य कसे आहे ते पाहूया.

NLWeb चे घटक

NLWeb चे उदाहरण

NLWeb

पुन्हा आमच्या प्रवास बुकिंग वेबसाइटचा विचार करूया, परंतु यावेळी ती NLWeb ने संचालित आहे.

  1. डेटा प्रविष्टि: प्रवास वेबसाइटवरील विद्यमान उत्पादन कॅटलॉग्स (उदा. फ्लाइट लिस्टिंग्ज, हॉटेल वर्णने, टूर पॅकेजेस) Schema.org वापरून फॉरमॅट केले जातात किंवा RSS फीड्सद्वारे लोड केले जातात. NLWeb ची साधने ही रचलेली डेटाचे एम्बेडिंग तयार करतात आणि स्थानिक किंवा दूरस्थ वेक्टर डेटाबेसमध्ये संग्रह करतात.

  2. नैसर्गिक भाषा विचारणा (माणूस): वापरकर्ता वेबसाइटवर येतो आणि मेनूच्या ऐवजी चॅट इंटरफेसमध्ये टाइप करतो: “पुढील आठवड्यासाठी होनोलुलूमध्ये कुटुंब-योग्य स्विमिंग पूलसह हॉटेल शोधा”.

  3. NLWeb प्रक्रिया: NLWeb अनुप्रयोग हा प्रश्न प्राप्त करतो. LLM ला समजून घेण्यासाठी पाठवतो आणि एकाच वेळी वेक्टर डेटाबेसमध्ये संबंधित हॉटेल लिस्ट शोधतो.

  4. योग्य निकाल: LLM डेटाबेसच्या शोध निकालाचा अर्थ लावण्यात मदत करतो, “कुटुंब-योग्य”, “पूल”, आणि “होनोलुलू” निकषांवर सर्वोत्तम जुळणी शोधतो, आणि नैसर्गिक भाषेत उत्तर फॉरमॅट करतो. महत्त्वाचे म्हणजे, उत्तरांमध्ये वेबसाइटच्या कॅटलॉगमधील वास्तविक हॉटेलांचा उल्लेख असतो, तयार केलेली माहिती नाही.

  5. AI एजंट संवाद: NLWeb MCP सर्व्हर म्हणून कार्य करते, त्यामुळे बाह्य AI ट्रॅव्हल एजंट वेबसाइटच्या NLWeb इंस्टन्सशी जोडू शकतो. AI एजंट ask MCP पद्धत वापरून वेबसाइटला प्रश्न विचारू शकतो: ask("Are there any vegan-friendly restaurants in the Honolulu area recommended by the hotel?"). NLWeb इंस्टन्स हा प्रक्रिया करेल, रेस्टॉरंट माहितीचा डेटाबेस वापरून उत्तर JSON स्वरूपात परत करेल.

MCP/A2A/NLWeb विषयी आणखी प्रश्न आहेत का?

Microsoft Foundry Discord मध्ये सामील व्हा, इतर शिकणाऱ्यांसोबत भेटा, कार्यालयीन तासात उपस्थित राहा आणि आपल्या AI एजंट्सच्या प्रश्नांची उत्तरे मिळवा.

संसाधने


शर्तस्वरूप उल्लेख: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator वापरून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये चुका किंवा अचूकतेच्या त्रुटी असू शकतात. मूळ भाषातील दस्तऐवज अधिकृत स्त्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी अनुवाद करण्याची शिफारस केली जाते. या अनुवादाच्या वापरामुळे उद्भवलेल्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थनिर्देशांसाठी आम्ही जबाबदार नाही.