AI एजंट्सचा वापर वाढत असताना, मानकीकरण, सुरक्षा आणि खुल्या नवकल्पनांना समर्थन देणाऱ्या प्रोटोकॉल्सची गरजही वाढत आहे. या धड्यात, आम्ही तीन प्रोटोकॉल्सवर चर्चा करू - मॉडेल कॉन्टेक्स्ट प्रोटोकॉल (MCP), एजंट टू एजंट (A2A) आणि नॅचरल लँग्वेज वेब (NLWeb).
या धड्यात आपण शिकणार आहोत:
• MCP कसे AI एजंट्सना बाह्य साधने आणि डेटा वापरून वापरकर्त्याचे कार्य पूर्ण करण्यास मदत करते.
• A2A कसे वेगवेगळ्या AI एजंट्समध्ये संवाद आणि सहकार्य सक्षम करते.
• NLWeb कसे कोणत्याही वेबसाइटवर नैसर्गिक भाषा इंटरफेस आणते, ज्यामुळे AI एजंट्सना सामग्री शोधणे आणि संवाद साधणे शक्य होते.
• ओळखणे MCP, A2A, आणि NLWeb चा मुख्य उद्देश आणि AI एजंट्सच्या संदर्भात त्याचे फायदे.
• समजावून सांगणे प्रत्येक प्रोटोकॉल कसे LLMs, साधने, आणि इतर एजंट्समध्ये संवाद आणि परस्परसंवाद सुलभ करते.
• ओळखणे प्रत्येक प्रोटोकॉलची वेगवेगळी भूमिका जटिल एजेंटिक प्रणाली तयार करण्यात कशी मदत करते.
मॉडेल कॉन्टेक्स्ट प्रोटोकॉल (MCP) हा एक ओपन स्टँडर्ड आहे जो LLMs साठी कॉन्टेक्स्ट आणि साधने प्रदान करण्यासाठी मानकीकृत पद्धत उपलब्ध करून देतो. यामुळे AI एजंट्सना वेगवेगळ्या डेटा स्रोतांशी आणि साधनांशी सुसंगत पद्धतीने जोडण्यासाठी “युनिव्हर्सल अडॅप्टर” सक्षम होतो.
आम्ही MCP चे घटक, थेट API वापराच्या तुलनेत फायदे, आणि AI एजंट्स MCP सर्व्हर कसे वापरू शकतात याचे उदाहरण पाहू.
MCP क्लायंट-सर्व्हर आर्किटेक्चरवर कार्य करते आणि त्याचे मुख्य घटक आहेत:
• होस्ट्स: LLM अॅप्लिकेशन्स (उदाहरणार्थ, VSCode सारखा कोड एडिटर) जे MCP सर्व्हरशी कनेक्शन सुरू करतात.
• क्लायंट्स: होस्ट अॅप्लिकेशनमधील घटक जे सर्व्हर्सशी एक-ते-एक कनेक्शन राखतात.
• सर्व्हर्स: विशिष्ट क्षमता उघड करणारे हलके प्रोग्राम्स.
प्रोटोकॉलमध्ये MCP सर्व्हरच्या क्षमतांमध्ये तीन मुख्य घटक समाविष्ट आहेत:
• साधने: AI एजंट्स एखादे कार्य करण्यासाठी कॉल करू शकणाऱ्या स्वतंत्र क्रिया किंवा फंक्शन्स. उदाहरणार्थ, हवामान सेवा “हवामान मिळवा” साधन उघड करू शकते, किंवा ई-कॉमर्स सर्व्हर “उत्पादन खरेदी करा” साधन उघड करू शकतो. MCP सर्व्हर्स प्रत्येक साधनाचे नाव, वर्णन, आणि इनपुट/आउटपुट स्कीमा त्यांच्या क्षमतांच्या यादीत जाहिर करतात.
• संसाधने: MCP सर्व्हर प्रदान करू शकणाऱ्या वाचण्यायोग्य डेटा आयटम्स किंवा दस्तऐवज, जे क्लायंट्स मागणीनुसार पुनर्प्राप्त करू शकतात. उदाहरणे: फाइल सामग्री, डेटाबेस रेकॉर्ड्स, किंवा लॉग फाइल्स. संसाधने मजकूर (जसे कोड किंवा JSON) किंवा बायनरी (जसे प्रतिमा किंवा PDFs) असू शकतात.
• प्रॉम्प्ट्स: पूर्वनिर्धारित टेम्पलेट्स जे सुचवलेले प्रॉम्प्ट्स प्रदान करतात, अधिक जटिल कार्यप्रवाहांना सक्षम करतात.
MCP AI एजंट्ससाठी महत्त्वाचे फायदे देते:
• डायनॅमिक टूल डिस्कव्हरी: एजंट्स MCP सर्व्हरकडून उपलब्ध साधनांची यादी आणि त्यांचे कार्य काय आहे याचे वर्णन डायनॅमिकरीत्या प्राप्त करू शकतात. पारंपरिक APIs च्या तुलनेत, ज्यामध्ये अनेकदा स्थिर कोडिंग आवश्यक असते, MCP “एकदाच समाकलित करा” दृष्टिकोन देते, ज्यामुळे अधिक अनुकूलता मिळते.
• LLMs मध्ये इंटरऑपरेबिलिटी: MCP वेगवेगळ्या LLMs मध्ये कार्य करते, मुख्य मॉडेल्स बदलण्याची लवचिकता प्रदान करते.
• मानकीकृत सुरक्षा: MCP मानक प्रमाणीकरण पद्धत समाविष्ट करते, अतिरिक्त MCP सर्व्हर्समध्ये प्रवेश जोडताना स्केलेबिलिटी सुधारते.
कल्पना करा की वापरकर्ता MCP च्या सहाय्याने AI असिस्टंट वापरून फ्लाइट बुक करू इच्छित आहे.
कनेक्शन: AI असिस्टंट (MCP क्लायंट) एअरलाइनद्वारे प्रदान केलेल्या MCP सर्व्हरशी कनेक्ट होते.
साधन शोध: क्लायंट एअरलाइनच्या MCP सर्व्हरला विचारतो, “तुमच्याकडे कोणती साधने उपलब्ध आहेत?” सर्व्हर “फ्लाइट शोधा” आणि “फ्लाइट बुक करा” यासारखी साधने परत पाठवतो.
साधन वापर: तुम्ही AI असिस्टंटला विचारता, “पोर्टलँड ते होनोलुलु फ्लाइट शोधा.” AI असिस्टंट, त्याच्या LLM चा वापर करून, “फ्लाइट शोधा” साधन वापरण्याची गरज ओळखतो आणि MCP सर्व्हरला संबंधित पॅरामीटर्स (उद्गम, गंतव्य) पाठवतो.
अंमलबजावणी आणि प्रतिसाद: MCP सर्व्हर एअरलाइनच्या अंतर्गत बुकिंग API ला कॉल करतो, फ्लाइट माहिती प्राप्त करतो आणि ती AI असिस्टंटला परत पाठवतो.
पुढील संवाद: AI असिस्टंट फ्लाइट पर्याय सादर करतो. तुम्ही फ्लाइट निवडल्यानंतर, असिस्टंट MCP सर्व्हरवरील “फ्लाइट बुक करा” साधन वापरतो आणि बुकिंग पूर्ण करतो.
MCP LLMs आणि साधनांना जोडण्यावर लक्ष केंद्रित करते, तर एजंट-टू-एजंट (A2A) प्रोटोकॉल वेगवेगळ्या AI एजंट्समध्ये संवाद आणि सहकार्य सक्षम करून पुढे जातो. A2A वेगवेगळ्या संघटना, वातावरण आणि तंत्रज्ञान स्टॅक्समधील AI एजंट्सना एकत्रित कार्य पूर्ण करण्यासाठी जोडतो.
आम्ही A2A चे घटक आणि फायदे तपासू, तसेच आमच्या प्रवास अॅप्लिकेशनमध्ये ते कसे लागू होऊ शकते याचे उदाहरण पाहू.
A2A एजंट्समध्ये संवाद सक्षम करण्यावर लक्ष केंद्रित करते आणि वापरकर्त्याच्या उपकार्य पूर्ण करण्यासाठी त्यांना एकत्र काम करण्यास मदत करते. प्रोटोकॉलचे प्रत्येक घटक यासाठी योगदान देतो:
MCP सर्व्हर साधनांची यादी शेअर करतो, त्याचप्रमाणे एजंट कार्डमध्ये:
एजंट एक्झिक्युटर वापरकर्त्याच्या चॅटचा कॉन्टेक्स्ट रिमोट एजंटला पास करण्यासाठी जबाबदार असतो, रिमोट एजंटला कार्य समजण्यासाठी याची आवश्यकता असते.
रिमोट एजंटने विनंती केलेले कार्य पूर्ण केल्यानंतर, त्याचे कार्य उत्पादन आर्टिफॅक्ट म्हणून तयार होते. आर्टिफॅक्टमध्ये एजंटने पूर्ण केलेल्या कार्याचे परिणाम, वर्णन, आणि पाठवलेला मजकूर कॉन्टेक्स्ट असतो.
ही घटक अपडेट्स हाताळण्यासाठी आणि संदेश पास करण्यासाठी वापरली जाते. उत्पादनासाठी एजंटिक प्रणालींमध्ये हे महत्त्वाचे आहे, विशेषतः जेव्हा कार्य पूर्ण होण्यास जास्त वेळ लागतो.
• सहकार्य सुधारित: वेगवेगळ्या विक्रेत्यांच्या आणि प्लॅटफॉर्म्सच्या एजंट्सना संवाद साधण्यास, कॉन्टेक्स्ट शेअर करण्यास आणि एकत्र काम करण्यास सक्षम करते.
• मॉडेल निवडीची लवचिकता: प्रत्येक A2A एजंट त्याच्या विनंत्यांची सेवा करण्यासाठी कोणते LLM वापरायचे ते ठरवू शकतो.
• अंतर्गत प्रमाणीकरण: प्रमाणीकरण थेट A2A प्रोटोकॉलमध्ये समाविष्ट आहे, एजंट संवादासाठी मजबूत सुरक्षा फ्रेमवर्क प्रदान करते.
आमच्या प्रवास बुकिंग परिस्थितीचा विस्तार करू, पण यावेळी A2A वापरून.
वापरकर्ता विनंती मल्टी-एजंटला: वापरकर्ता “ट्रॅव्हल एजंट” A2A क्लायंट/एजंटशी संवाद साधतो, “होनोलुलुसाठी पुढील आठवड्यात संपूर्ण ट्रिप बुक करा, ज्यामध्ये फ्लाइट्स, हॉटेल आणि रेंटल कार समाविष्ट आहे.”
ट्रॅव्हल एजंटद्वारे समन्वय: ट्रॅव्हल एजंट ही जटिल विनंती प्राप्त करतो. तो त्याच्या LLM चा वापर करून कार्याचे कारण शोधतो आणि इतर विशेष एजंट्सशी संवाद साधण्याची गरज ओळखतो.
एजंट्समधील संवाद: ट्रॅव्हल एजंट A2A प्रोटोकॉल वापरून डाउनस्ट्रीम एजंट्सशी कनेक्ट होतो, जसे की “एअरलाइन एजंट,” “हॉटेल एजंट,” आणि “कार रेंटल एजंट.”
कार्याचे प्रतिनिधीकरण: ट्रॅव्हल एजंट या विशेष एजंट्सना विशिष्ट कार्ये पाठवतो (उदा., “होनोलुलुसाठी फ्लाइट शोधा,” “हॉटेल बुक करा,” “कार भाड्याने घ्या”).
एकत्रित प्रतिसाद: सर्व डाउनस्ट्रीम एजंट्स त्यांची कार्ये पूर्ण केल्यानंतर, ट्रॅव्हल एजंट परिणाम संकलित करतो आणि वापरकर्त्याला एक व्यापक, चॅट-स्टाइल प्रतिसाद पाठवतो.
वेबसाइट्स दीर्घकाळापासून इंटरनेटवर माहिती आणि डेटा प्रवेश करण्याचा प्राथमिक मार्ग आहेत.
आम्ही NLWeb चे वेगवेगळे घटक, फायदे आणि आमच्या प्रवास अॅप्लिकेशनद्वारे NLWeb कसे कार्य करते याचे उदाहरण पाहू.
NLWeb अॅप्लिकेशन (कोर सर्व्हिस कोड): नैसर्गिक भाषा प्रश्न प्रक्रिया करणारी प्रणाली. ही प्लॅटफॉर्मच्या वेगवेगळ्या भागांना जोडते.
NLWeb प्रोटोकॉल: वेबसाइटशी नैसर्गिक भाषा संवादासाठी नियमांचा मूलभूत संच. JSON स्वरूपात प्रतिसाद पाठवतो.
MCP सर्व्हर (मॉडेल कॉन्टेक्स्ट प्रोटोकॉल एंडपॉइंट): प्रत्येक NLWeb सेटअप MCP सर्व्हर म्हणून कार्य करते.
एम्बेडिंग मॉडेल्स: वेबसाइट सामग्रीचे संख्यात्मक प्रतिनिधित्व तयार करण्यासाठी वापरले जातात.
व्हेक्टर डेटाबेस (पुनर्प्राप्ती यंत्रणा): वेबसाइट सामग्रीचे एम्बेडिंग संग्रहित करते.
आमच्या प्रवास बुकिंग वेबसाइटचा विचार करा, पण यावेळी NLWeb वापरून.
डेटा इनजेशन: प्रवास वेबसाइटची उत्पादने NLWeb च्या साधनांद्वारे संरचित डेटा ingest करते.
नैसर्गिक भाषा क्वेरी (मानवी): वापरकर्ता वेबसाइटवर चॅट इंटरफेसमध्ये विचारतो: “होनोलुलुमध्ये पूल असलेले कौटुंबिक हॉटेल शोधा.”
NLWeb प्रक्रिया: NLWeb अॅप्लिकेशन ही क्वेरी प्राप्त करते.
अचूक परिणाम: LLM डेटाबेसमधून शोध परिणाम समजून घेते.
AI एजंट संवाद: NLWeb MCP सर्व्हर म्हणून कार्य करते.
Azure AI Foundry Discord मध्ये सामील व्हा.
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.