جیسے جیسے AI ایجنٹس کا استعمال بڑھ رہا ہے، ویسے ہی ایسے پروٹوکولز کی ضرورت بھی بڑھ رہی ہے جو معیاری، محفوظ اور کھلی جدت کو سپورٹ کریں۔ اس سبق میں، ہم تین پروٹوکولز کا جائزہ لیں گے جو اس ضرورت کو پورا کرنے کی کوشش کر رہے ہیں - ماڈل کانٹیکسٹ پروٹوکول (MCP)، ایجنٹ ٹو ایجنٹ (A2A) اور نیچرل لینگویج ویب (NLWeb)۔
اس سبق میں ہم کور کریں گے:
• MCP کس طرح AI ایجنٹس کو بیرونی ٹولز اور ڈیٹا تک رسائی فراہم کرتا ہے تاکہ صارف کے کام مکمل کیے جا سکیں۔
• A2A کس طرح مختلف AI ایجنٹس کے درمیان مواصلات اور تعاون کو ممکن بناتا ہے۔
• NLWeb کس طرح کسی بھی ویب سائٹ پر قدرتی زبان کے انٹرفیس لاتا ہے، جس سے AI ایجنٹس مواد کو دریافت اور اس کے ساتھ تعامل کر سکتے ہیں۔
• شناخت کریں MCP، A2A، اور NLWeb کے بنیادی مقصد اور فوائد کو AI ایجنٹس کے تناظر میں۔
• وضاحت کریں کہ ہر پروٹوکول کس طرح LLMs، ٹولز، اور دیگر ایجنٹس کے درمیان مواصلات اور تعامل کو آسان بناتا ہے۔
• پہچانیں کہ ہر پروٹوکول پیچیدہ ایجنٹک سسٹمز کی تعمیر میں کیا کردار ادا کرتا ہے۔
ماڈل کانٹیکسٹ پروٹوکول (MCP) ایک کھلا معیار ہے جو LLMs کو سیاق و سباق اور ٹولز فراہم کرنے کے لیے ایپلیکیشنز کے لیے ایک معیاری طریقہ فراہم کرتا ہے۔ یہ AI ایجنٹس کو مختلف ڈیٹا ذرائع اور ٹولز سے جڑنے کے لیے ایک “یونیورسل اڈاپٹر” فراہم کرتا ہے۔
آئیے MCP کے اجزاء، براہ راست API استعمال کے مقابلے میں فوائد، اور ایک مثال دیکھتے ہیں کہ AI ایجنٹس MCP سرور کا استعمال کیسے کر سکتے ہیں۔
MCP کلائنٹ-سرور آرکیٹیکچر پر کام کرتا ہے اور اس کے بنیادی اجزاء یہ ہیں:
• ہوسٹس وہ LLM ایپلیکیشنز ہیں (جیسے کہ کوڈ ایڈیٹر VSCode) جو MCP سرور سے کنکشن شروع کرتی ہیں۔
• کلائنٹس وہ اجزاء ہیں جو ہوسٹ ایپلیکیشن کے اندر موجود ہوتے ہیں اور سرورز کے ساتھ ایک-ٹو-ون کنکشن برقرار رکھتے ہیں۔
• سرورز ہلکے پروگرام ہیں جو مخصوص صلاحیتیں فراہم کرتے ہیں۔
پروٹوکول میں تین بنیادی پرائمٹوز شامل ہیں جو MCP سرور کی صلاحیتیں ہیں:
• ٹولز: یہ الگ الگ اعمال یا فنکشنز ہیں جنہیں AI ایجنٹ کسی عمل کو انجام دینے کے لیے کال کر سکتا ہے۔ مثال کے طور پر، ایک موسم کی سروس “موسم حاصل کریں” ٹول فراہم کر سکتی ہے، یا ایک ای کامرس سرور “پروڈکٹ خریدیں” ٹول فراہم کر سکتا ہے۔ MCP سرورز اپنی صلاحیتوں کی فہرست میں ہر ٹول کا نام، تفصیل، اور ان پٹ/آؤٹ پٹ اسکیمہ اشتہار دیتے ہیں۔
• وسائل: یہ صرف پڑھنے کے قابل ڈیٹا آئٹمز یا دستاویزات ہیں جو MCP سرور فراہم کر سکتا ہے، اور کلائنٹس انہیں ضرورت کے وقت حاصل کر سکتے ہیں۔ مثالوں میں فائل کے مواد، ڈیٹا بیس ریکارڈز، یا لاگ فائلز شامل ہیں۔ وسائل متن (جیسے کوڈ یا JSON) یا بائنری (جیسے تصاویر یا PDFs) ہو سکتے ہیں۔
• پرومپٹس: یہ پہلے سے طے شدہ ٹیمپلیٹس ہیں جو تجویز کردہ پرومپٹس فراہم کرتے ہیں، جس سے زیادہ پیچیدہ ورک فلو ممکن ہوتے ہیں۔
MCP AI ایجنٹس کے لیے اہم فوائد فراہم کرتا ہے:
• ڈائنامک ٹول دریافت: ایجنٹس سرور سے دستیاب ٹولز کی فہرست اور ان کے کاموں کی وضاحت کو متحرک طور پر حاصل کر سکتے ہیں۔ یہ روایتی APIs کے برعکس ہے، جو اکثر انضمام کے لیے جامد کوڈنگ کی ضرورت ہوتی ہے، یعنی کسی بھی API تبدیلی کے لیے کوڈ اپڈیٹس کی ضرورت ہوتی ہے۔ MCP “ایک بار انضمام کریں” کا طریقہ پیش کرتا ہے، جس سے زیادہ موافقت پذیری ممکن ہوتی ہے۔
• LLMs کے درمیان انٹرآپریبلٹی: MCP مختلف LLMs کے ساتھ کام کرتا ہے، جس سے بنیادی ماڈلز کو بہتر کارکردگی کے لیے تبدیل کرنے کی لچک فراہم ہوتی ہے۔
• معیاری سیکیورٹی: MCP ایک معیاری تصدیقی طریقہ شامل کرتا ہے، اضافی MCP سرورز تک رسائی شامل کرنے پر اسکیل ایبلٹی کو بہتر بناتا ہے۔ یہ مختلف روایتی APIs کے لیے مختلف چابیاں اور تصدیقی اقسام کو منظم کرنے سے زیادہ آسان ہے۔
فرض کریں کہ ایک صارف AI اسسٹنٹ کے ذریعے فلائٹ بک کرنا چاہتا ہے جو MCP پر مبنی ہے۔
کنکشن: AI اسسٹنٹ (MCP کلائنٹ) ایک ایئرلائن کے فراہم کردہ MCP سرور سے جڑتا ہے۔
ٹول دریافت: کلائنٹ ایئرلائن کے MCP سرور سے پوچھتا ہے، “آپ کے پاس کون سے ٹولز دستیاب ہیں؟” سرور “فلائٹس تلاش کریں” اور “فلائٹس بک کریں” جیسے ٹولز کے ساتھ جواب دیتا ہے۔
ٹول انووکیشن: آپ AI اسسٹنٹ سے کہتے ہیں، “براہ کرم پورٹ لینڈ سے ہونولولو کے لیے فلائٹ تلاش کریں۔” AI اسسٹنٹ، اپنے LLM کا استعمال کرتے ہوئے، شناخت کرتا ہے کہ اسے “فلائٹس تلاش کریں” ٹول کو کال کرنے کی ضرورت ہے اور متعلقہ پیرامیٹرز (اصل، منزل) MCP سرور کو بھیجتا ہے۔
عملدرآمد اور جواب: MCP سرور، ایک ریپر کے طور پر کام کرتے ہوئے، ایئرلائن کے اندرونی بکنگ API کو اصل کال کرتا ہے۔ یہ فلائٹ کی معلومات (جیسے JSON ڈیٹا) حاصل کرتا ہے اور اسے AI اسسٹنٹ کو واپس بھیجتا ہے۔
مزید تعامل: AI اسسٹنٹ فلائٹ کے اختیارات پیش کرتا ہے۔ ایک بار جب آپ فلائٹ منتخب کرتے ہیں، اسسٹنٹ اسی MCP سرور پر “فلائٹ بک کریں” ٹول کو کال کر سکتا ہے، بکنگ مکمل کرتے ہوئے۔
جہاں MCP LLMs کو ٹولز سے جوڑنے پر توجہ مرکوز کرتا ہے، ایجنٹ ٹو ایجنٹ (A2A) پروٹوکول ایک قدم آگے بڑھتا ہے اور مختلف AI ایجنٹس کے درمیان مواصلات اور تعاون کو ممکن بناتا ہے۔ A2A مختلف تنظیموں، ماحولیات اور ٹیکنالوجی اسٹیکس کے AI ایجنٹس کو ایک مشترکہ کام مکمل کرنے کے لیے جوڑتا ہے۔
ہم A2A کے اجزاء اور فوائد کا جائزہ لیں گے، ساتھ ہی ایک مثال دیکھیں گے کہ یہ ہمارے ٹریول ایپلیکیشن میں کیسے لاگو ہو سکتا ہے۔
A2A ایجنٹس کے درمیان مواصلات کو ممکن بناتا ہے اور انہیں صارف کے ذیلی کام کو مکمل کرنے کے لیے ایک ساتھ کام کرنے دیتا ہے۔ پروٹوکول کے ہر جزو اس میں اپنا حصہ ڈالتا ہے:
جیسے MCP سرور ٹولز کی فہرست شیئر کرتا ہے، ایجنٹ کارڈ میں شامل ہوتا ہے:
ایجنٹ ایگزیکیوٹر صارف چیٹ کے سیاق و سباق کو ریموٹ ایجنٹ تک پہنچانے کا ذمہ دار ہے، تاکہ ریموٹ ایجنٹ یہ سمجھ سکے کہ کون سا کام مکمل کرنا ہے۔ A2A سرور میں، ایک ایجنٹ اپنے LLM کا استعمال کرتے ہوئے آنے والی درخواستوں کو پارس کرتا ہے اور اپنے اندرونی ٹولز کا استعمال کرتے ہوئے کام انجام دیتا ہے۔
جب ریموٹ ایجنٹ درخواست کردہ کام مکمل کر لیتا ہے، تو اس کا کام آرٹیفیکٹ کے طور پر تیار ہوتا ہے۔ آرٹیفیکٹ ایجنٹ کے کام کا نتیجہ، کیا مکمل کیا گیا کی تفصیل، اور متن کا سیاق و سباق جو پروٹوکول کے ذریعے بھیجا گیا ہے، پر مشتمل ہوتا ہے۔ آرٹیفیکٹ بھیجنے کے بعد، ریموٹ ایجنٹ کے ساتھ کنکشن اس وقت تک بند ہو جاتا ہے جب تک کہ دوبارہ ضرورت نہ ہو۔
یہ جزو اپڈیٹس کو ہینڈل کرنے اور پیغامات پاس کرنے کے لیے استعمال ہوتا ہے۔ یہ خاص طور پر پروڈکشن میں ایجنٹک سسٹمز کے لیے اہم ہے تاکہ ایجنٹس کے درمیان کنکشن اس وقت تک بند نہ ہو جب تک کہ کام مکمل نہ ہو جائے، خاص طور پر جب کام مکمل ہونے میں زیادہ وقت لگ سکتا ہو۔
• بہتر تعاون: یہ مختلف وینڈرز اور پلیٹ فارمز کے ایجنٹس کو بات چیت کرنے، سیاق و سباق شیئر کرنے، اور ایک ساتھ کام کرنے کے قابل بناتا ہے، روایتی طور پر منقطع سسٹمز کے درمیان ہموار آٹومیشن کو آسان بناتا ہے۔
• ماڈل انتخاب کی لچک: ہر A2A ایجنٹ یہ فیصلہ کر سکتا ہے کہ وہ اپنی درخواستوں کو سروس کرنے کے لیے کون سا LLM استعمال کرے، جس سے ایجنٹ کے مطابق بہتر یا فائن ٹیونڈ ماڈلز ممکن ہوتے ہیں، جیسا کہ کچھ MCP منظرناموں میں ایک واحد LLM کنکشن۔
• بلٹ ان تصدیق: تصدیق براہ راست A2A پروٹوکول میں شامل ہے، ایجنٹ کے تعاملات کے لیے ایک مضبوط سیکیورٹی فریم ورک فراہم کرتی ہے۔
آئیے ہمارے ٹریول بکنگ منظرنامے کو وسعت دیتے ہیں، لیکن اس بار A2A کا استعمال کرتے ہوئے۔
صارف کی درخواست ملٹی ایجنٹ کو: ایک صارف “ٹریول ایجنٹ” A2A کلائنٹ/ایجنٹ کے ساتھ بات چیت کرتا ہے، شاید یہ کہہ کر، “براہ کرم اگلے ہفتے ہونولولو کے لیے پورے سفر کی بکنگ کریں، جس میں فلائٹس، ہوٹل، اور کرائے کی کار شامل ہو۔”
ٹریول ایجنٹ کی آرکسٹریشن: ٹریول ایجنٹ اس پیچیدہ درخواست کو وصول کرتا ہے۔ یہ اپنے LLM کا استعمال کرتے ہوئے کام کے بارے میں سوچتا ہے اور فیصلہ کرتا ہے کہ اسے دوسرے خصوصی ایجنٹس کے ساتھ بات چیت کرنے کی ضرورت ہے۔
ایجنٹس کے درمیان مواصلات: ٹریول ایجنٹ پھر A2A پروٹوکول کا استعمال کرتے ہوئے نیچے والے ایجنٹس سے جڑتا ہے، جیسے “ایئرلائن ایجنٹ”، “ہوٹل ایجنٹ”، اور “کار رینٹل ایجنٹ” جو مختلف کمپنیوں کے ذریعے بنائے گئے ہیں۔
تفویض کردہ کام کی انجام دہی: ٹریول ایجنٹ ان خصوصی ایجنٹس کو مخصوص کام بھیجتا ہے (جیسے “ہونولولو کے لیے فلائٹس تلاش کریں”، “ہوٹل بک کریں”، “کار کرائے پر لیں”)۔ ان میں سے ہر خصوصی ایجنٹ، اپنے LLMs اور اپنے ٹولز کا استعمال کرتے ہوئے (جو خود MCP سرورز ہو سکتے ہیں)، بکنگ کے اپنے مخصوص حصے کو انجام دیتا ہے۔
مرکب شدہ جواب: ایک بار جب تمام نیچے والے ایجنٹس اپنے کام مکمل کر لیتے ہیں، ٹریول ایجنٹ نتائج (فلائٹ کی تفصیلات، ہوٹل کی تصدیق، کار رینٹل بکنگ) کو مرتب کرتا ہے اور صارف کو ایک جامع، چیٹ اسٹائل جواب بھیجتا ہے۔
ویب سائٹس طویل عرصے سے صارفین کے لیے انٹرنیٹ پر معلومات اور ڈیٹا تک رسائی کا بنیادی ذریعہ رہی ہیں۔
آئیے NLWeb کے مختلف اجزاء، فوائد اور ایک مثال دیکھتے ہیں کہ ہمارا NLWeb ٹریول ایپلیکیشن میں کیسے کام کرتا ہے۔
NLWeb ایپلیکیشن (کور سروس کوڈ): وہ نظام جو قدرتی زبان کے سوالات کو پروسیس کرتا ہے۔ یہ پلیٹ فارم کے مختلف حصوں کو جوڑتا ہے تاکہ جوابات تیار کیے جا سکیں۔ آپ اسے ویب سائٹ کی قدرتی زبان کی خصوصیات کو طاقت دینے والے انجن کے طور پر سوچ سکتے ہیں۔
NLWeb پروٹوکول: یہ ویب سائٹ کے ساتھ قدرتی زبان کے تعامل کے لیے بنیادی اصولوں کا ایک سیٹ ہے۔ یہ JSON فارمیٹ میں جوابات واپس بھیجتا ہے (اکثر Schema.org کا استعمال کرتے ہوئے)۔ اس کا مقصد “AI ویب” کے لیے ایک سادہ بنیاد بنانا ہے، بالکل اسی طرح جیسے HTML نے آن لائن دستاویزات شیئر کرنا ممکن بنایا۔
MCP سرور (ماڈل کانٹیکسٹ پروٹوکول اینڈپوائنٹ): ہر NLWeb سیٹ اپ ایک MCP سرور کے طور پر بھی کام کرتا ہے۔ اس کا مطلب ہے کہ یہ ٹولز (جیسے “پوچھیں” طریقہ) اور ڈیٹا دوسرے AI سسٹمز کے ساتھ شیئر کر سکتا ہے۔ عملی طور پر، یہ ویب سائٹ کے مواد اور صلاحیتوں کو AI ایجنٹس کے ذریعے قابل استعمال بناتا ہے، جس سے سائٹ وسیع “ایجنٹ ایکوسسٹم” کا حصہ بن جاتی ہے۔
ایمبیڈنگ ماڈلز: یہ ماڈلز ویب سائٹ کے مواد کو عددی نمائندگیوں میں تبدیل کرنے کے لیے استعمال ہوتے ہیں جنہیں ویٹرز کہا جاتا ہے۔ یہ ویٹرز معنی کو اس طرح پکڑتے ہیں کہ کمپیوٹرز ان کا موازنہ اور تلاش کر سکیں۔ انہیں ایک خاص ڈیٹا بیس میں ذخیرہ کیا جاتا ہے، اور صارفین یہ منتخب کر سکتے ہیں کہ وہ کون سا ایمبیڈنگ ماڈل استعمال کرنا چاہتے ہیں۔
ویٹر ڈیٹا بیس (ریٹریول میکانزم): یہ ڈیٹا بیس ویب سائٹ کے مواد کے ایمبیڈنگز کو ذخیرہ کرتا ہے۔ جب کوئی سوال پوچھتا ہے، NLWeb ویٹر ڈیٹا بیس کو چیک کرتا ہے تاکہ جلدی سے سب سے متعلقہ معلومات تلاش کی جا سکیں۔ یہ ممکنہ جوابات کی ایک تیز فہرست دیتا ہے، مماثلت کے لحاظ سے درجہ بندی کی گئی۔ NLWeb مختلف ویٹر اسٹوریج سسٹمز جیسے Qdrant، Snowflake، Milvus، Azure AI Search، اور Elasticsearch کے ساتھ کام کرتا ہے۔
ہمارے ٹریول بکنگ ویب سائٹ کو دوبارہ دیکھیں، لیکن اس بار یہ NLWeb کے ذریعے چل رہی ہے۔
ڈیٹا انٹیک: ٹریول ویب سائٹ کے موجودہ پروڈکٹ کیٹلاگز (جیسے فلائٹ لسٹنگز، ہوٹل کی تفصیلات، ٹور پیکجز) Schema.org کا استعمال کرتے ہوئے فارمیٹ کیے جاتے ہیں یا RSS فیڈز کے ذریعے لوڈ کیے جاتے ہیں۔ NLWeb کے ٹولز اس منظم ڈیٹا کو انٹیک کرتے ہیں، ایمبیڈنگز بناتے ہیں، اور انہیں مقامی یا ریموٹ ویٹر ڈیٹا بیس میں ذخیرہ کرتے ہیں۔
قدرتی زبان کی تلاش (انسان): ایک صارف ویب سائٹ پر جاتا ہے اور، مینو نیویگیٹ کرنے کے بجائے، چیٹ انٹرفیس میں ٹائپ کرتا ہے: “ہونولولو میں اگلے ہفتے کے لیے فیملی فرینڈلی ہوٹل تلاش کریں جس میں پول ہو۔”
NLWeb پروسیسنگ: NLWeb ایپلیکیشن اس سوال کو وصول کرتی ہے۔ یہ سوال کو سمجھنے کے لیے ایک LLM کو بھیجتی ہے اور ساتھ ہی اپنے ویٹر ڈیٹا بیس میں متعلقہ ہوٹل کی تفصیلات تلاش کرتی ہے۔
درست نتائج: LLM ڈیٹا بیس سے تلاش کے نتائج کی تشریح کرنے میں مدد کرتا ہے، “فیملی فرینڈلی”، “پول”، اور “ہونولولو” کے معیار کی بنیاد پر بہترین میچز کی شناخت کرتا ہے، اور پھر قدرتی زبان میں جواب فارمیٹ کرتا ہے۔ اہم بات یہ ہے کہ جواب ویب سائٹ کے کیٹلاگ سے اصل ہوٹلوں کا حوالہ دیتا ہے، فرضی معلومات سے گریز کرتا ہے۔
AI ایجنٹ تعامل: چونکہ NLWeb ایک MCP سرور کے طور پر کام کرتا ہے، ایک بیرونی AI
ڈسکلیمر:
یہ دستاویز AI ترجمہ سروس Co-op Translator کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔