(اس سبق کی ویڈیو دیکھنے کے لیے اوپر تصویر پر کلک کریں)
جوں جوں AI ایجنٹس کا استعمال بڑھ رہا ہے، ویسے ویسے ایسے پروٹوکولز کی ضرورت بھی بڑھ رہی ہے جو معیاری کاری، سیکیورٹی اور کھلی جدت کو یقینی بنائیں۔ اس سبق میں، ہم تین پروٹوکولز کا جائزہ لیں گے جو اس ضرورت کو پورا کرنے کی کوشش کرتے ہیں - ماڈل کانٹیکسٹ پروٹوکول (MCP)، ایجنٹ ٹو ایجنٹ (A2A) اور نیچرل لینگویج ویب (NLWeb)۔
اس سبق میں ہم یہ سیکھیں گے:
• کیسے MCP AI ایجنٹس کو صارف کے کام مکمل کرنے کے لیے بیرونی ٹولز اور ڈیٹا تک رسائی دیتا ہے۔
• کیسے A2A مختلف AI ایجنٹس کے درمیان مواصلات اور تعاون کو ممکن بناتا ہے۔
• کیسے NLWeb کسی بھی ویب سائٹ پر قدرتی زبان کے انٹرفیس فراہم کرتا ہے جس سے AI ایجنٹس مواد دریافت اور اس کے ساتھ بات چیت کر سکتے ہیں۔
• AI ایجنٹس کے تناظر میں MCP، A2A، اور NLWeb کے بنیادی مقصد اور فوائد کی نشاندہی کریں۔
• یہ وضاحت کریں کہ ہر پروٹوکول LLMs، ٹولز، اور دیگر ایجنٹس کے درمیان مواصلات اور تعامل کو کیسے آسان بناتا ہے۔
• پیچیدہ ایجنٹک نظام بنانے میں ہر پروٹوکول کے مختلف کردار کو پہچانیں۔
ماڈل کانٹیکسٹ پروٹوکول (MCP) ایک کھلا معیار ہے جو ایپلیکیشنز کو LLMs کو کانٹیکسٹ اور ٹولز فراہم کرنے کا معیاری طریقہ دیتا ہے۔ یہ ایک “جامع اڈاپٹر” فراہم کرتا ہے مختلف ڈیٹا سورسز اور ٹولز کے لیے جس سے AI ایجنٹس ایک مستقل طریقے سے جڑ سکتے ہیں۔
آئیے MCP کے اجزاء، براہ راست API استعمال کے مقابلے میں فوائد، اور یہ کہ AI ایجنٹس MCP سرور کو کیسے استعمال کر سکتے ہیں، کا جائزہ لیں۔
MCP کلائنٹ-سرور آرکیٹیکچر پر کام کرتا ہے اور مرکزی اجزاء یہ ہیں:
• ہوسٹس وہ LLM ایپلیکیشنز ہیں (مثلاً VSCode جیسا کوڈ ایڈیٹر) جو MCP سرور کے ساتھ کنکشن شروع کرتے ہیں۔
• کلائنٹس ہوسٹ ایپلیکیشن کے اندر اجزاء ہیں جو سرورز کے ساتھ ایک-سے-ایک کنکشن قائم کرتے ہیں۔
• سرورز ہلکے پھلکے پروگرامز ہوتے ہیں جو مخصوص صلاحیتیں فراہم کرتے ہیں۔
پروٹوکول میں تین بنیادی پرمیٹیوز شامل ہیں جو MCP سرور کی صلاحیتیں ہیں:
• ٹولز: یہ مخصوص اعمال یا فنکشنز ہیں جنہیں AI ایجنٹ کال کر کے کوئی کارروائی انجام دیتا ہے۔ مثلاً، موسم کی سروس “get weather” ٹول فراہم کر سکتی ہے، یا ای کامرس سرور “purchase product” ٹول دے سکتا ہے۔ MCP سرور ہر ٹول کا نام، وضاحت، اور ان پٹ/آؤٹ پٹ اسکیمہ اپنی صلاحیتوں کی فہرست میں اشتہار دیتا ہے۔
• وسائل: یہ صرف پڑھنے کے لیے ڈیٹا آئٹمز یا دستاویزات ہوتے ہیں جو MCP سرور فراہم کر سکتا ہے، اور کلائنٹس جب بھی چاہیں انہیں حاصل کر سکتے ہیں۔ مثالوں میں فائل کے مواد، ڈیٹا بیس ریکارڈز، یا لاگ فائلز شامل ہیں۔ وسائل متن (جیسے کوڈ یا JSON) یا بائنری (جیسے تصاویر یا PDFs) ہو سکتے ہیں۔
• پرومپٹس: یہ پیشگی تیار کردہ سانچے ہیں جو مجوزہ پرومپٹس فراہم کرتے ہیں، جس سے زیادہ پیچیدہ ورک فلو کی اجازت ملتی ہے۔
MCP AI ایجنٹس کے لیے اہم فوائد پیش کرتا ہے:
• ڈائنامک ٹول دریافت: ایجنٹس سرور سے دستیاب ٹولز کی فہرست اور ان کی وضاحتیں متحرک طور پر حاصل کر سکتے ہیں۔ روایتی APIs کے برعکس، جن کے لیے اکثر انٹیگریشن کے لیے اسٹاٹک کوڈنگ کی ضرورت ہوتی ہے اور کسی بھی تبدیلی پر کوڈ اپ ڈیٹ کرنا پڑتا ہے، MCP ایک “ایک بار انٹیگریٹ کریں” طریقہ کار دیتا ہے، جو زیادہ لچک دار ہے۔
• LLMs کے درمیان انٹراپریبلٹی: MCP مختلف LLMs کے درمیان کام کرتا ہے، بنیادی ماڈلز تبدیل کرنے کے لیے لچک دیتا ہے تاکہ بہتر کارکردگی حاصل کی جا سکے۔
• معیاری سیکیورٹی: MCP ایک معیاری توثیقی طریقہ شامل کرتا ہے، جو اضافی MCP سرورز تک رسائی کے لیے اسکیل ایبلٹی بہتر بناتا ہے۔ یہ مختلف APIs کے لیے مختلف چابیاں اور توثیق کی اقسام سنبھالنے سے آسان ہے۔

تصور کریں کہ ایک صارف MCP سے چلنے والے AI اسسٹنٹ کی مدد سے فلائٹ بک کرنا چاہتا ہے۔
کنکشن: AI اسسٹنٹ (MCP کلائنٹ) ایک ایئرلائن کی فراہم کردہ MCP سرور سے جڑتا ہے۔
ٹول دریافت: کلائنٹ ایئرلائن کے MCP سرور سے پوچھتا ہے، “آپ کے پاس کون سے دستیاب ٹولز ہیں؟” سرور “search flights” اور “book flights” جیسے ٹولز کی فہرست واپس کرتا ہے۔
ٹول کال: پھر آپ AI اسسٹنٹ سے کہتے ہیں، “براہ کرم پورٹ لینڈ سے ہونولولو کی فلائٹ تلاش کریں۔” AI اسسٹنٹ اپنے LLM کے ذریعے پہچانتا ہے کہ اسے “search flights” ٹول کال کرنا ہے اور متعلقہ پیرامیٹرز (اصل مقام، منزل) MCP سرور کو بھیجتا ہے۔
عمل درآمد اور جواب: MCP سرور ایک ریپر کے طور پر ایئرلائن کی داخلی بکنگ API کو کال کرتا ہے۔ پھر فلائٹ معلومات (مثلاً JSON ڈیٹا) وصول کر کے AI اسسٹنٹ کو بھیج دیتا ہے۔
مزید تعامل: AI اسسٹنٹ فلائٹ آپشنز پیش کرتا ہے۔ جب آپ فلائٹ منتخب کرتے ہیں، اسسٹنٹ شاید اسی MCP سرور پر “book flight” ٹول کال کر کے بکنگ مکمل کر دیتا ہے۔
جبکہ MCP LLMs کو ٹولز سے جوڑنے پر مرکوز ہے، ایجنٹ ٹو ایجنٹ (A2A) پروٹوکول ایک قدم آگے بڑھ کر مختلف AI ایجنٹس کے درمیان بات چیت اور تعاون کو ممکن بناتا ہے۔ A2A مختلف تنظیموں، ماحولیات، اور ٹیکنالوجی اسٹیکس کے AI ایجنٹس کو جوڑتا ہے تاکہ مشترکہ کام مکمل کیا جا سکے۔
اب ہم A2A کے اجزاء اور فوائد کا جائزہ لیں گے، اور یہ دیکھیں گے کہ اسے ہماری سفری ایپلیکیشن میں کیسے استعمال کیا جا سکتا ہے۔
A2A ایجنٹس کے درمیان بات چیت اور مل کر صارف کے ذیلی کام مکمل کرنے پر فوکس کرتا ہے۔ پروٹوکول کا ہر جزو اس میں مدد دیتا ہے:
جیسے MCP سرور ٹولز کی فہرست شیئر کرتا ہے، ایجنٹ کارڈ میں شامل ہوتا ہے:
ایجنٹ ایگزیکیوٹر کا کام ہے صارف کی گفتگو کا سیاق و سباق دور دراز ایجنٹ کو پہنچانا تاکہ وہ کام سمجھ سکے۔ A2A سرور میں، ایجنٹ اپنے LLM کا استعمال کرتے ہوئے آنے والی درخواستوں کی تجزیہ کرتا ہے اور اپنے اندرونی ٹولز سے کام انجام دیتا ہے۔
جب دور دراز ایجنٹ مطلوبہ کام مکمل کر لیتا ہے، تو اس کا کام ایک آرٹیفیکٹ کے طور پر تیار ہوتا ہے۔ ایک آرٹیفیکٹ ایجنٹ کے کام کا نتیجہ رکھتا ہے، کیا مکمل ہوا کی وضاحت، اور پروٹوکول کے ذریعے بھیجا گیا متنی سیاق۔ آرٹیفیکٹ بھیجنے کے بعد دور دراز ایجنٹ سے کنکشن بند کر دی جاتی ہے جب تک دوبارہ ضرورت نہ ہو۔
یہ جزو اپڈیٹس اور پیغامات بھیجنے کے لیے استعمال ہوتا ہے۔ ایجنٹک نظاموں میں یہ بہت اہم ہے تاکہ کام مکمل ہونے سے پہلے ایجنٹس کے درمیان کنکشن بند نہ ہو، خاص طور پر جب کام مکمل کرنے میں زیادہ وقت لگتا ہو۔
• بہتر تعاون: یہ مختلف فروشندگان اور پلیٹ فارمز کے ایجنٹس کو بات چیت، سیاق و سباق شیئر کرنے، اور مل کر کام کرنے کے قابل بناتا ہے، جس سے روایتی طور پر جدا نظاموں میں خودکاری کی روانی ممکن ہوتی ہے۔
• ماڈل منتخب کرنے کی لچک: ہر A2A ایجنٹ اپنے استعمال کے لیے LLM منتخب کر سکتا ہے، جس سے ایجنٹ کے لحاظ سے بہتر یا مخصوص ماڈلز کا استعمال ممکن ہوتا ہے، برخلاف MCP کے کچھ منظرناموں میں ایک LLM کے استعمال کے۔
• ان بلٹ توثیق: توثیق A2A پروٹوکول میں براہ راست شامل ہے، جو ایجنٹ کے تعاملات کے لیے مضبوط سیکیورٹی فریم ورک فراہم کرتا ہے۔

آئیے ہمارے سفر کی بکنگ کے منظرنامے کو مزید بڑھائیں، لیکن اس بار A2A استعمال کرتے ہوئے۔
صارف کی درخواست کثیر ایجنٹ کو: صارف “Travel Agent” A2A کلائنٹ/ایجنٹ سے بات کرتا ہے، مثلاً “براہ کرم اگلے ہفتے ہونولولو کے لیے مکمل سفر بک کریں، جس میں فلائٹس، ہوٹل اور کرایہ کی گاڑی شامل ہو”۔
Travel Agent کی تنظیم کاری: Travel Agent اس پیچیدہ درخواست کو وصول کرتا ہے۔ یہ اپنے LLM کا استعمال کرتا ہے تاکہ کام کو سمجھ کر مخصوص ایجنٹس سے بات چیت کرے۔
ایجنٹس کے درمیان مواصلات: Travel Agent A2A پروٹوکول استعمال کرتے ہوئے مختلف ایجنٹس سے جڑتا ہے جیسے “Airline Agent”، “Hotel Agent”، اور “Car Rental Agent” جو مختلف کمپنیوں کے ہوتے ہیں۔
ذیلی کام کی تقسیم: Travel Agent یہ کام مخصوص ایجنٹس کو بھیجتا ہے (مثلاً “ہونولولو کے لیے فلائٹس تلاش کریں”، “ہوٹل بک کریں”، “گاڑی کرایہ پر لیں”)۔ ہر ایجنٹ اپنے LLM اور اپنے ٹولز کے ذریعہ (جو شاید MCP سرورز بھی ہوں) اپنا کام انجام دیتا ہے۔
جامع جواب: جب تمام ذیلی ایجنٹس کام مکمل کر لیتے ہیں، Travel Agent نتائج (فلائٹ کی تفصیلات، ہوٹل کی تصدیق، گاڑی کی بکنگ) کو مرتب کر کے صارف کو جامع، چیٹ طرز کا جواب بھیجتا ہے۔
ویب سائٹس طویل عرصے سے صارفین کے لیے انٹرنیٹ پر معلومات اور ڈیٹا تک رسائی کا بنیادی ذریعہ رہی ہیں۔
آئیے NLWeb کے مختلف اجزاء، NLWeb کے فوائد، اور یہ ہمارے سفر کی ایپلیکیشن میں کیسے کام کرتا ہے کا جائزہ لیں۔
NLWeb ایپلیکیشن (کور سروس کوڈ): وہ نظام جو قدرتی زبان کے سوالات کو پروسیس کرتا ہے۔ یہ پلیٹ فارم کے مختلف حصوں کو جوڑ کر جوابات بناتا ہے۔ آپ اسے ویب سائٹ کی قدرتی زبان کی خصوصیات کو چلانے والا انجن سمجھ سکتے ہیں۔
NLWeb پروٹوکول: یہ ویب سائٹ کے ساتھ قدرتی زبان کی بات چیت کے لیے بنیادی اصولوں کا مجموعہ ہے۔ یہ جوابات JSON فارمیٹ میں بھیجتا ہے (اکثر Schema.org استعمال کرتا ہے)۔ اس کا مقصد “AI Web” کے لیے سادہ بنیاد بنانا ہے، جیسے HTML نے آن لائن دستاویزات شیئر کرنا ممکن بنایا۔
MCP سرور (ماڈل کانٹیکسٹ پروٹوکول اینڈپوائنٹ): ہر NLWeb سیٹ اپ ایک MCP سرور بھی ہوتا ہے۔ اس کا مطلب ہے کہ یہ ٹولز (جیسے “ask” طریقہ) اور ڈیٹا دوسرے AI نظاموں کے ساتھ شیئر کر سکتا ہے۔ عملی طور پر، یہ ویب سائٹ کے مواد اور صلاحیتوں کو AI ایجنٹس کے قابل استعمال بنا دیتا ہے، جس سے ویب سائٹ وسیع “ایجنٹ ماحولیاتی نظام” کا حصہ بن جاتی ہے۔
ایمبیڈنگ ماڈلز: یہ ماڈلز ویب سائٹ کے مواد کو اعدادی نمائندگیوں (ویٹرز) میں تبدیل کرتے ہیں۔ یہ ویٹرز معانی کو اس انداز میں قید کرتے ہیں جسے کمپیوٹرز موازنہ اور تلاش کر سکتے ہیں۔ یہ خاص ڈیٹا بیس میں محفوظ کیے جاتے ہیں، اور صارفین یہ منتخب کر سکتے ہیں کہ کون سا ایمبیڈنگ ماڈل استعمال کریں۔
ویٹر ڈیٹا بیس (حاصل کرنے کا میکانزم): یہ ڈیٹا بیس ویب سائٹ کے مواد کی ایمبیڈنگز ذخیرہ کرتا ہے۔ جب کوئی سوال کرتا ہے، NLWeb ویٹر ڈیٹا بیس کو چیک کرتا ہے تاکہ سب سے متعلقہ معلومات جلدی سے تلاش کرے۔ یہ مماثلت کی بنیاد پر ممکنہ جوابات کی فہرست دیتا ہے۔ NLWeb مختلف ویٹر سٹوریج سسٹمز جیسے Qdrant، Snowflake، Milvus، Azure AI Search، اور Elasticsearch کے ساتھ کام کرتا ہے۔

ہماری سفر کی بکنگ ویب سائٹ پر غور کریں، لیکن اس بار یہ NLWeb سے چل رہی ہے۔
ڈیٹا انٹیک: موجودہ پروڈکٹ کیٹلاگز (مثلاً فلائٹ کی فہرست، ہوٹل کی وضاحتیں، ٹور پیکیجز) Schema.org کے مطابق فارمیٹ کیے جاتے ہیں یا RSS فیڈز کے ذریعے لوڈ کیے جاتے ہیں۔ NLWeb کے ٹولز اس منظم ڈیٹا کو لے کر ایمبیڈنگز بناتے ہیں اور انہیں مقامی یا ریموٹ ویٹر ڈیٹا بیس میں محفوظ کرتے ہیں۔
قدرتی زبان میں سوال (انسان): ایک صارف ویب سائٹ پر آتا ہے اور مینو نیویگیٹ کرنے کے بجائے چیٹ انٹرفیس میں ٹائپ کرتا ہے: “ہونولولو میں اگلے ہفتے کے لیے خاندان دوست ہوٹل تلاش کریں جس میں سوئمنگ پول ہو”۔
NLWeb پراسیسنگ: NLWeb ایپلیکیشن یہ سوال وصول کرتا ہے۔ یہ سوال کو سمجھنے کے لیے LLM کو بھیجتا ہے اور ساتھ ہی اسی وقت ویٹر ڈیٹا بیس میں متعلقہ ہوٹل کی فہرست تلاش کرتا ہے۔
صحیح نتائج: LLM ڈیٹا بیس کے تلاش نتائج کی وضاحت میں مدد دیتا ہے، “خاندانی دوستانہ”، “سوئمنگ پول”، اور “ہونولولو” کے معیار کی بنیاد پر بہترین میچز منتخب کرتا ہے، اور پھر فطری زبان میں جواب تیار کرتا ہے۔ اہم بات یہ ہے کہ جواب ویب سائٹ کے اصلی ہوٹلز سے متعلق ہوتا ہے، جعلی معلومات سے بچتا ہے۔
AI ایجنٹ کا تعامل: چونکہ NLWeb ایک MCP سرور کے طور پر کام کرتا ہے، ایک بیرونی AI سفر کا ایجنٹ بھی ویب سائٹ کے NLWeb انسٹینس سے جڑ سکتا ہے۔ AI ایجنٹ ask MCP طریقہ استعمال کرتے ہوئے ویب سائٹ سے براہ راست سوال کر سکتا ہے: ask("کیا ہونولولو علاقے میں اچھے ویگن ریستوران ہیں جو ہوٹل تجویز کرتا ہے؟")۔ NLWeb انسٹینس اس کو پراسیس کرے گا، اپنے ریستوران کی معلومات کے ڈیٹا بیس (اگر لوڈ کی گئی ہو) سے فائدہ اٹھاتے ہوئے، اور منظم JSON جواب واپس کرے گا۔
Microsoft Foundry Discord میں شامل ہوں تاکہ دیگر سیکھنے والوں سے مل سکیں، آفس آورز میں شرکت کریں اور اپنے AI ایجنٹس کے سوالات کے جواب حاصل کریں۔
ذمہ داری سے آزاد:
اس دستاویز کا ترجمہ AI ترجمہ سروس Co-op Translator کے ذریعے کیا گیا ہے۔ جبکہ ہم درستگی کے لئے کوشاں ہیں، براہ کرم اس بات سے آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستیاں ہو سکتی ہیں۔ اصل دستاویز اپنی مادری زبان میں ماخذِ توثیق سمجھی جانی چاہیے۔ اہم معلومات کے لئے پیشہ ور انسانی ترجمہ تجویز کیا جاتا ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تعبیر کے لئے ذمہ دار نہیں ہیں۔