ai-agents-for-beginners

Menggunakan Protokol Agen (MCP, A2A dan NLWeb)

Protokol Agen

Seiring dengan pertumbuhan penggunaan agen AI, keperluan untuk protokol yang memastikan standardisasi, keselamatan, dan menyokong inovasi terbuka juga meningkat. Dalam pelajaran ini, kita akan membincangkan 3 protokol yang bertujuan memenuhi keperluan ini - Model Context Protocol (MCP), Agent to Agent (A2A) dan Natural Language Web (NLWeb).

Pengenalan

Dalam pelajaran ini, kita akan membincangkan:

• Bagaimana MCP membolehkan Agen AI mengakses alat dan data luaran untuk menyelesaikan tugas pengguna.

• Bagaimana A2A membolehkan komunikasi dan kerjasama antara agen AI yang berbeza.

• Bagaimana NLWeb membawa antara muka bahasa semula jadi ke mana-mana laman web, membolehkan Agen AI menemui dan berinteraksi dengan kandungan.

Matlamat Pembelajaran

Kenal pasti tujuan utama dan manfaat MCP, A2A, dan NLWeb dalam konteks agen AI.

Terangkan bagaimana setiap protokol memudahkan komunikasi dan interaksi antara LLM, alat, dan agen lain.

Kenali peranan unik setiap protokol dalam membina sistem agen yang kompleks.

Model Context Protocol

Model Context Protocol (MCP) adalah standard terbuka yang menyediakan cara standard untuk aplikasi memberikan konteks dan alat kepada LLM. Ini membolehkan “penyesuai sejagat” untuk pelbagai sumber data dan alat yang boleh dihubungkan oleh Agen AI dengan cara yang konsisten.

Mari kita lihat komponen MCP, manfaatnya berbanding penggunaan API langsung, dan contoh bagaimana agen AI mungkin menggunakan pelayan MCP.

Komponen Teras MCP

MCP beroperasi pada senibina klien-pelayan dan komponen terasnya adalah:

Hosts adalah aplikasi LLM (contohnya editor kod seperti VSCode) yang memulakan sambungan ke Pelayan MCP.

Clients adalah komponen dalam aplikasi host yang mengekalkan sambungan satu-ke-satu dengan pelayan.

Servers adalah program ringan yang mendedahkan keupayaan tertentu.

Protokol ini merangkumi tiga primitif teras yang merupakan keupayaan Pelayan MCP:

Tools: Ini adalah tindakan atau fungsi diskret yang boleh dipanggil oleh agen AI untuk melaksanakan sesuatu tindakan. Sebagai contoh, perkhidmatan cuaca mungkin mendedahkan alat “dapatkan cuaca”, atau pelayan e-dagang mungkin mendedahkan alat “beli produk”. Pelayan MCP mengiklankan nama, deskripsi, dan skema input/output setiap alat dalam senarai keupayaannya.

Resources: Ini adalah item data atau dokumen baca sahaja yang boleh disediakan oleh pelayan MCP, dan klien boleh mengambilnya atas permintaan. Contohnya termasuk kandungan fail, rekod pangkalan data, atau fail log. Sumber boleh berupa teks (seperti kod atau JSON) atau binari (seperti imej atau PDF).

Prompts: Ini adalah templat yang telah ditetapkan yang menyediakan cadangan prompt, membolehkan aliran kerja yang lebih kompleks.

Manfaat MCP

MCP menawarkan kelebihan yang ketara untuk Agen AI:

Penemuan Alat Dinamik: Agen boleh menerima senarai alat yang tersedia dari pelayan bersama dengan deskripsi tentang apa yang mereka lakukan. Ini berbeza dengan API tradisional, yang sering memerlukan pengkodan statik untuk integrasi, bermaksud sebarang perubahan API memerlukan kemas kini kod. MCP menawarkan pendekatan “integrasi sekali”, yang membawa kepada penyesuaian yang lebih besar.

Interoperabiliti Merentas LLM: MCP berfungsi merentas LLM yang berbeza, memberikan fleksibiliti untuk menukar model teras untuk menilai prestasi yang lebih baik.

Keselamatan Standard: MCP merangkumi kaedah pengesahan standard, meningkatkan skalabiliti apabila menambah akses kepada pelayan MCP tambahan. Ini lebih mudah daripada menguruskan kunci dan jenis pengesahan yang berbeza untuk pelbagai API tradisional.

Contoh MCP

Rajah MCP

Bayangkan seorang pengguna ingin menempah penerbangan menggunakan pembantu AI yang dikuasakan oleh MCP.

  1. Sambungan: Pembantu AI (klien MCP) menyambung ke pelayan MCP yang disediakan oleh syarikat penerbangan.

  2. Penemuan Alat: Klien bertanya kepada pelayan MCP syarikat penerbangan, “Apakah alat yang anda ada?” Pelayan menjawab dengan alat seperti “cari penerbangan” dan “tempah penerbangan”.

  3. Pemanggilan Alat: Anda kemudian meminta pembantu AI, “Sila cari penerbangan dari Portland ke Honolulu.” Pembantu AI, menggunakan LLM-nya, mengenal pasti bahawa ia perlu memanggil alat “cari penerbangan” dan menghantar parameter yang relevan (asal, destinasi) kepada pelayan MCP.

  4. Pelaksanaan dan Respons: Pelayan MCP, bertindak sebagai pembungkus, membuat panggilan sebenar ke API tempahan dalaman syarikat penerbangan. Ia kemudian menerima maklumat penerbangan (contohnya, data JSON) dan menghantarnya kembali kepada pembantu AI.

  5. Interaksi Lanjutan: Pembantu AI membentangkan pilihan penerbangan. Setelah anda memilih penerbangan, pembantu mungkin memanggil alat “tempah penerbangan” pada pelayan MCP yang sama, menyelesaikan tempahan.

Protokol Agent-to-Agent (A2A)

Sementara MCP memberi tumpuan kepada menghubungkan LLM kepada alat, Protokol Agent-to-Agent (A2A) melangkah lebih jauh dengan membolehkan komunikasi dan kerjasama antara agen AI yang berbeza. A2A menghubungkan agen AI merentas organisasi, persekitaran, dan tumpukan teknologi untuk menyelesaikan tugas bersama.

Kita akan mengkaji komponen dan manfaat A2A, bersama dengan contoh bagaimana ia boleh diterapkan dalam aplikasi perjalanan kita.

Komponen Teras A2A

A2A memberi tumpuan kepada membolehkan komunikasi antara agen dan membolehkan mereka bekerjasama untuk menyelesaikan subtugas pengguna. Setiap komponen protokol menyumbang kepada ini:

Kad Agen

Serupa dengan bagaimana pelayan MCP berkongsi senarai alat, Kad Agen mempunyai:

Pelaksana Agen

Pelaksana Agen bertanggungjawab untuk menyampaikan konteks perbualan pengguna kepada agen jauh, yang diperlukan oleh agen jauh untuk memahami tugas yang perlu diselesaikan. Dalam pelayan A2A, agen menggunakan Model Bahasa Besar (LLM) sendiri untuk menganalisis permintaan masuk dan melaksanakan tugas menggunakan alat dalaman mereka sendiri.

Artefak

Setelah agen jauh menyelesaikan tugas yang diminta, hasil kerjanya dicipta sebagai artefak. Artefak mengandungi hasil kerja agen, deskripsi tentang apa yang telah diselesaikan, dan konteks teks yang dihantar melalui protokol. Setelah artefak dihantar, sambungan dengan agen jauh ditutup sehingga diperlukan lagi.

Barisan Acara

Komponen ini digunakan untuk mengendalikan kemas kini dan menyampaikan mesej. Ia amat penting dalam pengeluaran untuk sistem agenik bagi mengelakkan sambungan antara agen ditutup sebelum tugas diselesaikan, terutamanya apabila masa penyelesaian tugas boleh mengambil masa yang lebih lama.

Manfaat A2A

Kerjasama Dipertingkatkan: Ia membolehkan agen dari vendor dan platform yang berbeza berinteraksi, berkongsi konteks, dan bekerjasama, memudahkan automasi lancar merentas sistem yang secara tradisional tidak bersambung.

Fleksibiliti Pemilihan Model: Setiap agen A2A boleh memutuskan LLM mana yang digunakan untuk melayani permintaannya, membolehkan model dioptimumkan atau disesuaikan untuk setiap agen, tidak seperti sambungan LLM tunggal dalam beberapa senario MCP.

Pengesahan Terbina Dalam: Pengesahan diintegrasikan terus ke dalam protokol A2A, menyediakan rangka kerja keselamatan yang kukuh untuk interaksi agen.

Contoh A2A

Rajah A2A

Mari kita kembangkan senario tempahan perjalanan kita, tetapi kali ini menggunakan A2A.

  1. Permintaan Pengguna kepada Multi-Agen: Seorang pengguna berinteraksi dengan “Agen Perjalanan” klien/agen A2A, mungkin dengan berkata, “Sila tempah perjalanan lengkap ke Honolulu untuk minggu depan, termasuk penerbangan, hotel, dan kereta sewa.”

  2. Orkestrasi oleh Agen Perjalanan: Agen Perjalanan menerima permintaan kompleks ini. Ia menggunakan LLM-nya untuk memikirkan tugas dan menentukan bahawa ia perlu berinteraksi dengan agen khusus lain.

  3. Komunikasi Antara Agen: Agen Perjalanan kemudian menggunakan protokol A2A untuk menyambung kepada agen hiliran, seperti “Agen Syarikat Penerbangan,” “Agen Hotel,” dan “Agen Kereta Sewa” yang dicipta oleh syarikat yang berbeza.

  4. Pelaksanaan Tugas yang Didelegasikan: Agen Perjalanan menghantar tugas khusus kepada agen khusus ini (contohnya, “Cari penerbangan ke Honolulu,” “Tempah hotel,” “Sewa kereta”). Setiap agen khusus ini, menjalankan LLM mereka sendiri dan menggunakan alat dalaman mereka sendiri (yang mungkin pelayan MCP sendiri), melaksanakan bahagian khusus mereka dalam tempahan.

  5. Respons Terkonsolidasi: Setelah semua agen hiliran menyelesaikan tugas mereka, Agen Perjalanan menyusun hasilnya (butiran penerbangan, pengesahan hotel, tempahan kereta sewa) dan menghantar respons gaya perbualan yang komprehensif kembali kepada pengguna.

Natural Language Web (NLWeb)

Laman web telah lama menjadi cara utama untuk pengguna mengakses maklumat dan data di seluruh internet.

Mari kita lihat komponen NLWeb yang berbeza, manfaat NLWeb dan contoh bagaimana NLWeb berfungsi dengan melihat aplikasi perjalanan kita.

Komponen NLWeb

NLWeb melalui Contoh

NLWeb

Pertimbangkan laman web tempahan perjalanan kita sekali lagi, tetapi kali ini, ia dikuasakan oleh NLWeb.

  1. Pengambilan Data: Katalog produk sedia ada laman web perjalanan (contohnya, senarai penerbangan, deskripsi hotel, pakej lawatan) diformatkan menggunakan Schema.org atau dimuatkan melalui suapan RSS. Alat NLWeb mengambil data berstruktur ini, mencipta embedding, dan menyimpannya dalam pangkalan data vektor tempatan atau jauh.

  2. Pertanyaan Bahasa Semula Jadi (Manusia): Seorang pengguna melawat laman web dan, bukannya menavigasi menu, menaip ke dalam antara muka sembang: “Cari saya hotel mesra keluarga di Honolulu dengan kolam renang untuk minggu depan”.

  3. Pemprosesan NLWeb: Aplikasi NLWeb menerima pertanyaan ini. Ia menghantar pertanyaan kepada LLM untuk pemahaman dan serentak mencari pangkalan data vektornya untuk senarai hotel yang relevan.

  4. Hasil Tepat: LLM membantu mentafsir hasil carian dari pangkalan data, mengenal pasti padanan terbaik berdasarkan kriteria “mesra keluarga,” “kolam renang,” dan “Honolulu,” dan kemudian memformat respons bahasa semula jadi. Yang penting, respons merujuk kepada hotel sebenar dari katalog laman web, mengelakkan maklumat yang direka-reka.

  5. Interaksi Agen AI: Oleh kerana NLWeb berfungsi sebagai pelayan MCP, agen perjalanan AI luaran juga boleh menyambung ke contoh NLWeb laman web ini. Agen AI boleh menggunakan kaedah ask MCP untuk bertanya terus kepada laman web: ask("Adakah terdapat restoran mesra vegan di kawasan Honolulu yang disyorkan oleh hotel?"). Contoh NLWeb akan memproses ini, memanfaatkan pangkalan data maklumat restoran (jika dimuatkan), dan mengembalikan respons JSON berstruktur.

Ada Lagi Soalan tentang MCP/A2A/NLWeb?

Sertai Azure AI Foundry Discord untuk bertemu dengan pelajar lain, menghadiri sesi soal jawab, dan mendapatkan jawapan kepada soalan anda tentang Agen AI.

Sumber


Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat penting, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.