ai-agents-for-beginners

Preskúmanie rámcov AI agentov

(Kliknite na obrázok vyššie a pozrite si video k tejto lekcii)

Preskúmajte rámce AI agentov

Rámce AI agentov sú softvérové platformy navrhnuté na zjednodušenie tvorby, nasadenia a správy AI agentov. Tieto rámce poskytujú vývojárom predpripravené komponenty, abstrakcie a nástroje, ktoré uľahčujú vývoj komplexných AI systémov.

Pomáhajú vývojárom sústrediť sa na jedinečné aspekty ich aplikácií tým, že poskytujú štandardizované prístupy k bežným výzvam pri vývoji AI agentov. Zvyšujú škálovateľnosť, prístupnosť a efektivitu pri budovaní AI systémov.

Úvod

Táto lekcia sa zameria na:

Ciele učenia

Ciele tejto lekcie sú pomôcť vám pochopiť:

Čo sú rámce AI agentov a čo umožňujú vývojárom robiť?

Tradičné AI rámce vám môžu pomôcť integrovať AI do vašich aplikácií a zlepšiť ich v nasledujúcich oblastiach:

To všetko znie skvele, však? Tak prečo potrebujeme rámce AI agentov?

Rámce AI agentov predstavujú niečo viac než len AI rámce. Sú navrhnuté na umožnenie tvorby inteligentných agentov, ktorí dokážu interagovať s používateľmi, inými agentmi a prostredím na dosiahnutie konkrétnych cieľov. Títo agenti môžu prejavovať autonómne správanie, robiť rozhodnutia a prispôsobovať sa meniacim sa podmienkam. Pozrime sa na niektoré kľúčové schopnosti umožnené rámcami AI agentov:

Takže v skratke, agenti vám umožňujú robiť viac, posunúť automatizáciu na vyššiu úroveň, vytvárať inteligentnejšie systémy, ktoré sa dokážu prispôsobiť a učiť sa zo svojho prostredia.

Ako rýchlo prototypovať, iterovať a zlepšovať schopnosti agenta?

Toto je rýchlo sa meniaca oblasť, ale existujú niektoré spoločné prvky naprieč väčšinou rámcov AI agentov, ktoré vám môžu pomôcť rýchlo prototypovať a iterovať, konkrétne modulárne komponenty, nástroje na spoluprácu a učenie v reálnom čase. Poďme sa na ne pozrieť:

Používajte modulárne komponenty

SDK ako Microsoft Semantic Kernel a LangChain ponúkajú predpripravené komponenty, ako sú AI konektory, šablóny výziev a správa pamäte.

Ako ich môžu tímy využiť: Tímy môžu rýchlo zostaviť tieto komponenty na vytvorenie funkčného prototypu bez nutnosti začínať od nuly, čo umožňuje rýchle experimentovanie a iteráciu.

Ako to funguje v praxi: Môžete použiť predpripravený parser na extrakciu informácií zo vstupu používateľa, pamäťový modul na ukladanie a získavanie údajov a generátor výziev na interakciu s používateľmi, všetko bez nutnosti vytvárať tieto komponenty od nuly.

Príklad kódu. Pozrime sa na príklady, ako môžete použiť predpripravený AI konektor so Semantic Kernel Python a .Net, ktorý používa automatické volanie funkcií na to, aby model reagoval na vstup používateľa:

# Semantic Kernel Python Example

import asyncio
from typing import Annotated

from semantic_kernel.connectors.ai import FunctionChoiceBehavior
from semantic_kernel.connectors.ai.open_ai import AzureChatCompletion, AzureChatPromptExecutionSettings
from semantic_kernel.contents import ChatHistory
from semantic_kernel.functions import kernel_function
from semantic_kernel.kernel import Kernel

# Define a ChatHistory object to hold the conversation's context
chat_history = ChatHistory()
chat_history.add_user_message("I'd like to go to New York on January 1, 2025")


# Define a sample plugin that contains the function to book travel
class BookTravelPlugin:
    """A Sample Book Travel Plugin"""

    @kernel_function(name="book_flight", description="Book travel given location and date")
    async def book_flight(
        self, date: Annotated[str, "The date of travel"], location: Annotated[str, "The location to travel to"]
    ) -> str:
        return f"Travel was booked to {location} on {date}"

# Create the Kernel
kernel = Kernel()

# Add the sample plugin to the Kernel object
kernel.add_plugin(BookTravelPlugin(), plugin_name="book_travel")

# Define the Azure OpenAI AI Connector
chat_service = AzureChatCompletion(
    deployment_name="YOUR_DEPLOYMENT_NAME", 
    api_key="YOUR_API_KEY", 
    endpoint="https://<your-resource>.azure.openai.com/",
)

# Define the request settings to configure the model with auto-function calling
request_settings = AzureChatPromptExecutionSettings(function_choice_behavior=FunctionChoiceBehavior.Auto())


async def main():
    # Make the request to the model for the given chat history and request settings
    # The Kernel contains the sample that the model will request to invoke
    response = await chat_service.get_chat_message_content(
        chat_history=chat_history, settings=request_settings, kernel=kernel
    )
    assert response is not None

    """
    Note: In the auto function calling process, the model determines it can invoke the 
    `BookTravelPlugin` using the `book_flight` function, supplying the necessary arguments. 
    
    For example:

    "tool_calls": [
        {
            "id": "call_abc123",
            "type": "function",
            "function": {
                "name": "BookTravelPlugin-book_flight",
                "arguments": "{'location': 'New York', 'date': '2025-01-01'}"
            }
        }
    ]

    Since the location and date arguments are required (as defined by the kernel function), if the 
    model lacks either, it will prompt the user to provide them. For instance:

    User: Book me a flight to New York.
    Model: Sure, I'd love to help you book a flight. Could you please specify the date?
    User: I want to travel on January 1, 2025.
    Model: Your flight to New York on January 1, 2025, has been successfully booked. Safe travels!
    """

    print(f"`{response}`")
    # Example AI Model Response: `Your flight to New York on January 1, 2025, has been successfully booked. Safe travels! ✈️🗽`

    # Add the model's response to our chat history context
    chat_history.add_assistant_message(response.content)


if __name__ == "__main__":
    asyncio.run(main())
// Semantic Kernel C# example

using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.ChatCompletion;
using System.ComponentModel;
using Microsoft.SemanticKernel.Connectors.AzureOpenAI;

ChatHistory chatHistory = [];
chatHistory.AddUserMessage("I'd like to go to New York on January 1, 2025");

var kernelBuilder = Kernel.CreateBuilder();
kernelBuilder.AddAzureOpenAIChatCompletion(
    deploymentName: "NAME_OF_YOUR_DEPLOYMENT",
    apiKey: "YOUR_API_KEY",
    endpoint: "YOUR_AZURE_ENDPOINT"
);
kernelBuilder.Plugins.AddFromType<BookTravelPlugin>("BookTravel"); 
var kernel = kernelBuilder.Build();

var settings = new AzureOpenAIPromptExecutionSettings()
{
    FunctionChoiceBehavior = FunctionChoiceBehavior.Auto()
};

var chatCompletion = kernel.GetRequiredService<IChatCompletionService>();

var response = await chatCompletion.GetChatMessageContentAsync(chatHistory, settings, kernel);

/*
Behind the scenes, the model recognizes the tool to call, what arguments it already has (location) and (date)
{

"tool_calls": [
    {
        "id": "call_abc123",
        "type": "function",
        "function": {
            "name": "BookTravelPlugin-book_flight",
            "arguments": "{'location': 'New York', 'date': '2025-01-01'}"
        }
    }
]
*/

Console.WriteLine(response.Content);
chatHistory.AddMessage(response!.Role, response!.Content!);

// Example AI Model Response: Your flight to New York on January 1, 2025, has been successfully booked. Safe travels! ✈️🗽

// Define a plugin that contains the function to book travel
public class BookTravelPlugin
{
    [KernelFunction("book_flight")]
    [Description("Book travel given location and date")]
    public async Task<string> BookFlight(DateTime date, string location)
    {
        return await Task.FromResult( $"Travel was booked to {location} on {date}");
    }
}

Z tohto príkladu vidíte, ako môžete využiť predpripravený parser na extrakciu kľúčových informácií zo vstupu používateľa, ako je pôvod, cieľ a dátum požiadavky na rezerváciu letu. Tento modulárny prístup vám umožňuje sústrediť sa na logiku na vyššej úrovni.

Využívajte nástroje na spoluprácu

Rámce ako CrewAI, Microsoft AutoGen a Semantic Kernel uľahčujú tvorbu viacerých agentov, ktorí dokážu spolupracovať.

Ako ich môžu tímy využiť: Tímy môžu navrhnúť agentov s konkrétnymi úlohami a rolami, čo umožňuje testovanie a zdokonaľovanie spoluprácnych pracovných postupov a zlepšenie celkovej efektivity systému.

Ako to funguje v praxi: Môžete vytvoriť tím agentov, kde každý agent má špecializovanú funkciu, ako je získavanie údajov, analýza alebo rozhodovanie. Títo agenti môžu komunikovať a zdieľať informácie na dosiahnutie spoločného cieľa, ako je odpovedanie na otázku používateľa alebo dokončenie úlohy.

Príklad kódu (AutoGen):

# creating agents, then create a round robin schedule where they can work together, in this case in order

# Data Retrieval Agent
# Data Analysis Agent
# Decision Making Agent

agent_retrieve = AssistantAgent(
    name="dataretrieval",
    model_client=model_client,
    tools=[retrieve_tool],
    system_message="Use tools to solve tasks."
)

agent_analyze = AssistantAgent(
    name="dataanalysis",
    model_client=model_client,
    tools=[analyze_tool],
    system_message="Use tools to solve tasks."
)

# conversation ends when user says "APPROVE"
termination = TextMentionTermination("APPROVE")

user_proxy = UserProxyAgent("user_proxy", input_func=input)

team = RoundRobinGroupChat([agent_retrieve, agent_analyze, user_proxy], termination_condition=termination)

stream = team.run_stream(task="Analyze data", max_turns=10)
# Use asyncio.run(...) when running in a script.
await Console(stream)

V predchádzajúcom kóde vidíte, ako môžete vytvoriť úlohu, ktorá zahŕňa viacerých agentov pracujúcich spoločne na analýze údajov. Každý agent vykonáva konkrétnu funkciu a úloha sa vykonáva koordináciou agentov na dosiahnutie požadovaného výsledku. Vytvorením špecializovaných agentov s konkrétnymi rolami môžete zlepšiť efektivitu a výkon úloh.

Učte sa v reálnom čase

Pokročilé rámce poskytujú schopnosti na porozumenie kontextu a adaptáciu v reálnom čase.

Ako ich môžu tímy využiť: Tímy môžu implementovať spätné väzby, kde sa agenti učia z interakcií a dynamicky upravujú svoje správanie, čo vedie k neustálemu zlepšovaniu a zdokonaľovaniu schopností.

Ako to funguje v praxi: Agenti môžu analyzovať spätnú väzbu používateľov, údaje o prostredí a výsledky úloh na aktualizáciu svojej databázy znalostí, úpravu algoritmov rozhodovania a zlepšenie výkonu v priebehu času. Tento iteratívny proces učenia umožňuje agentom prispôsobiť sa meniacim sa podmienkam a preferenciám používateľov, čím sa zvyšuje celková efektivita systému.

Aké sú rozdiely medzi rámcami AutoGen, Semantic Kernel a Azure AI Agent Service?

Existuje mnoho spôsobov, ako porovnať tieto rámce, ale pozrime sa na niektoré kľúčové rozdiely z hľadiska ich dizajnu, schopností a cieľových prípadov použitia:

AutoGen

AutoGen je open-source rámec vyvinutý laboratóriom AI Frontiers Lab spoločnosti Microsoft Research. Zameriava sa na aplikácie založené na udalostiach a distribuované agentické aplikácie, umožňujúce viaceré LLM a SLM, nástroje a pokročilé vzory dizajnu multi-agentov.

AutoGen je postavený na základnom koncepte agentov, ktorí sú autonómnymi entitami schopnými vnímať svoje prostredie, robiť rozhodnutia a vykonávať akcie na dosiahnutie konkrétnych cieľov. Agenti komunikujú prostredníctvom asynchrónnych správ, čo im umožňuje pracovať nezávisle a paralelne, čím sa zvyšuje škálovateľnosť a odozva systému.

Agenti sú založení na modeli aktérov. Podľa Wikipédie je aktér základným stavebným blokom súbežného výpočtu. V reakcii na prijatú správu môže aktér: robiť lokálne rozhodnutia, vytvárať ďalších aktérov, posielať ďalšie správy a určiť, ako reagovať na ďalšiu prijatú správu.

Prípady použitia: Automatizácia generovania kódu, úlohy analýzy údajov a budovanie vlastných agentov pre plánovanie a výskumné funkcie.

Tu sú niektoré dôležité základné koncepty AutoGen:

Tu je krátky kódový úryvok, v ktorom vytvoríte vlastného agenta s chatovacími schopnosťami:

```python
from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.messages import TextMessage
from autogen_ext.models.openai import OpenAIChatCompletionClient


class MyAgent(RoutedAgent):
    def __init__(self, name: str) -> None:
        super().__init__(name)
        model_client = OpenAIChatCompletionClient(model="gpt-4o")
        self._delegate = AssistantAgent(name, model_client=model_client)

    @message_handler
    async def handle_my_message_type(self, message: MyMessageType, ctx: MessageContext) -> None:
        print(f"{self.id.type} received message: {message.content}")
        response = await self._delegate.on_messages(
            [TextMessage(content=message.content, source="user")], ctx.cancellation_token
        )
        print(f"{self.id.type} responded: {response.chat_message.content}")
```

V predchádzajúcom kóde bol vytvorený MyAgent, ktorý dedí z RoutedAgent. Má handler správ, ktorý tlačí obsah správy a potom posiela odpoveď pomocou delegáta AssistantAgent. Zvlášť si všimnite, ako priraďujeme k self._delegate inštanciu AssistantAgent, čo je predpripravený agent schopný spracovať chatovacie odpovede.

Poďme informovať AutoGen o tomto type agenta a spustiť program:

```python

# main.py
runtime = SingleThreadedAgentRuntime()
await MyAgent.register(runtime, "my_agent", lambda: MyAgent())

runtime.start()  # Start processing messages in the background.
await runtime.send_message(MyMessageType("Hello, World!"), AgentId("my_agent", "default"))
```

V predchádzajúcom kóde sú agenti zaregistrovaní v runtime a potom je agentovi poslaná správa, čo vedie k nasledujúcemu výstupu:

```text
# Output from the console:
my_agent received message: Hello, World!
my_assistant received message: Hello, World!
my_assistant responded: Hello! How can I assist you today?
```

V predchádzajúcom kóde máme GroupChatManager, ktorý je zaregistrovaný v runtime. Tento manažér je zodpovedný za koordináciu interakcií medzi rôznymi typmi agentov, ako sú spisovatelia, ilustrátori, editori a používatelia.

Semantic Kernel + Agent Framework

Semantic Kernel je podnikový AI Orchestration SDK. Skladá sa z AI a pamäťových konektorov spolu s rámcom agenta.

Najprv pokryjme niektoré základné komponenty:

Tu máte jednoduchý príklad, ako môžete vytvoriť kernel a pridať službu chatovacej odpovede. Semantic Kernel vytvára spojenie s externou AI službou, v tomto prípade Azure OpenAI Chat Completion.

Takže to sú základy rámca Semantic Kernel, čo však Agent Framework?

Azure AI Agent Service

Azure AI Agent Service je novší prírastok, predstavený na Microsoft Ignite 2024. Umožňuje vývoj a nasadenie AI agentov s flexibilnejšími modelmi, ako je priame volanie open-source LLM, ako Llama 3, Mistral a Cohere.

Azure AI Agent Service poskytuje silnejšie mechanizmy zabezpečenia pre podniky a metódy ukladania dát, čo ho robí vhodným pre podnikové aplikácie.

Funguje okamžite s rámcami na orchestráciu multi-agentov, ako AutoGen a Semantic Kernel.

Táto služba je momentálne v Public Preview a podporuje Python a C# na tvorbu agentov.

Pomocou Semantic Kernel Python môžeme vytvoriť Azure AI Agent s používateľsky definovaným pluginom:

import asyncio
from typing import Annotated

from azure.identity.aio import DefaultAzureCredential

from semantic_kernel.agents import AzureAIAgent, AzureAIAgentSettings, AzureAIAgentThread
from semantic_kernel.contents import ChatMessageContent
from semantic_kernel.contents import AuthorRole
from semantic_kernel.functions import kernel_function


# Define a sample plugin for the sample
class MenuPlugin:
    """A sample Menu Plugin used for the concept sample."""

    @kernel_function(description="Provides a list of specials from the menu.")
    def get_specials(self) -> Annotated[str, "Returns the specials from the menu."]:
        return """
        Special Soup: Clam Chowder
        Special Salad: Cobb Salad
        Special Drink: Chai Tea
        """

    @kernel_function(description="Provides the price of the requested menu item.")
    def get_item_price(
        self, menu_item: Annotated[str, "The name of the menu item."]
    ) -> Annotated[str, "Returns the price of the menu item."]:
        return "$9.99"


async def main() -> None:
    ai_agent_settings = AzureAIAgentSettings.create()

    async with (
        DefaultAzureCredential() as creds,
        AzureAIAgent.create_client(
            credential=creds,
            conn_str=ai_agent_settings.project_connection_string.get_secret_value(),
        ) as client,
    ):
        # Create agent definition
        agent_definition = await client.agents.create_agent(
            model=ai_agent_settings.model_deployment_name,
            name="Host",
            instructions="Answer questions about the menu.",
        )

        # Create the AzureAI Agent using the defined client and agent definition
        agent = AzureAIAgent(
            client=client,
            definition=agent_definition,
            plugins=[MenuPlugin()],
        )

        # Create a thread to hold the conversation
        # If no thread is provided, a new thread will be
        # created and returned with the initial response
        thread: AzureAIAgentThread | None = None

        user_inputs = [
            "Hello",
            "What is the special soup?",
            "How much does that cost?",
            "Thank you",
        ]

        try:
            for user_input in user_inputs:
                print(f"# User: '{user_input}'")
                # Invoke the agent for the specified thread
                response = await agent.get_response(
                    messages=user_input,
                    thread_id=thread,
                )
                print(f"# {response.name}: {response.content}")
                thread = response.thread
        finally:
            await thread.delete() if thread else None
            await client.agents.delete_agent(agent.id)


if __name__ == "__main__":
    asyncio.run(main())

Základné koncepty

Azure AI Agent Service má nasledujúce základné koncepty:

Použitie: Azure AI Agent Service je navrhnutý pre podnikové aplikácie, ktoré vyžadujú bezpečné, škálovateľné a flexibilné nasadenie AI agentov.

Aký je rozdiel medzi týmito rámcami?

Zdá sa, že medzi týmito rámcami je veľa prekrytia, ale existujú kľúčové rozdiely v ich dizajne, schopnostiach a cieľových prípadoch použitia:

Stále si nie ste istí, ktorý si vybrať?

Použitie

Pozrime sa, či vám môžeme pomôcť prejsť niektoré bežné prípady použitia:

Otázka: Experimentujem, učím sa a vytváram proof-of-concept aplikácie agentov, a chcem byť schopný rýchlo vytvárať a experimentovať

Odpoveď: AutoGen by bol dobrý výber pre tento scenár, pretože sa zameriava na aplikácie založené na udalostiach, distribuované agentické aplikácie a podporuje pokročilé návrhové vzory multi-agentov.

Otázka: Čo robí AutoGen lepšou voľbou ako Semantic Kernel a Azure AI Agent Service pre tento prípad použitia?

Odpoveď: AutoGen je špeciálne navrhnutý pre aplikácie založené na udalostiach, distribuované agentické aplikácie, čo ho robí vhodným na automatizáciu úloh generovania kódu a analýzy dát. Poskytuje potrebné nástroje a schopnosti na efektívne budovanie komplexných systémov multi-agentov.

Otázka: Zdá sa, že Azure AI Agent Service by tu tiež mohol fungovať, má nástroje na generovanie kódu a viac?

Odpoveď: Áno, Azure AI Agent Service je platformová služba pre agentov a pridáva vstavané schopnosti pre viaceré modely, Azure AI Search, Bing Search a Azure Functions. Umožňuje ľahko vytvárať vašich agentov v Foundry Portáli a nasadiť ich vo veľkom.

Otázka: Stále som zmätený, dajte mi jednu možnosť

Odpoveď: Skvelou voľbou je najprv vytvoriť vašu aplikáciu v Semantic Kernel a potom použiť Azure AI Agent Service na nasadenie vášho agenta. Tento prístup vám umožňuje ľahko uchovávať vašich agentov a zároveň využívať silu na budovanie systémov multi-agentov v Semantic Kernel. Navyše, Semantic Kernel má konektor v AutoGen, čo uľahčuje používanie oboch rámcov spolu.

Poďme zhrnúť kľúčové rozdiely v tabuľke:

Rámec Zameranie Základné koncepty Použitie
AutoGen Aplikácie založené na udalostiach, distribuované agentické aplikácie Agenti, Persony, Funkcie, Dáta Generovanie kódu, úlohy analýzy dát
Semantic Kernel Porozumenie a generovanie textového obsahu podobného ľudskému Agenti, Modulárne komponenty, Spolupráca Porozumenie prirodzenému jazyku, generovanie obsahu
Azure AI Agent Service Flexibilné modely, podnikové zabezpečenie, Generovanie kódu, Volanie nástrojov Modularita, Spolupráca, Orchestrácia procesov Bezpečné, škálovateľné a flexibilné nasadenie AI agentov

Aký je ideálny prípad použitia pre každý z týchto rámcov?

Môžem integrovať svoje existujúce nástroje Azure ekosystému priamo, alebo potrebujem samostatné riešenia?

Odpoveď je áno, môžete integrovať svoje existujúce nástroje Azure ekosystému priamo s Azure AI Agent Service, najmä preto, že bol navrhnutý tak, aby bezproblémovo fungoval s inými službami Azure. Mohli by ste napríklad integrovať Bing, Azure AI Search a Azure Functions. Existuje tiež hlboká integrácia s Azure AI Foundry.

Pre AutoGen a Semantic Kernel môžete tiež integrovať služby Azure, ale môže byť potrebné volať služby Azure z vášho kódu. Ďalším spôsobom integrácie je použitie Azure SDK na interakciu so službami Azure z vašich agentov. Navyše, ako bolo spomenuté, môžete použiť Azure AI Agent Service ako orchestrátor pre vašich agentov vytvorených v AutoGen alebo Semantic Kernel, čo by poskytlo jednoduchý prístup k Azure ekosystému.

Máte ďalšie otázky o AI Agent Frameworks?

Pripojte sa k Azure AI Foundry Discord, kde sa môžete stretnúť s ďalšími študentmi, zúčastniť sa konzultačných hodín a získať odpovede na vaše otázky o AI agentoch.

Referencie

Predchádzajúca lekcia

Úvod do AI agentov a ich prípadov použitia

Nasledujúca lekcia

Porozumenie návrhovým vzorom agentov


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.