![]()
Esta lição abordará:
Após concluir esta lição, você saberá como:
Exemplos de código para Microsoft Agent Framework (MAF) podem ser encontrados neste repositório nos arquivos xx-python-agent-framework e xx-dotnet-agent-framework.

Microsoft Agent Framework (MAF) é a estrutura unificada da Microsoft para construir agentes de IA. Ele oferece a flexibilidade para atender a uma ampla variedade de casos de uso agenticos vistos em ambientes de produção e pesquisa, incluindo:
Para entregar Agentes de IA em Produção, o MAF também inclui recursos para:
O Microsoft Agent Framework também é focado em ser interoperável por:
Vamos ver como esses recursos são aplicados a alguns dos conceitos principais do Microsoft Agent Framework.

Criando Agentes
A criação de agentes é feita definindo o serviço de inferência (Fornecedor de LLM), um conjunto de instruções para o Agente de IA seguir, e um nome atribuído:
agent = AzureOpenAIChatClient(credential=AzureCliCredential()).create_agent( instructions="You are good at recommending trips to customers based on their preferences.", name="TripRecommender" )
O exemplo acima usa Azure OpenAI, mas agentes podem ser criados utilizando uma variedade de serviços incluindo Microsoft Foundry Agent Service:
AzureAIAgentClient(async_credential=credential).create_agent( name="HelperAgent", instructions="You are a helpful assistant." ) as agent
OpenAI Responses, APIs ChatCompletion
agent = OpenAIResponsesClient().create_agent( name="WeatherBot", instructions="You are a helpful weather assistant.", )
agent = OpenAIChatClient().create_agent( name="HelpfulAssistant", instructions="You are a helpful assistant.", )
ou agentes remotos usando o protocolo A2A:
agent = A2AAgent( name=agent_card.name, description=agent_card.description, agent_card=agent_card, url="https://your-a2a-agent-host" )
Executando Agentes
Agentes são executados usando os métodos .run ou .run_stream para respostas não-streaming ou streaming.
result = await agent.run("What are good places to visit in Amsterdam?")
print(result.text)
async for update in agent.run_stream("What are the good places to visit in Amsterdam?"):
if update.text:
print(update.text, end="", flush=True)
Cada execução de agente também pode ter opções para customizar parâmetros como max_tokens usados pelo agente, tools que o agente pode chamar, e até o próprio model usado pelo agente.
Isto é útil em casos onde modelos ou ferramentas específicas são necessários para completar a tarefa do usuário.
Ferramentas
Ferramentas podem ser definidas tanto na definição do agente:
def get_attractions( location: Annotated[str, Field(description="The location to get the top tourist attractions for")], ) -> str: """Get the top tourist attractions for a given location.""" return f"The top attractions for {location} are."
# Ao criar um ChatAgent diretamente
agent = ChatAgent( chat_client=OpenAIChatClient(), instructions="You are a helpful assistant", tools=[get_attractions]
quanto na execução do agente:
result1 = await agent.run( "What's the best place to visit in Seattle?", tools=[get_attractions] # Ferramenta fornecida apenas para esta execução )
Threads de Agente
Threads de agente são usados para manejar conversas de múltiplas interações. Threads podem ser criados por:
get_new_thread() que permite que o thread seja salvo ao longo do tempoPara criar um thread, o código é assim:
# Crie uma nova thread.
thread = agent.get_new_thread() # Execute o agente com a thread.
response = await agent.run("Hello, I am here to help you book travel. Where would you like to go?", thread=thread)
Você pode então serializar o thread para ser armazenado para uso posterior:
# Criar uma nova thread.
thread = agent.get_new_thread()
# Executar o agente com a thread.
response = await agent.run("Hello, how are you?", thread=thread)
# Serializar a thread para armazenamento.
serialized_thread = await thread.serialize()
# Desserializar o estado da thread após carregar do armazenamento.
resumed_thread = await agent.deserialize_thread(serialized_thread)
Middleware de Agente
Agentes interagem com ferramentas e LLMs para completar tarefas dos usuários. Em certos cenários, queremos executar ou rastrear entre essas interações. Middleware de agente nos permite isso através de:
Middleware de Função
Este middleware permite executar uma ação entre o agente e uma função/ferramenta que ele irá chamar. Um exemplo de uso seria para fazer logging da chamada da função.
No código abaixo, next define se o próximo middleware ou a própria função deve ser chamado.
async def logging_function_middleware(
context: FunctionInvocationContext,
next: Callable[[FunctionInvocationContext], Awaitable[None]],
) -> None:
"""Function middleware that logs function execution."""
# Pré-processamento: Registrar antes da execução da função
print(f"[Function] Calling {context.function.name}")
# Continuar para o próximo middleware ou execução da função
await next(context)
# Pós-processamento: Registrar após a execução da função
print(f"[Function] {context.function.name} completed")
Middleware de Chat
Este middleware permite executar ou registrar uma ação entre o agente e as requisições entre o LLM.
Isto contém informações importantes como as messages que estão sendo enviadas ao serviço de IA.
async def logging_chat_middleware(
context: ChatContext,
next: Callable[[ChatContext], Awaitable[None]],
) -> None:
"""Chat middleware that logs AI interactions."""
# Pré-processamento: Registrar antes da chamada de IA
print(f"[Chat] Sending {len(context.messages)} messages to AI")
# Continuar para o próximo middleware ou serviço de IA
await next(context)
# Pós-processamento: Registrar após a resposta da IA
print("[Chat] AI response received")
Memória de Agente
Como abordado na lição Agentic Memory, memória é um elemento importante para permitir que o agente opere sobre diferentes contextos. O MAF oferece vários tipos diferentes de memórias:
Armazenamento em Memória
Esta é a memória armazenada em threads durante a execução da aplicação.
# Criar uma nova thread.
thread = agent.get_new_thread() # Executar o agente com a thread.
response = await agent.run("Hello, I am here to help you book travel. Where would you like to go?", thread=thread)
Mensagens Persistentes
Esta memória é usada ao armazenar o histórico de conversas entre diferentes sessões. É definida usando o chat_message_store_factory :
from agent_framework import ChatMessageStore
# Criar um armazenamento personalizado de mensagens
def create_message_store():
return ChatMessageStore()
agent = ChatAgent(
chat_client=OpenAIChatClient(),
instructions="You are a Travel assistant.",
chat_message_store_factory=create_message_store
)
Memória Dinâmica
Esta memória é adicionada ao contexto antes dos agentes serem executados. Estas memórias podem ser armazenadas em serviços externos como mem0:
from agent_framework.mem0 import Mem0Provider
# Usando Mem0 para capacidades avançadas de memória
memory_provider = Mem0Provider(
api_key="your-mem0-api-key",
user_id="user_123",
application_id="my_app"
)
agent = ChatAgent(
chat_client=OpenAIChatClient(),
instructions="You are a helpful assistant with memory.",
context_providers=memory_provider
)
Observabilidade de Agente
Observabilidade é importante para construir sistemas agenticos confiáveis e manuteníveis. O MAF integra-se com OpenTelemetry para fornecer rastreamento e métricas para melhor observabilidade.
from agent_framework.observability import get_tracer, get_meter
tracer = get_tracer()
meter = get_meter()
with tracer.start_as_current_span("my_custom_span"):
# fazer algo
pass
counter = meter.create_counter("my_custom_counter")
counter.add(1, {"key": "value"})
O MAF oferece fluxos de trabalho que são passos pré-definidos para completar uma tarefa e incluem agentes de IA como componentes nesses passos.
Fluxos de trabalho são compostos por diferentes componentes que permitem melhor controle do fluxo. Fluxos de trabalho também permitem orquestração multi-agente e checkpointing para salvar estados do fluxo.
Os componentes principais de um fluxo de trabalho são:
Executores
Executores recebem mensagens de entrada, realizam as tarefas designadas, e então produzem uma mensagem de saída. Isso move o fluxo para a frente na direção de completar a tarefa maior. Executores podem ser tanto agentes de IA quanto lógica customizada.
Arestas
Arestas são usadas para definir o fluxo de mensagens em um fluxo de trabalho. Elas podem ser:
Arestas Diretas - Conexões simples um para um entre executores:
from agent_framework import WorkflowBuilder
builder = WorkflowBuilder()
builder.add_edge(source_executor, target_executor)
builder.set_start_executor(source_executor)
workflow = builder.build()
Arestas Condicionais - Ativadas após certa condição ser atendida. Por exemplo, quando quartos de hotel estão indisponíveis, um executor pode sugerir outras opções.
Arestas Switch-case - Roteiam mensagens para diferentes executores baseados em condições definidas. Por exemplo, se um cliente de viagem tem acesso prioritário e suas tarefas serão tratadas por outro fluxo.
Arestas Fan-out - Enviam uma mensagem para múltiplos destinos.
Arestas Fan-in - Coletam múltiplas mensagens de diferentes executores e enviam para um destino único.
Eventos
Para fornecer melhor observabilidade nos fluxos, o MAF oferece eventos embutidos para execução, incluindo:
WorkflowStartedEvent - Início da execução do fluxoWorkflowOutputEvent - Fluxo produz uma saídaWorkflowErrorEvent - Fluxo encontra um erroExecutorInvokeEvent - Executor inicia processamentoExecutorCompleteEvent - Executor finaliza processamentoRequestInfoEvent - Uma requisição foi emitidaAs seções acima cobrem os conceitos-chave do Microsoft Agent Framework. À medida que você constrói agentes mais complexos, aqui estão alguns padrões avançados para considerar:
Exemplos de código para o Microsoft Agent Framework podem ser encontrados neste repositório nos arquivos xx-python-agent-framework e xx-dotnet-agent-framework.
Participe do Microsoft Foundry Discord para conhecer outros aprendizes, participar de horas de atendimento e esclarecer suas dúvidas sobre Agentes de IA.
Aviso Legal: Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.