![]()
Bài học này sẽ bao gồm:
Sau khi hoàn thành bài học này, bạn sẽ biết cách:
Mẫu mã cho Microsoft Agent Framework (MAF) có thể được tìm thấy trong kho lưu trữ này dưới các tệp xx-python-agent-framework và xx-dotnet-agent-framework.

Microsoft Agent Framework (MAF) là framework thống nhất của Microsoft để xây dựng các AI agent. Nó cung cấp sự linh hoạt để giải quyết đa dạng các trường hợp sử dụng agentic thấy trong cả môi trường sản xuất và nghiên cứu bao gồm:
Để triển khai AI Agents trong sản xuất, MAF cũng bao gồm các tính năng cho:
Microsoft Agent Framework cũng tập trung vào khả năng tương tác bằng:
Hãy xem các tính năng này được áp dụng như thế nào cho một số khái niệm cốt lõi của Microsoft Agent Framework.

Tạo Agents
Việc tạo agent được thực hiện bằng cách định nghĩa dịch vụ suy luận (Nhà cung cấp LLM), một tập hợp các hướng dẫn để AI Agent thực hiện, và một name được gán:
agent = AzureOpenAIChatClient(credential=AzureCliCredential()).create_agent( instructions="You are good at recommending trips to customers based on their preferences.", name="TripRecommender" )
Ví dụ trên sử dụng Azure OpenAI nhưng agent có thể được tạo bằng nhiều dịch vụ khác nhau bao gồm Microsoft Foundry Agent Service:
AzureAIAgentClient(async_credential=credential).create_agent( name="HelperAgent", instructions="You are a helpful assistant." ) as agent
OpenAI Responses, các API ChatCompletion
agent = OpenAIResponsesClient().create_agent( name="WeatherBot", instructions="You are a helpful weather assistant.", )
agent = OpenAIChatClient().create_agent( name="HelpfulAssistant", instructions="You are a helpful assistant.", )
hoặc agent từ xa sử dụng giao thức A2A:
agent = A2AAgent( name=agent_card.name, description=agent_card.description, agent_card=agent_card, url="https://your-a2a-agent-host" )
Chạy Agents
Agents được chạy bằng các phương thức .run hoặc .run_stream cho các phản hồi không streaming hoặc streaming.
result = await agent.run("What are good places to visit in Amsterdam?")
print(result.text)
async for update in agent.run_stream("What are the good places to visit in Amsterdam?"):
if update.text:
print(update.text, end="", flush=True)
Mỗi lần chạy agent cũng có thể có các tùy chọn để tùy chỉnh các tham số như max_tokens được agent sử dụng, các tools mà agent có thể gọi, và thậm chí là model được sử dụng cho agent.
Điều này hữu ích trong các trường hợp cần các mô hình hoặc công cụ cụ thể để hoàn thành nhiệm vụ người dùng.
Công Cụ
Công cụ có thể được định nghĩa cả khi tạo agent:
def get_attractions( location: Annotated[str, Field(description="The location to get the top tourist attractions for")], ) -> str: """Get the top tourist attractions for a given location.""" return f"The top attractions for {location} are."
# Khi tạo một ChatAgent trực tiếp
agent = ChatAgent( chat_client=OpenAIChatClient(), instructions="You are a helpful assistant", tools=[get_attractions]
và cũng khi chạy agent:
result1 = await agent.run( "What's the best place to visit in Seattle?", tools=[get_attractions] # Công cụ chỉ được cung cấp cho lần chạy này )
Luồng Agent
Luồng Agent được dùng để xử lý các cuộc hội thoại đa lượt. Luồng có thể được tạo theo một trong hai cách:
get_new_thread() cho phép luồng được lưu lại theo thời gianĐể tạo một luồng, đoạn mã trông như sau:
# Tạo một luồng mới.
thread = agent.get_new_thread() # Chạy tác nhân với luồng.
response = await agent.run("Hello, I am here to help you book travel. Where would you like to go?", thread=thread)
Bạn có thể tuần tự hóa luồng này để lưu trữ sử dụng sau:
# Tạo một chuỗi mới.
thread = agent.get_new_thread()
# Chạy tác nhân với chuỗi.
response = await agent.run("Hello, how are you?", thread=thread)
# Tuần tự hóa chuỗi để lưu trữ.
serialized_thread = await thread.serialize()
# Giải tuần tự trạng thái chuỗi sau khi tải từ bộ nhớ.
resumed_thread = await agent.deserialize_thread(serialized_thread)
Middleware của Agent
Agents tương tác với công cụ và LLM để hoàn thành nhiệm vụ người dùng. Trong một số kịch bản, chúng ta muốn thực thi hoặc theo dõi các hành động giữa các tương tác này. Middleware cho agent cho phép làm điều đó thông qua:
Middleware cho Hàm
Middleware này cho phép thực thi một hành động giữa agent và một hàm/công cụ mà nó sẽ gọi. Ví dụ khi bạn muốn ghi lại nhật ký việc gọi hàm.
Trong đoạn mã dưới đây next định nghĩa có gọi middleware tiếp theo hoặc gọi hàm thực tế hay không.
async def logging_function_middleware(
context: FunctionInvocationContext,
next: Callable[[FunctionInvocationContext], Awaitable[None]],
) -> None:
"""Function middleware that logs function execution."""
# Tiền xử lý: Ghi lại trước khi chạy hàm
print(f"[Function] Calling {context.function.name}")
# Tiếp tục đến middleware tiếp theo hoặc thực thi hàm
await next(context)
# Hậu xử lý: Ghi lại sau khi chạy hàm
print(f"[Function] {context.function.name} completed")
Middleware Chat
Middleware này cho phép thực thi hoặc ghi lại hành động giữa agent và các yêu cầu giữa LLM.
Điều này chứa thông tin quan trọng như messages được gửi đến dịch vụ AI.
async def logging_chat_middleware(
context: ChatContext,
next: Callable[[ChatContext], Awaitable[None]],
) -> None:
"""Chat middleware that logs AI interactions."""
# Tiền xử lý: Ghi nhật ký trước khi gọi AI
print(f"[Chat] Sending {len(context.messages)} messages to AI")
# Tiếp tục tới middleware hoặc dịch vụ AI tiếp theo
await next(context)
# Hậu xử lý: Ghi nhật ký sau phản hồi của AI
print("[Chat] AI response received")
Bộ Nhớ của Agent
Như đã đề cập trong bài học Agentic Memory, bộ nhớ là yếu tố quan trọng để agent hoạt động trên các ngữ cảnh khác nhau. MAF cung cấp nhiều loại bộ nhớ khác nhau:
Lưu Trữ Trong Bộ Nhớ
Đây là bộ nhớ được lưu trong các luồng khi ứng dụng chạy.
# Tạo một luồng mới.
thread = agent.get_new_thread() # Chạy agent với luồng đó.
response = await agent.run("Hello, I am here to help you book travel. Where would you like to go?", thread=thread)
Tin Nhắn Lưu Trữ
Bộ nhớ này dùng để lưu lịch sử hội thoại qua các phiên khác nhau. Nó được định nghĩa sử dụng chat_message_store_factory:
from agent_framework import ChatMessageStore
# Tạo một kho lưu trữ tin nhắn tùy chỉnh
def create_message_store():
return ChatMessageStore()
agent = ChatAgent(
chat_client=OpenAIChatClient(),
instructions="You are a Travel assistant.",
chat_message_store_factory=create_message_store
)
Bộ Nhớ Động
Bộ nhớ này được thêm vào ngữ cảnh trước khi agents chạy. Những bộ nhớ này có thể lưu trữ trong các dịch vụ bên ngoài như mem0:
from agent_framework.mem0 import Mem0Provider
# Sử dụng Mem0 cho các khả năng bộ nhớ nâng cao
memory_provider = Mem0Provider(
api_key="your-mem0-api-key",
user_id="user_123",
application_id="my_app"
)
agent = ChatAgent(
chat_client=OpenAIChatClient(),
instructions="You are a helpful assistant with memory.",
context_providers=memory_provider
)
Khả năng Quan sát của Agent
Khả năng quan sát là quan trọng để xây dựng hệ thống agentic tin cậy và dễ bảo trì. MAF tích hợp với OpenTelemetry để cung cấp việc truy vết và đo lường cho khả năng quan sát tốt hơn.
from agent_framework.observability import get_tracer, get_meter
tracer = get_tracer()
meter = get_meter()
with tracer.start_as_current_span("my_custom_span"):
# làm gì đó
pass
counter = meter.create_counter("my_custom_counter")
counter.add(1, {"key": "value"})
MAF cung cấp các quy trình làm việc là các bước được định nghĩa sẵn để hoàn thành một nhiệm vụ và bao gồm các AI agents như các thành phần trong các bước đó.
Quy trình làm việc bao gồm các thành phần khác nhau cho phép kiểm soát luồng tốt hơn. Quy trình làm việc cũng hỗ trợ điều phối đa agent và điểm kiểm tra để lưu trạng thái quy trình làm việc.
Các thành phần cốt lõi của quy trình làm việc là:
Executor
Executor nhận các tin nhắn đầu vào, thực hiện nhiệm vụ được giao, sau đó tạo ra tin nhắn đầu ra. Điều này đẩy quy trình làm việc tiến tới hoàn thành nhiệm vụ lớn hơn. Executor có thể là AI agent hoặc logic tùy chỉnh.
Edges
Edges được dùng để định nghĩa luồng tin nhắn trong quy trình làm việc. Có thể là:
Direct Edges - Kết nối đơn giản một-một giữa các executor:
from agent_framework import WorkflowBuilder
builder = WorkflowBuilder()
builder.add_edge(source_executor, target_executor)
builder.set_start_executor(source_executor)
workflow = builder.build()
Conditional Edges - Kích hoạt sau khi điều kiện nhất định được đáp ứng. Ví dụ, khi phòng khách sạn không còn, executor có thể đề xuất lựa chọn khác.
Switch-case Edges - Định tuyến tin nhắn tới các executor khác nhau dựa trên các điều kiện định nghĩa. Ví dụ, nếu khách du lịch có quyền truy cập ưu tiên thì nhiệm vụ của họ sẽ được xử lý qua một quy trình làm việc khác.
Fan-out Edges - Gửi một tin nhắn đến nhiều mục tiêu.
Fan-in Edges - Thu thập nhiều tin nhắn từ các executor khác nhau và gửi đến một mục tiêu.
Sự kiện
Để cung cấp khả năng quan sát tốt hơn vào quy trình làm việc, MAF cung cấp các sự kiện tích hợp cho việc thực thi bao gồm:
WorkflowStartedEvent - Bắt đầu thực thi quy trình làm việcWorkflowOutputEvent - Quy trình làm việc tạo ra kết quảWorkflowErrorEvent - Quy trình làm việc gặp lỗiExecutorInvokeEvent - Executor bắt đầu xử lýExecutorCompleteEvent - Executor hoàn thành xử lýRequestInfoEvent - Một yêu cầu được gửi điCác phần trên bao gồm các khái niệm chính của Microsoft Agent Framework. Khi bạn xây dựng các agents phức tạp hơn, dưới đây là một số mẫu nâng cao cần xem xét:
Mẫu mã cho Microsoft Agent Framework có thể được tìm thấy trong kho lưu trữ này dưới các tệp xx-python-agent-framework và xx-dotnet-agent-framework.
Tham gia Microsoft Foundry Discord để gặp gỡ các người học khác, tham dự giờ làm việc và nhận câu trả lời cho các câu hỏi về AI Agents của bạn.
Tuyên bố từ chối trách nhiệm:
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator. Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ bản địa nên được coi là nguồn thông tin chính thức. Đối với những thông tin quan trọng, nên sử dụng dịch vụ dịch thuật chuyên nghiệp của con người. Chúng tôi không chịu trách nhiệm đối với bất kỳ sự hiểu lầm hoặc hiểu sai nào phát sinh từ việc sử dụng bản dịch này.