(برای مشاهده ویدیوی این درس روی تصویر بالا کلیک کنید)
ابزارها جالب هستند چون به عاملهای هوش مصنوعی اجازه میدهند مجموعه گستردهتری از قابلیتها را داشته باشند. به جای اینکه عامل فقط یک مجموعه محدود از اقدامات را انجام دهد، با افزودن یک ابزار، عامل اکنون میتواند طیف وسیعی از اقدامات را انجام دهد. در این فصل، به الگوی طراحی استفاده از ابزار میپردازیم که توضیح میدهد چگونه عاملهای هوش مصنوعی میتوانند از ابزارهای مشخص برای دستیابی به اهدافشان استفاده کنند.
در این درس، قصد داریم به پرسشهای زیر پاسخ دهیم:
پس از اتمام این درس، شما قادر خواهید بود:
الگوی طراحی استفاده از ابزار بر این تمرکز دارد که مدلهای زبانی بزرگ (LLM) توانایی تعامل با ابزارهای خارجی برای رسیدن به اهداف مشخص را داشته باشند. ابزارها کدهایی هستند که توسط یک عامل اجرا میشوند تا کارهایی را انجام دهند. یک ابزار میتواند یک تابع ساده مانند ماشین حساب باشد، یا یک فراخوان API به سرویس سوم شخص مانند جستجوی قیمت سهام یا پیشبینی آبوهوا. در زمینه عاملهای هوش مصنوعی، ابزارها به گونهای طراحی شدهاند که در پاسخ به فراخوانهای تابع تولید شده توسط مدل توسط عاملها اجرا شوند.
عاملهای هوش مصنوعی میتوانند از ابزارها برای انجام کارهای پیچیده، بازیابی اطلاعات یا اتخاذ تصمیم استفاده کنند. الگوی طراحی استفاده از ابزار اغلب در سناریوهایی استفاده میشود که تعامل پویا با سیستمهای خارجی مانند پایگاه دادهها، وبسرویسها یا مفسرهای کد مورد نیاز است. این توانایی در موارد مختلف زیر مفید است:
این بلوکها به عامل هوش مصنوعی اجازه میدهند طیف گستردهای از وظایف را انجام دهد. بیایید به عناصر کلیدی لازم برای پیادهسازی الگوی طراحی استفاده از ابزار نگاهی بیندازیم:
شمای توابع/ابزارها: تعریفهای دقیق ابزارهای موجود شامل نام تابع، هدف، پارامترهای مورد نیاز و خروجیهای مورد انتظار. این شمایهها به LLM کمک میکنند بفهمد چه ابزارهایی در دسترس است و چگونه درخواستهای معتبر بسازد.
منطق اجرای توابع: قوانین مربوط به چگونگی و زمان فراخوانی ابزارها مبتنی بر قصد کاربر و محتوای گفتگو. این ممکن است شامل ماژولهای برنامهریز، مکانیزمهای مسیردهی یا جریانهای شرطی باشد که استفاده از ابزار را به صورت پویا تعیین میکنند.
سیستم مدیریت پیام: اجزایی که جریان مکالمه بین ورودیهای کاربر، پاسخهای LLM، فراخوانی ابزار و خروجیهای آنها را مدیریت میکنند.
چارچوبِ یکپارچهسازی ابزار: زیرساختی که عامل را به ابزارهای مختلف، چه توابع ساده و چه سرویسهای خارجی پیچیده، متصل میکند.
مدیریت خطا و اعتبارسنجی: مکانیزمهایی برای مدیریت شکستها در اجرای ابزار، اعتبارسنجی پارامترها و مدیریت پاسخهای غیرمنتظره.
مدیریت وضعیت: پیگیری محتوای گفتگو، تعاملات قبلی با ابزارها و دادههای پایدار برای اطمینان از سازگاری در تعاملات چند مرحلهای.
حالا بیایید جزئیات بیشتری درباره فراخوانی توابع/ابزارها بیاموزیم.
فراخوانی تابع روش اصلی است که به مدلهای زبانی بزرگ (LLM) اجازه میدهد با ابزارها تعامل داشته باشند. شما اغلب میبینید “تابع” و “ابزار” به جای هم استفاده میشوند، زیرا “توابع” (بلوکهای کد قابل استفاده مجدد) همان “ابزارهایی” هستند که عاملها برای انجام وظایف استفاده میکنند. برای اینکه کد یک تابع فراخوانی شود، مدل زبانی باید درخواست کاربر را با توصیف توابع مقایسه کند. برای این کار یک شمای شامل توصیف همه توابع موجود به LLM ارسال میشود. سپس LLM مناسبترین تابع برای وظیفه را انتخاب کرده و نام و آرگومانهای آن را بازمیگرداند. تابع انتخاب شده اجرا میشود، پاسخ آن به LLM ارسال میگردد، و LLM با استفاده از این اطلاعات به درخواست کاربر پاسخ میدهد.
برای توسعهدهندگان جهت پیادهسازی فراخوانی تابع برای عاملها، به موارد زیر نیاز دارید:
اجازه دهید مثال گرفتن زمان فعلی در یک شهر را برای توضیح استفاده کنیم:
راهاندازی مدلی که از فراخوانی تابع پشتیبانی میکند:
همه مدلها از فراخوانی تابع پشتیبانی نمیکنند، بنابراین بررسی اینکه LLM شما این قابلیت را دارد مهم است. Azure OpenAI از فراخوانی تابع پشتیبانی میکند. میتوانیم با ایجاد کلاینت Azure OpenAI شروع کنیم.
# مشتری Azure OpenAI را مقداردهی اولیه کنید
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_AI_PROJECT_ENDPOINT"),
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-05-01-preview"
)
ایجاد یک شمای تابع:
سپس یک شمای JSON تعریف میکنیم که شامل نام تابع، شرح کاری که تابع انجام میدهد، و نامها و توضیحات پارامترهای آن است. سپس این شمایه را همراه با درخواست کاربر برای یافتن زمان در سانفرانسیسکو به کلاینت ایجاد شده ارسال میکنیم. نکته مهم این است که آنچه بازمیگردد یک فراخوان ابزار است، نه پاسخ نهایی. همانطور که پیشتر گفته شد، LLM نام تابع انتخابی برای وظیفه و آرگومانهایی که به آن داده میشود را بازمیگرداند.
# توضیح عملکرد برای مدل جهت خواندن
tools = [
{
"type": "function",
"function": {
"name": "get_current_time",
"description": "Get the current time in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city name, e.g. San Francisco",
},
},
"required": ["location"],
},
}
}
]
# پیام اولیه کاربر
messages = [{"role": "user", "content": "What's the current time in San Francisco"}]
# اولین فراخوانی API: درخواست از مدل برای استفاده از تابع
response = client.chat.completions.create(
model=deployment_name,
messages=messages,
tools=tools,
tool_choice="auto",
)
# پردازش پاسخ مدل
response_message = response.choices[0].message
messages.append(response_message)
print("Model's response:")
print(response_message)
Model's response:
ChatCompletionMessage(content=None, role='assistant', function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='call_pOsKdUlqvdyttYB67MOj434b', function=Function(arguments='{"location":"San Francisco"}', name='get_current_time'), type='function')])
کد تابعی که برای انجام وظیفه لازم است:
هنگامی که LLM تصمیم گرفت کدام تابع باید اجرا شود، کدی که وظیفه را انجام میدهد باید پیادهسازی و اجرا شود. ما میتوانیم کدی در پایتون بنویسیم که زمان فعلی را بگیرد. همچنین باید کد استخراج نام و آرگومانها از response_message را برای گرفتن نتیجه نهایی بنویسیم.
def get_current_time(location):
"""Get the current time for a given location"""
print(f"get_current_time called with location: {location}")
location_lower = location.lower()
for key, timezone in TIMEZONE_DATA.items():
if key in location_lower:
print(f"Timezone found for {key}")
current_time = datetime.now(ZoneInfo(timezone)).strftime("%I:%M %p")
return json.dumps({
"location": location,
"current_time": current_time
})
print(f"No timezone data found for {location_lower}")
return json.dumps({"location": location, "current_time": "unknown"})
# مدیریت فراخوانیهای تابع
if response_message.tool_calls:
for tool_call in response_message.tool_calls:
if tool_call.function.name == "get_current_time":
function_args = json.loads(tool_call.function.arguments)
time_response = get_current_time(
location=function_args.get("location")
)
messages.append({
"tool_call_id": tool_call.id,
"role": "tool",
"name": "get_current_time",
"content": time_response,
})
else:
print("No tool calls were made by the model.")
# دومین فراخوانی API: دریافت پاسخ نهایی از مدل
final_response = client.chat.completions.create(
model=deployment_name,
messages=messages,
)
return final_response.choices[0].message.content
get_current_time called with location: San Francisco
Timezone found for san francisco
The current time in San Francisco is 09:24 AM.
فراخوانی تابع در قلب بسیاری از طراحیهای استفاده از ابزارهای عامل قرار دارد، اگرچه پیادهسازی آن از ابتدا گاهی چالشبرانگیز است. همانطور که در درس ۲ آموختیم، چارچوبهای عاملی بلوکهای ساختمانی آماده برای پیادهسازی استفاده از ابزار فراهم میکنند.
در اینجا چند مثال از چگونگی پیادهسازی الگوی طراحی استفاده از ابزار با استفاده از چارچوبهای عاملی مختلف ارائه شده است:
چارچوب عامل مایکروسافت یک چارچوب هوش مصنوعی متنباز برای ساخت عاملهای هوش مصنوعی است. این چارچوب فرآیند استفاده از فراخوانی تابع را ساده میکند، به گونهای که شما میتوانید ابزارها را به عنوان توابع پایتون با دکوراتور @tool تعریف کنید. چارچوب ارتباط دوطرفه بین مدل و کد شما را مدیریت میکند. همچنین دسترسی به ابزارهای پیشساخته مثل جستجوی فایل و مفسر کد را از طریق AzureAIProjectAgentProvider فراهم میکند.
نمودار زیر فرآیند فراخوانی تابع با چارچوب عامل مایکروسافت را نشان میدهد:

در چارچوب عامل مایکروسافت، ابزارها به عنوان توابع دکوراتور شده تعریف میشوند. میتوانیم تابع get_current_time که پیشتر دیدیم را به یک ابزار با استفاده از دکوراتور @tool تبدیل کنیم. چارچوب به صورت خودکار تابع و پارامترهایش را سریالسازی میکند و شمایی برای ارسال به LLM ایجاد میکند.
from agent_framework import tool
from agent_framework.azure import AzureAIProjectAgentProvider
from azure.identity import AzureCliCredential
@tool
def get_current_time(location: str) -> str:
"""Get the current time for a given location"""
...
# کلاینت را ایجاد کنید
provider = AzureAIProjectAgentProvider(credential=AzureCliCredential())
# یک نماینده ایجاد کرده و با ابزار اجرا کنید
agent = await provider.create_agent(name="TimeAgent", instructions="Use available tools to answer questions.", tools=get_current_time)
response = await agent.run("What time is it?")
سرویس عامل هوش مصنوعی آژور یک چارچوب عاملی جدید است که توسعهدهندگان را قادر میسازد تا به صورت امن، عاملهای هوش مصنوعی متنوع، قابل گسترش و با کیفیت بالا را بدون نیاز به مدیریت منابع محاسباتی و ذخیرهسازی زیرین بسازند، مستقر کنند و مقیاس دهند. این سرویس به ویژه برای برنامههای سازمانی مفید است چون به صورت کاملاً مدیریت شده با امنیت سطح سازمانی ارائه میشود.
در مقایسه با توسعه مستقیم با API مدلهای زبانی بزرگ، سرویس عامل هوش مصنوعی آژور مزایایی دارد مانند:
ابزارهای موجود در سرویس عامل هوش مصنوعی آژور به دو دسته تقسیم میشوند:
سرویس عامل به ما اجازه میدهد این ابزارها را به صورت یک مجموعه ابزار استفاده کنیم. همچنین از threads استفاده میکند که سابقه پیامها در یک گفتوگوی مشخص را پیگیری میکند.
تصور کنید شما یک نماینده فروش در شرکتی به نام Contoso هستید. میخواهید یک عامل مکالمهای بسازید که بتواند به سوالات مربوط به دادههای فروش شما پاسخ دهد.
تصویر زیر نشان میدهد چگونه میتوان از سرویس عامل هوش مصنوعی آژور برای تحلیل دادههای فروش استفاده کرد:

برای استفاده از هر یک از این ابزارها با سرویس، میتوانیم یک کلاینت بسازیم و یک ابزار یا مجموعه ابزار تعریف کنیم. برای پیادهسازی عملی میتوانیم از کد پایتون زیر استفاده کنیم. LLM قادر خواهد بود به مجموعه ابزار نگاه کرده و تصمیم بگیرد که آیا از تابع ایجاد شده توسط کاربر، fetch_sales_data_using_sqlite_query، یا مفسر کد پیشساخته بسته به درخواست کاربر استفاده کند.
import os
from azure.ai.projects import AIProjectClient
from azure.identity import DefaultAzureCredential
from fetch_sales_data_functions import fetch_sales_data_using_sqlite_query # تابع fetch_sales_data_using_sqlite_query که در فایل fetch_sales_data_functions.py یافت میشود.
from azure.ai.projects.models import ToolSet, FunctionTool, CodeInterpreterTool
project_client = AIProjectClient.from_connection_string(
credential=DefaultAzureCredential(),
conn_str=os.environ["PROJECT_CONNECTION_STRING"],
)
# مقداردهی اولیه مجموعه ابزار
toolset = ToolSet()
# مقداردهی اولیه عامل فراخوانی تابع با تابع fetch_sales_data_using_sqlite_query و اضافه کردن آن به مجموعه ابزار
fetch_data_function = FunctionTool(fetch_sales_data_using_sqlite_query)
toolset.add(fetch_data_function)
# مقداردهی اولیه ابزار مفسر کد و اضافه کردن آن به مجموعه ابزار.
code_interpreter = CodeInterpreterTool()toolset.add(code_interpreter)
agent = project_client.agents.create_agent(
model="gpt-4o-mini", name="my-agent", instructions="You are helpful agent",
toolset=toolset
)
نگرانی رایج درباره SQL تولید شده به صورت پویا توسط LLMها امنیت است، به خصوص خطر تزریق SQL یا اقدامات مخرب مانند حذف یا دستکاری پایگاه داده. در حالی که این نگرانیها معتبر هستند، میتوان با تنظیم مناسب مجوزهای دسترسی به پایگاه داده به طور مؤثری آنها را کاهش داد. برای اکثر پایگاه دادهها این شامل تنظیم پایگاه داده به حالت فقط خواندنی است. برای سرویسهای پایگاه دادهای مانند PostgreSQL یا Azure SQL، باید به اپلیکیشن نقش فقط خواندنی (SELECT) اختصاص داده شود.
اجرای اپلیکیشن در یک محیط امن، محافظت را بیشتر میکند. در سناریوهای سازمانی، دادهها معمولاً از سیستمهای عملیاتی استخراج و تبدیل شده و به یک پایگاه داده یا انبار داده فقط خواندنی با شمایه کاربرپسند منتقل میشوند. این رویکرد تضمین میکند که دادهها امن، بهینه برای کارایی و دسترسی آسان هستند و اپلیکیشن به صورت محدود و فقط خواندنی به دادهها دسترسی دارد.
به دیسکورد Microsoft Foundry بپیوندید تا با سایر یادگیرندگان ملاقات کنید، در ساعات حضور در دفتر شرکت کنید و سوالات خود درباره عاملهای هوش مصنوعی را مطرح کنید.
سلب مسئولیت: این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما در تلاش برای دقت هستیم، لطفاً توجه داشته باشید که ترجمههای خودکار ممکن است شامل خطاها یا نادرستیهایی باشند. سند اصلی به زبان مادری خود باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حیاتی، ترجمه حرفهای انسانی توصیه میشود. ما در قبال هرگونه سوء تفاهم یا برداشت نادرست ناشی از استفاده از این ترجمه مسئولیتی نداریم.