عند مناقشة الفوائد الفريدة لإنشاء وكلاء الذكاء الاصطناعي، يتم التطرق بشكل رئيسي إلى شيئين: القدرة على استدعاء الأدوات لإكمال المهام والقدرة على التحسن مع مرور الوقت. تشكل الذاكرة أساس إنشاء وكيل يتحسن ذاتيًا ويمكنه خلق تجارب أفضل للمستخدمين.
في هذا الدرس، سننظر في ماهية الذاكرة لوكلاء الذكاء الاصطناعي وكيف يمكننا إدارتها واستخدامها لصالح تطبيقاتنا.
يغطي هذا الدرس:
• فهم ذاكرة وكلاء الذكاء الاصطناعي: ما هي الذاكرة ولماذا هي أساسية للوكلاء.
• تنفيذ وتخزين الذاكرة: طرق عملية لإضافة قدرات الذاكرة إلى وكلائك، مع التركيز على الذاكرة قصيرة المدى وطويلة المدى.
• جعل وكلاء الذكاء الاصطناعي يتحسنون ذاتيًا: كيف تمكّن الذاكرة الوكلاء من التعلم من التفاعلات السابقة والتحسن مع مرور الوقت.
يتضمن هذا الدرس دفتري ملاحظات تعليميين متكاملين:
• 13-agent-memory.ipynb: يُنفّذ الذاكرة باستخدام Mem0 وAzure AI Search مع Microsoft Agent Framework
• 13-agent-memory-cognee.ipynb: يُنفّذ ذاكرة مُهيكلة باستخدام Cognee، يقوم تلقائيًا ببناء رسم بياني معرفي مدعوم بالـ embeddings، ويعرض الرسم البياني، ويوفر استرجاعًا ذكيًا
بعد إكمال هذا الدرس، ستعرف كيفية:
• تمييز بين أنواع مختلفة من ذاكرة وكلاء الذكاء الاصطناعي، بما في ذلك الذاكرة العاملة، قصيرة المدى، وطويلة المدى، بالإضافة إلى أشكال متخصصة مثل ذاكرة الشخصية والذاكرة العرضية.
• تنفيذ وإدارة الذاكرة قصيرة المدى وطويلة المدى لوكلاء الذكاء الاصطناعي باستخدام Microsoft Agent Framework، والاستفادة من أدوات مثل Mem0 وCognee وWhiteboard memory، والتكامل مع Azure AI Search.
• فهم المبادئ وراء وكلاء الذكاء الاصطناعي الذين يتحسنون ذاتيًا وكيف تساهم أنظمة إدارة الذاكرة القوية في التعلم والتكيف المستمرين.
في جوهرها، تشير الذاكرة لوكلاء الذكاء الاصطناعي إلى الآليات التي تسمح لهم بالاحتفاظ بالمعلومات واسترجاعها. يمكن أن تكون هذه المعلومات تفاصيل محددة حول محادثة، تفضيلات المستخدم، إجراءات سابقة، أو حتى أنماط متعلمة.
بدون الذاكرة، تكون تطبيقات الذكاء الاصطناعي غالبًا عديمة الحالة، مما يعني أن كل تفاعل يبدأ من الصفر. يؤدي ذلك إلى تجربة مستخدم متكررة ومحبطة حيث “ينسى” الوكيل السياق السابق أو التفضيلات.
ترتبط ذكاء الوكيل ارتباطًا وثيقًا بقدرته على استرجاع المعلومات الماضية واستخدامها. تتيح الذاكرة للوكلاء أن يكونوا:
• انعكاسيًا: يتعلمون من الإجراءات والنتائج السابقة.
• تفاعليًا: يحافظون على السياق خلال محادثة جارية.
• استباقيًا وتفاعليًا: يتوقعون الاحتياجات أو يستجيبون بشكل مناسب استنادًا إلى البيانات التاريخية.
• مستقلاً: يعملون بشكل أكثر استقلالية من خلال الرجوع إلى المعرفة المخزنة.
الهدف من تنفيذ الذاكرة هو جعل الوكلاء أكثر موثوقية وقادرين.
فكر في هذا كقطعة ورق يستخدمها الوكيل أثناء مهمة أو عملية فكرية واحدة جارية. تحتفظ بالمعلومات الفورية اللازمة لحساب الخطوة التالية.
بالنسبة لوكلاء الذكاء الاصطناعي، غالبًا ما تلتقط ذاكرة العمل المعلومات الأكثر صلة من محادثة، حتى لو كان تاريخ الدردشة الكامل طويلًا أو مقتطعًا. تركز على استخراج العناصر الأساسية مثل المتطلبات، المقترحات، القرارات، والإجراءات.
مثال على ذاكرة العمل
في وكيل حجز سفر، قد تلتقط ذاكرة العمل طلب المستخدم الحالي، مثل “أريد حجز رحلة إلى باريس”. يتم الاحتفاظ بهذا المتطلب المحدد في سياق الوكيل الفوري لتوجيه التفاعل الحالي.
هذا النوع من الذاكرة يحتفظ بالمعلومات طوال مدة محادثة أو جلسة واحدة. إنه سياق الدردشة الحالي، مما يسمح للوكيل بالإشارة إلى الأدوار السابقة في الحوار.
مثال على الذاكرة قصيرة المدى
إذا سأل المستخدم، “كم سيكلف الطيران إلى باريس؟” ثم تابع بسؤال “ماذا عن الإقامة هناك؟”، تضمن الذاكرة قصيرة المدى أن الوكيل يعرف أن “هناك” تشير إلى “باريس” داخل نفس المحادثة.
هذه معلومات تستمر عبر عدة محادثات أو جلسات. تسمح للوكيل بتذكر تفضيلات المستخدم، التفاعلات التاريخية، أو المعرفة العامة على فترات ممتدة. هذا مهم للتخصيص.
مثال على الذاكرة طويلة المدى
قد تخزن الذاكرة طويلة المدى أن “بن يستمتع بالتزلج والأنشطة الخارجية، ويحب القهوة مع منظر جبلي، ويرغب في تجنب منحدرات التزلج المتقدمة بسبب إصابة سابقة”. تؤثر هذه المعلومات، المستفادة من تفاعلات سابقة، على التوصيات في جلسات تخطيط السفر المستقبلية، مما يجعلها مخصصة للغاية.
هذا النوع المتخصص من الذاكرة يساعد الوكيل على تطوير “شخصية” أو “هوية” متسقة. يسمح للوكيل بتذكر تفاصيل عن نفسه أو عن الدور المقصود له، مما يجعل التفاعلات أكثر سلاسة وتركيزًا.
مثال على ذاكرة الشخصية إذا كان وكيل السفر مصممًا ليكون “مخططًا خبيرًا للتزلج”، فقد تعزز ذاكرة الشخصية هذا الدور، مؤثرةً في ردوده لتتماشى مع نبرة ومعرفة الخبير.
تخزن هذه الذاكرة تسلسل الخطوات التي يتخذها الوكيل أثناء مهمة معقدة، بما في ذلك النجاحات والإخفاقات. إنها مثل تذكر “حلقات” أو تجارب سابقة للتعلم منها.
مثال على الذاكرة العرضية
إذا حاول الوكيل حجز رحلة معينة لكنه فشل بسبب عدم التوفر، يمكن لذاكرة العرضية تسجيل هذا الفشل، مما يسمح للوكيل بتجربة رحلات بديلة أو إبلاغ المستخدم بالمشكلة بشكل أكثر دراية في محاولة لاحقة.
يتعلق هذا باستخراج وتذكر كيانات محددة (مثل الأشخاص أو الأماكن أو الأشياء) والأحداث من المحادثات. يتيح للوكيل بناء فهم مُهيكل للعناصر الأساسية التي تم مناقشتها.
مثال على ذاكرة الكيانات
من محادثة حول رحلة سابقة، قد يستخرج الوكيل “باريس”، “برج إيفل”، و”عشاء في مطعم Le Chat Noir” ككيانات. في تفاعل مستقبلي، قد يتذكر الوكيل “Le Chat Noir” ويعرض إجراء حجز جديد هناك.
بينما RAG هي تقنية أوسع، يتم تسليط الضوء على “Structured RAG” كونه تكنولوجيا ذاكرة قوية. يستخرج معلومات كثيفة ومهيكلة من مصادر متعددة (محادثات، رسائل بريد إلكتروني، صور) ويستخدمها لتحسين الدقة والاستدعاء والسرعة في الردود. على عكس RAG الكلاسيكي الذي يعتمد فقط على التشابه الدلالي، تعمل Structured RAG مع البنية الجوهرية للمعلومات.
مثال على Structured RAG
بدلاً من مطابقة الكلمات المفتاحية فقط، يمكن أن تقوم Structured RAG بتحليل تفاصيل الرحلة (الوجهة، التاريخ، الوقت، شركة الطيران) من رسالة بريد إلكتروني وتخزينها بطريقة مُهيكلة. يتيح ذلك استعلامات دقيقة مثل “ما الرحلة التي حجزتها إلى باريس يوم الثلاثاء؟”
يتضمن تنفيذ الذاكرة لوكلاء الذكاء الاصطناعي عملية منهجية لإدارة إدارة الذاكرة، والتي تشمل توليد المعلومات وتخزينها واسترجاعها ودمجها وتحديثها، وحتى “نسيانها” (أو حذفها). يُعد الاسترجاع جانبًا حاسمًا بشكل خاص.
إحدى الطرق لتخزين وإدارة ذاكرة الوكيل هي استخدام أدوات متخصصة مثل Mem0. يعمل Mem0 كطبقة ذاكرة دائمة، مما يسمح للوكلاء باسترجاع التفاعلات ذات الصلة، وتخزين تفضيلات المستخدم والسياق الواقعي، والتعلم من النجاحات والإخفاقات مع مرور الوقت. الفكرة هنا هي تحويل الوكلاء عديمي الحالة إلى وكلاء ذوي حالة.
يعمل من خلال خط أنابيب الذاكرة ذو المرحلتين: الاستخراج والتحديث. أولاً، تُرسل الرسائل المضافة إلى سلسلة الوكيل إلى خدمة Mem0، التي تستخدم نموذج لغة كبير (LLM) لتلخيص سجل المحادثة واستخراج ذكريات جديدة. بعد ذلك، تحدد مرحلة التحديث المدفوعة بالـ LLM ما إذا كان ينبغي إضافة هذه الذكريات أو تعديلها أو حذفها، وتخزنها في مخزن بيانات هجين يمكن أن يشمل قواعد بيانات متجهية، ورسومًا بيانية، وقيم-مفتاحية. يدعم هذا النظام أيضًا أنواع ذاكرة مختلفة ويمكن أن يدمج ذاكرة الرسم البياني لإدارة العلاقات بين الكيانات.
نهج قوي آخر هو استخدام Cognee، ذاكرة دلالية مفتوحة المصدر لوكلاء الذكاء الاصطناعي تحول البيانات المهيكلة وغير المهيكلة إلى رسوم بيانية معرفية قابلة للاستعلام ومدعومة بالـ embeddings. يوفر Cognee هندسة ثنائية المخزن تجمع بين بحث التشابه المتجهي وعلاقات الرسم البياني، مما يمكّن الوكلاء من فهم ليس فقط ما هي المعلومات المتشابهة، ولكن كيف ترتبط المفاهيم ببعضها البعض.
يبرع في الاسترجاع الهجين الذي يمزج بين تشابه المتجهات، وبنية الرسم البياني، واستدلال نماذج اللغة - من بحث القطع الخام إلى الإجابة على الأسئلة مع وعي الرسم البياني. يحافظ النظام على ذاكرة حية تتطور وتنمو بينما تظل قابلة للاستعلام كرسوم بيانية متصلة، داعمًا كلًا من سياق الجلسة القصيرة المدى والذاكرة الدائمة طويلة المدى.
يوضح دفتر Cognee التعليمي (13-agent-memory-cognee.ipynb) بناء طبقة الذاكرة الموحدة هذه، مع أمثلة عملية على استيعاب مصادر بيانات متنوعة، وتصوير الرسم البياني المعرفي، والاستعلام باستخدام استراتيجيات بحث مختلفة مصممة لاحتياجات وكلاء محددة.
بعيدًا عن أدوات الذاكرة المتخصصة مثل mem0 ، يمكنك الاستفادة من خدمات بحث قوية مثل Azure AI Search كخلفية لتخزين واسترجاع الذكريات، خاصةً لـ Structured RAG.
يتيح لك ذلك تأصيل ردود وكيلك ببياناتك الخاصة، مما يضمن إجابات أكثر صلة ودقة. يمكن استخدام Azure AI Search لتخزين ذكريات سفر خاصة بالمستخدم، أو قوائم منتجات، أو أي معرفة نطاقية أخرى.
تدعم Azure AI Search ميزات مثل Structured RAG، التي تتفوق في استخراج واسترجاع المعلومات الكثيفة والمهيكلة من مجموعات بيانات كبيرة مثل سجلات المحادثات، ورسائل البريد الإلكتروني، أو حتى الصور. يوفر هذا “دقة واستدعاء فوق بشرية” مقارنةً بمقاربات التجزئة التقليدية والـ embeddings.
نمط شائع للوكلاء الذين يتحسنون ذاتيًا يتضمن إدخال “وكيل معرفي”. هذا الوكيل المنفصل يراقب المحادثة الرئيسية بين المستخدم والوكيل الأساسي. دوره هو:
تحديد المعلومات القيمة: تحديد ما إذا كان أي جزء من المحادثة يستحق الحفظ كمعرفة عامة أو كتفضيل مستخدم محدد.
الاستخراج والتلخيص: استخلاص التعلم أو التفضيل الأساسي من المحادثة وتلخيصه.
التخزين في قاعدة معرفة: الاحتفاظ بهذه المعلومات المستخرجة، غالبًا في قاعدة بيانات متجهية، بحيث يمكن استرجاعها لاحقًا.
تعزيز الاستعلامات المستقبلية: عندما يبدأ المستخدم استعلامًا جديدًا، يسترجع الوكيل المعرفي المعلومات المخزنة ذات الصلة ويضيفها إلى موجه المستخدم، موفرًا سياقًا حاسمًا للوكيل الأساسي (مشابهًا لفكرة RAG).
• إدارة الكمون: لتجنب إبطاء تفاعلات المستخدم، يمكن استخدام نموذج أرخص وأسرع مبدئيًا لفحص سريع ما إذا كانت المعلومات تستحق الحفظ أو الاستدعاء، مع استدعاء عملية الاستخراج/الاسترجاع الأكثر تعقيدًا عند الضرورة فقط.
• صيانة قاعدة المعرفة: بالنسبة لقاعدة معرفة متنامية، يمكن نقل المعلومات الأقل استخدامًا إلى “تخزين بارد” لإدارة التكاليف.
انضم إلى خادم Microsoft Foundry على Discord للالتقاء بمتعلمين آخرين، وحضور ساعات المكتب، والحصول على إجابات لأسئلتك حول وكلاء الذكاء الاصطناعي.
إخلاء المسؤولية: تمت ترجمة هذه الوثيقة باستخدام خدمة الترجمة الآلية Co-op Translator (https://github.com/Azure/co-op-translator). وعلى الرغم من سعينا لتحقيق الدقة، يرجى العلم أن الترجمات الآلية قد تحتوي على أخطاء أو نقاط عدم دقة. يجب اعتبار الوثيقة الأصلية بلغتها الأصلية المصدر المعتمد. للمعلومات الحساسة أو الحرجة، يُنصح بالاستعانة بترجمة بشرية مهنية. نحن غير مسؤولين عن أي سوء فهم أو تفسير خاطئ ينجم عن استخدام هذه الترجمة.