जब AI एजेंट बनाने के अद्वितीय लाभों पर चर्चा की जाती है, तो मुख्य रूप से दो बातें उभरती हैं: कार्यों को पूरा करने के लिए टूल्स को कॉल करने की क्षमता और समय के साथ सुधार करने की क्षमता। मेमोरी एक आत्म-सुधार करने वाले एजेंट बनाने की बुनियाद है जो हमारे उपयोगकर्ताओं के लिए बेहतर अनुभव बना सके।
इस पाठ में, हम देखेंगे कि AI एजेंटों के लिए मेमोरी क्या है और हम इसे अपने एप्लिकेशनों के लाभ के लिए कैसे प्रबंधित और उपयोग कर सकते हैं।
यह पाठ निम्न को कवर करेगा:
• Understanding AI Agent Memory: मेमोरी क्या है और एजेंट्स के लिए यह क्यों आवश्यक है।
• Implementing and Storing Memory: अपने AI एजेंट्स में मेमोरी क्षमताएँ जोड़ने के व्यावहारिक तरीके, विशेष रूप से शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी पर ध्यान केंद्रित करते हुए।
• Making AI Agents Self-Improving: कैसे मेमोरी एजेंट्स को पिछले इंटरैक्शनों से सीखने और समय के साथ बेहतर होने में सक्षम बनाती है।
यह पाठ दो व्यापक नोटबुक ट्यूटोरियल शामिल करता है:
• 13-agent-memory.ipynb: Mem0 और Azure AI Search का उपयोग करके Microsoft Agent Framework के साथ मेमोरी को लागू करता है
• 13-agent-memory-cognee.ipynb: Cognee का उपयोग करके संरचित मेमोरी लागू करता है, जो स्वचालित रूप से एम्बेडिंग द्वारा समर्थित नॉलेज ग्राफ का निर्माण करता है, ग्राफ का विज़ुअलाइज़ेशन करता है, और बुद्धिमान पुनर्प्राप्ति प्रदान करता है
इस पाठ को पूरा करने के बाद, आप जानेंगे कि कैसे:
• विभिन्न प्रकार की AI एजेंट मेमोरी के बीच अंतर करना, जिसमें वर्किंग, शॉर्ट-टर्म, और लॉन्ग-टर्म मेमोरी शामिल हैं, साथ ही पर्सोना और एपिसोडिक मेमोरी जैसे विशिष्ट रूप।
• Microsoft Agent Framework का उपयोग करके AI एजेंट्स के लिए शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी को लागू और प्रबंधित करना, Mem0, Cognee, Whiteboard मेमोरी जैसे टूल्स का लाभ उठाते हुए, और Azure AI Search के साथ एकीकरण करना।
• स्वयं-सुधार करने वाले AI एजेंट्स के सिद्धांतों को समझना और यह कि कैसे मजबूत मेमोरी प्रबंधन प्रणालियाँ सतत शिक्षण और अनुकूलन में योगदान देती हैं।
मूल रूप में, AI एजेंटों के लिए मेमोरी उन तंत्रों को संदर्भित करती है जो उन्हें जानकारी को संग्रहीत और पुनः प्राप्त करने की अनुमति देती हैं। यह जानकारी किसी वार्ता के विशिष्ट विवरण, उपयोगकर्ता की प्राथमिकताएँ, पिछले क्रियाकलाप, या यहां तक कि सीखे गए पैटर्न हो सकते हैं।
मेमोरी के बिना, AI एप्लिकेशन अक्सर स्टेटलेस होते हैं, जिसका अर्थ है कि हर इंटरैक्शन शून्य से शुरू होता है। इससे एक दोहरावदार और निराशाजनक उपयोगकर्ता अनुभव होता है जहां एजेंट पहले के संदर्भ या प्राथमिकताओं को “भूल” जाता है।
एक एजेंट की बुद्धिमत्ता गहरी रूप से उसकी पिछली जानकारी को याद करने और उपयोग करने की क्षमता से जुड़ी होती है। मेमोरी एजेंट्स को बनाती है:
• प्रतिबिंबित: पिछली क्रियाओं और परिणामों से सीखना।
• इंटरैक्टिव: चल रही बातचीत में संदर्भ बनाए रखना।
• प्रोएक्टिव और रिएक्टिव: ऐतिहासिक डेटा के आधार पर ज़रूरतों की पूर्वानुमान लगाना या उपयुक्त तरीके से प्रतिक्रिया करना।
• स्वायत्त: संग्रहीत ज्ञान का उपयोग करके अधिक स्वतंत्र रूप से काम करना।
मेमोरी को लागू करने का लक्ष्य एजेंट्स को अधिक विश्वसनीय और सक्षम बनाना है।
इसे एक स्क्रैच पेपर के टुकड़े के रूप में सोचें जिसका एक एजेंट एकल, चल रहे कार्य या सोच प्रक्रिया के दौरान उपयोग करता है। यह अगले कदम की गणना करने के लिए आवश्यक तात्कालिक जानकारी रखता है।
AI एजेंट्स के लिए, वर्किंग मेमोरी अक्सर बातचीत से सबसे प्रासंगिक जानकारी को कैप्चर करती है, भले ही पूरा चैट इतिहास लंबा या ट्रंकेटेड हो। यह आवश्यक तत्वों जैसे आवश्यकताएँ, प्रस्ताव, निर्णय, और क्रियाओं को निकालने पर केंद्रित होती है।
वर्किंग मेमोरी उदाहरण
एक ट्रैवल बुकिंग एजेंट में, वर्किंग मेमोरी उपयोगकर्ता की वर्तमान अनुरोध को पकड़ सकती है, जैसे “मैं पेरिस की यात्रा बुक करना चाहता/चाहती हूँ”। यह विशिष्ट आवश्यकता वर्तमान इंटरैक्शन का मार्गदर्शन करने के लिए एजेंट के तात्कालिक संदर्भ में रखी जाती है।
यह प्रकार की मेमोरी एकल बातचीत या सत्र की अवधि के लिए जानकारी को बनाए रखती है। यह वर्तमान चैट का संदर्भ है, जो एजेंट को संवाद के पिछले मोड़ों में वापस संदर्भित करने की अनुमति देती है।
शॉर्ट-टर्म मेमोरी उदाहरण
यदि कोई उपयोगकर्ता पूछता है, “पेरिस के लिए फ्लाइट की कीमत कितनी होगी?” और फिर पूछता है, “वहाँ आवास के बारे में क्या?”, तो शॉर्ट-टर्म मेमोरी सुनिश्चित करती है कि एजेंट जानता है कि “वहाँ” उसी बातचीत में “पेरिस” को संदर्भित करता है।
यह वह जानकारी है जो कई बातचीतों या सत्रों में स्थायी रहती है। यह एजेंट्स को उपयोगकर्ता की प्राथमिकताओं, ऐतिहासिक इंटरैक्शनों, या विस्तारित समय के दौरान सामान्य ज्ञान याद रखने की अनुमति देती है। यह पर्सनलाइज़ेशन के लिए महत्वपूर्ण है।
लॉन्ग-टर्म मेमोरी उदाहरण
एक लॉन्ग-टर्म मेमोरी यह स्टोर कर सकती है कि “Ben को स्कीइंग और आउटडोर गतिविधियाँ पसंद हैं, उन्हें पहाड़ के दृश्य के साथ कॉफी पसंद है, और वे एक पिछले चोट के कारण उन्नत स्की ढलानों से बचना चाहते हैं”। पिछली इंटरैक्शनों से सीखी गई यह जानकारी भविष्य के ट्रैवल प्लानिंग सत्रों में सिफारिशों को अत्यधिक व्यक्तिगत बना देती है।
यह विशिष्ट मेमोरी प्रकार एजेंट को एक सतत “व्यक्तित्व” या “पर्सोना” विकसित करने में मदद करता है। यह एजेंट को अपने बारे में या उसके इच्छित रोल के बारे में विवरण याद रखने की अनुमति देता है, जिससे इंटरैक्शन अधिक प्रवाहपूर्ण और केंद्रित होते हैं।
पर्सोना मेमोरी उदाहरण यदि ट्रैवल एजेंट को एक “एक्सपर्ट स्की प्लानर” के रूप में डिज़ाइन किया गया है, तो पर्सोना मेमोरी इस भूमिका को मजबूत कर सकती है, जिससे इसकी प्रतिक्रियाएँ एक विशेषज्ञ की लहजे और ज्ञान के अनुरूप हों।
यह मेमोरी एक जटिल कार्य के दौरान एजेंट द्वारा उठाए गए चरणों के क्रम को संग्रहीत करती है, जिसमें सफलताएँ और असफलताएँ शामिल हैं। यह विशिष्ट “एपिसोड” या पिछले अनुभवों को याद करने जैसा है ताकि उनसे सीखा जा सके।
एपिसोडिक मेमोरी उदाहरण
यदि एजेंट ने किसी विशिष्ट उड़ान को बुक करने की कोशिश की लेकिन उपलब्धता न होने के कारण विफल रहा, तो एपिसोडिक मेमोरी इस विफलता को रिकॉर्ड कर सकती है, जिससे एजेंट वैकल्पिक उड़ानों की कोशिश कर सके या बाद के प्रयास के दौरान उपयोगकर्ता को अधिक सूचित तरीके से समस्या के बारे में बता सके।
यह संवादों से विशिष्ट एंटिटीज़ (जैसे लोग, स्थान, या चीज़ें) और घटनाओं को निकालने और याद रखने से जुड़ा होता है। यह एजेंट को चर्चा किए गए प्रमुख तत्वों की संरचित समझ बनाने की अनुमति देता है।
एंटिटी मेमोरी उदाहरण
एक पिछली यात्रा के बारे में बातचीत से, एजेंट “Paris”, “Eiffel Tower”, और “Le Chat Noir रेस्टोरेंट में डिनर” जैसी एंटिटीज़ निकाल सकता है। भविष्य के इंटरैक्शन में, एजेंट “Le Chat Noir” को याद कर सकता है और वहां नई आरक्षण करने का प्रस्ताव दे सकता है।
जबकि RAG एक व्यापक तकनीक है, “Structured RAG” को एक शक्तिशाली मेमोरी प्रौद्योगिकी के रूप में हाइलाइट किया जाता है। यह विभिन्न स्रोतों (बातचीतों, ईमेल, इमेज) से घनी, संरचित जानकारी निकालता है और इसका उपयोग प्रतिक्रियाओं में सटीकता, रिकॉल, और गति बढ़ाने के लिए करता है। पारंपरिक RAG जो केवल सिमेंटिक समानता पर निर्भर करता है, उसके विपरीत, Structured RAG जानकारी की अंतर्निहित संरचना के साथ काम करता है।
Structured RAG उदाहरण
सिर्फ कीवर्ड मिलान करने के बजाय, Structured RAG ईमेल से फ्लाइट विवरण (गंतव्य, तिथि, समय, एयरलाइन) को पार्स कर सकता है और उन्हें संरचित तरीके से संग्रहीत कर सकता है। यह “मैंने मंगलवार को पेरिस के लिए कौन सी फ्लाइट बुक की?” जैसे सटीक प्रश्नों की अनुमति देता है।
AI एजेंट्स के लिए मेमोरी को लागू करना एक प्रणालीबद्ध प्रक्रिया शामिल करता है जिसे मेमोरी मैनेजमेंट कहा जाता है, जिसमें जानकारी उत्पन्न करना, संग्रहित करना, पुनर्प्राप्त करना, एकीकृत करना, अपडेट करना, और यहां तक कि “भूलना” (या हटाना) शामिल है। पुनर्प्राप्ति एक विशेष रूप से महत्वपूर्ण पहलू है।
एजेंट मेमोरी को स्टोर और प्रबंधित करने का एक तरीका Mem0 जैसे विशेष टूल्स का उपयोग करना है। Mem0 एक स्थायी मेमोरी लेयर के रूप में काम करता है, जिससे एजेंट प्रासंगिक इंटरैक्शनों को याद कर सकते हैं, उपयोगकर्ता प्राथमिकताएँ और तथ्यात्मक संदर्भ स्टोर कर सकते हैं, और समय के साथ सफलताओं और असफलताओं से सीख सकते हैं। विचार यह है कि स्टेटलेस एजेंट्स स्टेटफुल में बदल जाएँ।
यह दो-चरणीय मेमोरी पाइपलाइन: निष्कर्षण और अपडेट के माध्यम से काम करता है। पहले, एक एजेंट के थ्रेड में जो संदेश जोड़े जाते हैं उन्हें Mem0 सेवा को भेजा जाता है, जो बातचीत के इतिहास का सारांश बनाने और नई यादों को निकालने के लिए एक Large Language Model (LLM) का उपयोग करती है। उसके बाद, एक LLM-प्रेरित अपडेट चरण यह निर्धारित करता है कि इन यादों को जोड़ना है, संशोधित करना है, या हटाना है, और उन्हें एक हाइब्रिड डाटा स्टोर में संग्रहीत किया जाता है जिसमें वेक्टर, ग्राफ, और की-वैल्यू डेटाबेस शामिल हो सकते हैं। यह प्रणाली विभिन्न मेमोरी प्रकारों का भी समर्थन करती है और एंटिटीज़ के बीच संबंधों के प्रबंधन के लिए ग्राफ मेमोरी को शामिल कर सकती है।
एक अन्य शक्तिशाली दृष्टिकोण है Cognee का उपयोग करना, जो AI एजेंट्स के लिए एक ओपन-सोर्स सेमांटिक मेमोरी है जो संरचित और अनुप्र���कृत डेटा को एम्बेडिंग्स द्वारा समर्थित क्वेरी योग्य नॉलेज ग्राफ में परिवर्तित करती है। Cognee एक डुअल-स्टोर आर्किटेक्चर प्रदान करती है जो वेक्टर समानता खोज को ग्राफ संबंधों के साथ संयोजित करती है, जिससे एजेंट न केवल यह समझ पाते हैं कि कौन सी जानकारी समान है, बल्कि अवधारणाएँ एक-दूसरे से कैसे संबंधित हैं।
यह हाइब्रिड पुनर्प्राप्ति में उत्कृष्ट है जो वेक्टर समानता, ग्राफ संरचना, और LLM तर्क को मिलाती है - कच्चे चंक लुकअप से लेकर ग्राफ-साक्षर क्वेश्चन आंसरिंग तक। सिस्टम एक लाइविंग मेमोरी बनाए रखता है जो विकसित और बढ़ती रहती है जबकि एक जुड़े हुए ग्राफ के रूप में क्वेरी करने योग्य रहती है, जो शॉर्ट-टर्म सेशन संदर्भ और लॉन्ग-टर्म स्थायी मेमोरी दोनों का समर्थन करती है।
Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) इस एकीकृत मेमोरी लेयर के निर्माण का प्रदर्शन करता है, जिसमें विविध डेटा स्रोतों का इनजेस्ट करना, नॉलेज ग्राफ का विज़ुअलाइज़ेशन, और विशिष्ट एजेंट आवश्यकताओं के अनुरूप विभिन्न खोज रणनीतियों के साथ क्वेरी करने के व्यावहारिक उदाहरण शामिल हैं।
विशेष मेमोरी टूल्स जैसे mem0 , आप मजबूत सर्च सेवाओं का उपयोग कर सकते हैं जैसे कि Azure AI Search को मेमोरी स्टोर और पुनर्प्राप्ति के लिए बैकएंड के रूप में उपयोग करना, विशेष रूप से Structured RAG के लिए।
यह आपको अपने एजेंट की प्रतिक्रियाओं को अपने डेटा के साथ ग्राउंड करने की अनुमति देता है, जिससे अधिक प्रासंगिक और सटीक उत्तर सुनिश्चित होते हैं। Azure AI Search का उपयोग उपयोगकर्ता-विशिष्ट ट्रैवल मेमोरिज़, प्रोडक्ट कैटलॉग, या किसी अन्य डोमेन-विशेष ज्ञान को स्टोर करने के लिए किया जा सकता है।
Azure AI Search Structured RAG जैसी क्षमताओं का समर्थन करता है, जो बातचीत के इतिहास, ईमेल, या यहां तक कि इमेज जैसे बड़े डेटासेट से घनी, संरचित जानकारी निकालने और पुनर्प्राप्त करने में उत्कृष्ट है। यह पारंपरिक टेक्स्ट चंकिंग और एम्बेडिंग दृष्टिकोणों की तुलना में “सुपरह्यूमन सटीकता और रिकॉल” प्रदान करता है।
स्वयं-सुधार करने वाले एजेंट्स के लिए एक सामान्य पैटर्न में एक “नॉलेज एजेंट” पेश करना शामिल है। यह अलग एजेंट मुख्य एजेंट और उपयोगकर्ता के बीच की मुख्य बातचीत का अवलोकन करता है। इसकी भूमिका है:
मूल्यवान जानकारी की पहचान करना: यह निर्धारित करना कि क्या बातचीत का कोई भी हिस्सा सामान्य ज्ञान या किसी विशिष्ट उपयोगकर्ता प्राथमिकता के रूप में सहेजा जाना चाहिए।
निकालना और सारांशित करना: बातचीत से आवश्यक सीख या प्राथमिकता को संक्षेप में निकालना।
ज्ञान आधार में स्टोर करना: अक्सर इस निकाली गई जानकारी को एक वेक्टर डेटाबेस में स्थायी रूप से संग्रहीत करना, ताकि इसे बाद में पुनः प्राप्त किया जा सके।
भविष्य के क्वेरीज़ को बढ़ाना: जब उपयोगकर्ता नया प्रश्न शुरू करता है, तो नॉलेज एजेंट संबंधित संग्रहीत जानकारी पुनः प्राप्त करता है और इसे उपयोगकर्ता के प्रॉम्प्ट में जोड़ता है, प्राथमिक एजेंट को महत्वपूर्ण संदर्भ प्रदान करता है (RAG के समान)।
• Latency Management: उपयोगकर्ता इंटरैक्शनों को धीमा करने से बचने के लिए, प्रारंभ में एक सस्ता, तेज़ मॉडल तेज़ी से चेक करने के लिए उपयोग किया जा सकता है कि क्या जानकारी को स्टोर या पुनर्प्राप्त करना मूल्यवान है, और केवल आवश्यक होने पर अधिक जटिल निष्कर्षण/पुनर्प्राप्ति प्रक्रिया को इनवोक करना चाहिए।
• Knowledge Base Maintenance: बढ़ते हुए नॉलेज बेस के लिए, कम बार उपयोग की जाने वाली जानकारी को लागत प्रबंधन के लिए “कोल्ड स्टोरेज” में स्थानांतरित किया जा सकता है।
अन्य शिक्षार्थियों से मिलने, ऑफिस आवर्स में भाग लेने और अपने AI एजेंट्स के प्रश्नों के उत्तर प्राप्त करने के लिए Microsoft Foundry Discord में शामिल हों।
अस्वीकरण: यह दस्तावेज़ एआई अनुवाद सेवा [Co-op Translator] (https://github.com/Azure/co-op-translator) का उपयोग करके अनूदित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान रखें कि स्वचालित अनुवादों में त्रुटियाँ या असंगतताएँ हो सकती हैं। मूल दस्तावेज़ अपनी मूल भाषा में प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए पेशेवर मानव अनुवाद की सलाह दी जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफ़हमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।