जब AI एजेंट्स बनाने के अनूठे लाभों पर चर्चा होती है, तो मुख्य रूप से दो बातें चर्चा में आती हैं: कार्यों को पूरा करने के लिए औज़ार कॉल करने की योग्यता और समय के साथ सुधार करने की क्षमता। मेमोरी एक ऐसा आधार है जो स्व-सुधार करने वाले एजेंट बनाने का मूल है, जो हमारे उपयोगकर्ताओं के लिए बेहतर अनुभव बना सकता है।
इस पाठ में, हम देखेंगे कि AI एजेंट्स के लिए मेमोरी क्या है, और हम इसे कैसे प्रबंधित कर सकते हैं और अपने अनुप्रयोगों के लाभ के लिए इसका उपयोग कर सकते हैं।
यह पाठ निम्नलिखित विषयों को कवर करेगा:
• AI एजेंट मेमोरी की समझ: मेमोरी क्या है और एजेंट्स के लिए यह क्यों महत्वपूर्ण है।
• मेमोरी को लागू करना और संग्रहीत करना: अपने AI एजेंट्स में मेमोरी क्षमता जोड़ने के व्यावहारिक तरीके, जिसमें शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी पर ध्यान केंद्रित है।
• AI एजेंट्स को स्व-सुधार करने वाला बनाना: कैसे मेमोरी एजेंट्स को पिछली बातचीत से सीखने और समय के साथ सुधार करने में सक्षम बनाती है।
इस पाठ में दो व्यापक नोटबुक ट्यूटोरियल शामिल हैं:
• 13-agent-memory.ipynb: Mem0 और Azure AI Search का उपयोग करके Microsoft Agent Framework के साथ मेमोरी को लागू करता है
• 13-agent-memory-cognee.ipynb: Cognee का उपयोग करके संरचित मेमोरी को लागू करता है, जो एम्बेडिंग के जरिए स्वचालित रूप से ज्ञान ग्राफ बनाता है, ग्राफ को दृश्यात्मक बनाता है, और बुद्धिमान पुनःप्राप्ति प्रदान करता है
इस पाठ को पूरा करने के बाद, आप जान पाएंगे कि कैसे:
• विभिन्न प्रकार की AI एजेंट मेमोरी में अंतर करना, जिसमें वर्किंग, शॉर्ट-टर्म, और लॉन्ग-टर्म मेमोरी के साथ-साथ विशिष्ट प्रकार जैसे पर्सोना और एपिसोडिक मेमोरी शामिल हैं।
• Microsoft Agent Framework का उपयोग करके AI एजेंट्स के लिए शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी को लागू और प्रबंधित करना, Mem0, Cognee, व्हाइटबोर्ड मेमोरी जैसे उपकरणों का उपयोग करते हुए, और Azure AI Search के साथ एकीकरण करना।
• स्व-सुधार करने वाले AI एजेंट्स के पीछे के सिद्धांतों को समझना और कैसे मजबूत मेमोरी प्रबंधन प्रणालियाँ निरंतर सीखने और अनुकूलन में योगदान देती हैं।
मूल रूप से, AI एजेंट्स के लिए मेमोरी वे तंत्र हैं जो उन्हें जानकारी को बनाए रखने और याद करने की अनुमति देते हैं। यह जानकारी बातचीत के विशिष्ट विवरण, उपयोगकर्ता प्राथमिकताओं, पिछली क्रियाओं, या सीखे गए पैटर्न हो सकते हैं।
मेमोरी के बिना, AI अनुप्रयोग अक्सर स्टेटलेस होते हैं, यानी हर बातचीत शुरुआत से होती है। इससे उपयोगकर्ता अनुभव दोहरावदार और निराशाजनक हो जाता है जहां एजेंट पिछला संदर्भ या प्राथमिकताओं को “भूल” जाता है।
एजेंट की बुद्धिमत्ता गहरे रूप से इसकी पिछली जानकारी को याद करने और उपयोग करने की क्षमता से जुड़ी होती है। मेमोरी एजेंट्स को बनाती है:
• परावर्तक (Reflective): पिछली क्रियाओं और परिणामों से सीखना।
• इंटरएक्टिव (Interactive): जारी बातचीत में संदर्भ बनाए रखना।
• प्रोएक्टिव और रिएक्टिव: ऐतिहासिक डेटा के आधार पर आवश्यकताओं की पूर्वधारणा करना या उचित प्रतिक्रिया देना।
• स्वायत्त (Autonomous): संग्रहीत ज्ञान का उपयोग करके अधिक स्वतंत्र रूप से कार्य करना।
मेमोरी लागू करने का लक्ष्य एजेंट्स को अधिक विश्वसनीय और सक्षम बनाना है।
इसे उस स्क्रैच पेपर के रूप में सोचें जो एक एजेंट एकल, चल रहे कार्य या सोच प्रक्रिया के दौरान उपयोग करता है। यह अगले कदम की गणना के लिए आवश्यक तत्काल जानकारी रखता है।
AI एजेंट्स के लिए, वर्किंग मेमोरी अक्सर बातचीत से सबसे प्रासंगिक जानकारी कैप्चर करती है, भले ही पूरी चैट इतिहास लंबी या कटौती की गई हो। यह आवश्यक तत्वों जैसे आवश्यकताएँ, प्रस्ताव, निर्णय, और क्रियाएं निकालने पर केंद्रित होती है।
वर्किंग मेमोरी का उदाहरण
एक यात्रा बुकिंग एजेंट में, वर्किंग मेमोरी उपयोगकर्ता की वर्तमान अनुरोध को कैप्चर कर सकती है, जैसे “मैं पेरिस की यात्रा बुक करना चाहता हूँ”। यह विशिष्ट आवश्यकता एजेंट की तत्काल संदर्भ में रखी जाती है ताकि वर्तमान बातचीत को मार्गदर्शन किया जा सके।
यह प्रकार एकल बातचीत या सत्र की अवधि के लिए जानकारी रखता है। यह वर्तमान चैट का संदर्भ देता है, जिससे एजेंट संवाद के पिछले चरणों को संदर्भित कर सकता है।
Microsoft Agent Framework पायथन SDK नमूनों में, यह AgentSession से मेल खाता है, जिसे agent.create_session() के साथ बनाया जाता है। यह सत्र फ्रेमवर्क की अंतर्निहित शॉर्ट-टर्म मेमोरी है: यह उसी सत्र के उपयोग के दौरान बातचीत संदर्भ को उपलब्ध रखता है, लेकिन जब सत्र समाप्त हो जाता है या एप्लिकेशन पुनः आरंभ होती है, तो यह संदर्भ सहेजा नहीं जाता। ऐसे तथ्यों और प्राथमिकताओं के लिए लॉन्ग-टर्म मेमोरी का उपयोग करें जिन्हें सत्रों के बीच जीवित रहना होता है, आमतौर पर डेटाबेस, वेक्टर इंडेक्स या किसी अन्य स्थायी स्टोर के माध्यम से।
शॉर्ट टर्म मेमोरी का उदाहरण
यदि उपयोगकर्ता पूछता है, “पेरिस के लिए फ्लाइट की कीमत कितनी होगी?” और फिर पूछता है, “वहां आवास के बारे में क्या?” शॉर्ट टर्म मेमोरी सुनिश्चित करती है कि एजेंट को पता है कि “वहां” का मतलब उसी बातचीत में “पेरिस” है।
यह जानकारी कई बातचीत या सत्रों में बनी रहती है। यह एजेंट्स को उपयोगकर्ता की प्राथमिकताएं, ऐतिहासिक इंटरैक्शन या सामान्य ज्ञान को लंबे समय तक याद रखने की अनुमति देता है। यह व्यक्तिगतकरण के लिए महत्वपूर्ण है।
लॉन्ग टर्म मेमोरी का उदाहरण
एक लॉन्ग-टर्म मेमोरी यह स्टोर कर सकती है कि “बेन को स्कीइंग और बाहरी गतिविधियाँ पसंद हैं, उसे पहाड़ के दृश्य के साथ कॉफी पसंद है, और एक पिछली चोट के कारण वह उन्नत स्की ढलानों से बचना चाहता है”। यह जानकारी, पिछली बातचीत से सीखी गई, भविष्य की यात्रा योजना सत्रों में सिफारिशों को अत्यधिक व्यक्तिगत बनाती है।
यह विशिष्ट मेमोरी प्रकार एजेंट को एक सुसंगत “व्यक्तित्व” या “पर्सोना” विकसित करने में मदद करता है। यह एजेंट को खुद या उसके इच्छित भूमिका के बारे में विवरण याद रखने की अनुमति देता है, जिससे बातचीत अधिक सहज और केन्द्रित होती है।
पर्सोना मेमोरी का उदाहरण
यदि यात्रा एजेंट को “विशेषज्ञ स्की योजनाकार” के रूप में डिजाइन किया गया है, तो पर्सोना मेमोरी इस भूमिका को मजबूत कर सकती है, जिससे इसके उत्तर विशेषज्ञ की आवाज़ और ज्ञान के अनुसार हों।
यह मेमोरी जटिल कार्य के दौरान एजेंट द्वारा उठाए गए चरणों की श्रृंखला को स्टोर करती है, जिसमें सफलता और असफलताएं शामिल हैं। यह इस बात की याददाश्त जैसी है कि विशिष्ट “एपिसोड” या पिछली अनुभवों से सीखना।
एपिसोडिक मेमोरी का उदाहरण
यदि एजेंट ने किसी विशेष फ्लाइट को बुक करने का प्रयास किया लेकिन वह उपलब्धता न होने के कारण असफल रहा, तो एपिसोडिक मेमोरी इस विफलता को रिकॉर्ड कर सकती है, जिससे एजेंट अगली बार वैकल्पिक उड़ानें आज़मा सके या उपयोगकर्ता को अधिक सूचित तरीके से समस्या के बारे में बता सके।
यह वार्तालापों से विशिष्ट एंटिटीज़ (जैसे लोग, स्थान, या चीज़ें) और घटनाओं को निकालने और याद रखने से संबंधित है। यह एजेंट को चर्चित प्रमुख तत्वों की संरचित समझ बनाने की अनुमति देता है।
एंटिटी मेमोरी का उदाहरण
पिछली यात्रा की बातचीत से एजेंट “पेरिस”, “एफिल टावर”, और “Le Chat Noir रेस्तरां में डिनर” जैसी एंटिटीज़ निकाल सकता है। भविष्य की बातचीत में, एजेंट “Le Chat Noir” को याद कर सकता है और वहां नया आरक्षण करने की पेशकश कर सकता है।
हालांकि RAG एक व्यापक तकनीक है, “संरचित RAG” को एक शक्तिशाली मेमोरी तकनीक के रूप में उजागर किया गया है। यह विभिन्न स्रोतों (बातचीत, ईमेल, चित्र) से घनी, संरचित जानकारी निकालता है और इसका उपयोग प्रतिक्रियाओं की सटीकता, पुनःप्राप्ति, और गति बढ़ाने के लिए करता है। पारंपरिक RAG के विपरीत जो सिर्फ सिमेंटिक समानता पर निर्भर होता है, संरचित RAG सूचना की स्वाभाविक संरचना के साथ काम करता है।
संरचित RAG का उदाहरण
केवल कीवर्ड मेल खाने के बजाय, संरचित RAG एक ईमेल से उड़ान विवरण (गंतव्य, तिथि, समय, एयरलाइन) पार्स कर सकता है और उन्हें संरचित तरीके से स्टोर कर सकता है। इससे यह सटीक क्वेरी की अनुमति देता है जैसे “मैंने मंगलवार को पेरिस के लिए कौन सी फ्लाइट बुक की?”
AI एजेंट्स के लिए मेमोरी लागू करना एक व्यवस्थित प्रक्रिया है जिसमें मेमोरी प्रबंधन शामिल है, जैसे जानकारी उत्पन्न करना, संग्रहित करना, पुनःप्राप्त करना, एकीकृत करना, अद्यतन करना, और यहां तक कि जानकारी “भूलना” (या हटाना)। पुनःप्राप्ति खासकर महत्वपूर्ण है।
एजेंट की मेमोरी को संग्रहीत और प्रबंधित करने का एक तरीका Mem0 जैसे विशेष उपकरणों का उपयोग है। Mem0 एक स्थायी मेमोरी लेयर के रूप में काम करता है, जिससे एजेंट प्रासंगिक इंटरैक्शन को याद रख सकता है, उपयोगकर्ता प्राथमिकताएं और तथ्यात्मक संदर्भ स्टोर कर सकता है, और समय के साथ सफलता और विफलताओं से सीख सकता है। इसमें विचार यह है कि स्टेटलेस एजेंट्स स्टेटफुल एजेंट्स में परिवर्तित हो जाते हैं।
यह दो-चरणीय मेमोरी पाइपलाइन: निक्षेपण और अपडेट के माध्यम से काम करता है। सबसे पहले, एजेंट के थ्रेड में जोड़े गए संदेश Mem0 सेवा को भेजे जाते हैं, जो एक बड़ा भाषा मॉडल (LLM) का उपयोग करके बातचीत के इतिहास का सारांश तैयार करता है और नई यादें निकालता है। इसके बाद, LLM संचालित अपडेट चरण यह निर्धारित करता है कि इन यादों को जोड़ना है, संशोधित करना है या हटाना है, और उन्हें वेक्टर, ग्राफ, और की-वैल्यू डेटाबेस सहित हाइब्रिड डेटा स्टोर में संग्रहीत करता है। यह सिस्टम विभिन्न प्रकार की मेमोरी का समर्थन करता है और एंटिटीज़ के बीच संबंधों के प्रबंधन के लिए ग्राफ मेमोरी को भी सम्मिलित कर सकता है।
एक और शक्तिशाली दृष्टिकोण Cognee का उपयोग है, जो AI एजेंट्स के लिए ओपन-सोर्स सिमेंटिक मेमोरी है जो संरचित और असंरचित डेटा को एम्बेडिंग आधारित क्वेरी योग्य ज्ञान ग्राफ में बदल देता है। Cognee एक डुअल-स्टोर आर्किटेक्चर प्रदान करता है जो वेक्टर समानता खोज को ग्राफ संबंधों के साथ जोड़ता है, जिससे एजेंट न केवल सूचना की समानता को समझते हैं बल्कि अवधारणाओं के आपसी संबंधों को भी समझ पाते हैं।
यह हाइब्रिड पुनःप्राप्ति में उत्कृष्ट है जो वेक्टर समानता, ग्राफ संरचना, और LLM तर्क को मिश्रित करता है - कच्चे खंड खोज से लेकर ग्राफ-जागरूक प्रश्न उत्तर तक। सिस्टम जीवित मेमोरी बनाए रखता है जो विकसित होती रहती है और बढ़ती है, जबकि इसे एक जुड़े ग्राफ के रूप में क्वेरी किया जा सकता है, जो शॉर्ट-टर्म सत्र संदर्भ और लॉन्ग-टर्म स्थायी मेमोरी दोनों का समर्थन करता है।
Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) इस एकीकृत मेमोरी लेयर के निर्माण को प्रदर्शित करता है, जिसमें विविध डेटा स्रोतों को अवशोषित करने, ज्ञान ग्राफ को दृश्यात्मक बनाने और विभिन्न एजेंट आवश्यकताओं के लिए विशिष्ट खोज रणनीतियों के साथ क्वेरी करने के व्यावहारिक उदाहरण हैं।
mem0 जैसे विशेष मेमोरी उपकरणों के अलावा, आप Azure AI Search जैसे मजबूत खोज सेवाओं का उपयोग कर सकते हैं ताकि मेमोरी को संरचित RAG के लिए स्टोर और पुनःप्राप्त किया जा सके।
यह आपके एजेंट की प्रतिक्रियाओं को आपकी अपनी डेटा के साथ आधारभूत बनाता है, जिससे अधिक प्रासंगिक और सटीक उत्तर सुनिश्चित होते हैं। Azure AI Search उपयोगकर्ता-विशेष यात्रा स्मृतियों, उत्पाद कैटलॉग, या किसी अन्य डोमेन-विशिष्ट ज्ञान को स्टोर करने के लिए इस्तेमाल किया जा सकता है।
Azure AI Search संरचित RAG जैसी क्षमताओं का समर्थन करता है, जो बड़ी डेटा सेट, जैसे बातचीत का इतिहास, ईमेल, या चित्रों से घनी, संरचित जानकारी निकालने और पुनः प्राप्त करने में सक्षम है। यह पारंपरिक टेक्स्ट खंड और एम्बेडिंग विधियों की तुलना में “असाधारण सटीकता और पुनःप्राप्ति” प्रदान करता है।
स्व-सुधार करने वाले एजेंट्स का एक सामान्य पैटर्न है एक “ज्ञान एजेंट” का परिचय। यह अलग एजेंट उपयोगकर्ता और मुख्य एजेंट के बीच मुख्य बातचीत का निरीक्षण करता है। इसका कार्य होता है:
मूल्यवान जानकारी की पहचान करना: यह निर्धारित करना कि क्या बातचीत का कोई भी भाग सामान्य ज्ञान या विशिष्ट उपयोगकर्ता प्राथमिकता के रूप में सहेजा जाना चाहिए।
निकालना और सारांश बनाना: बातचीत से आवश्यक सीख या प्राथमिकता को संक्षेपित करना।
ज्ञान आधार में संग्रहित करना: इस निकाले गए जानकारी को अक्सर वेक्टर डेटाबेस में स्टोर करना, ताकि इसे बाद में पुनः प्राप्त किया जा सके।
भविष्य के प्रश्नों को बढ़ाना: जब उपयोगकर्ता नई क्वेरी शुरू करता है, तो ज्ञान एजेंट प्रासंगिक स्टोर की गई जानकारी पुनः प्राप्त करता है और इसे उपयोगकर्ता के प्रॉम्प्ट में जोड़ता है, जिससे मुख्य एजेंट को महत्वपूर्ण संदर्भ मिलता है (RAG के समान)।
• लेटेंसी प्रबंधन: उपयोगकर्ता इंटरैक्शन को धीमा करने से बचने के लिए, एक सस्ता, तेज़ मॉडल प्रारंभ में यह जल्दी जांच सकता है कि क्या जानकारी संग्रहीत या पुनः प्राप्त करने योग्य है, केवल आवश्यक होने पर ही अधिक जटिल निक्षेपण/पुनःप्राप्ति प्रक्रिया को बुलाना।
• ज्ञान आधार रखरखाव: बढ़ते हुए ज्ञान आधार के लिए, कम उपयोग की गई जानकारी को लागत प्रबंधन के लिए “कोल्ड स्टोरेज” में स्थानांतरित किया जा सकता है।
Microsoft Foundry Discord में शामिल हों ताकि अन्य शिक्षार्थियों से मिल सकें, ऑफिस आवर्स में भाग लें, और अपने AI एजेंट्स के सवालों के जवाब प्राप्त करें।
अस्वीकरण: इस दस्तावेज़ का अनुवाद AI अनुवाद सेवा Co-op Translator का उपयोग करके किया गया है। जबकि हम सटीकता के लिए प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या अशुद्धियाँ हो सकती हैं। मूल दस्तावेज़ अपनी मूल भाषा में ही प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम उत्तरदायी नहीं हैं।