AI एजंट तयार करण्याच्या अनन्य फायद्यांवर चर्चा करताना मुख्यतः दोन गोष्टींचा समावेश होतो: काम पूर्ण करण्यासाठी टूल्स कॉल करण्याची क्षमता आणि वेळेनुसार सुधारणा करण्याची क्षमता. मेमरी हा स्वतःला सुधारताना एजंट तयार करण्याच्या पाया आहे ज्यामुळे आपल्या वापरकर्त्यांना उत्तम अनुभव मिळू शकतो.
या धड्यात आपण AI एजंटसाठी मेमरी म्हणजे काय आणि ती कशी व्यवस्थापित करावी तसेच आमच्या अॅप्लिकेशन्सच्या फायद्यासाठी कशी वापरू शकतो हे पाहणार आहोत.
हा धडा यावर लक्ष केंद्रित करेल:
• AI एजंट मेमरी समजून घेणे: मेमरी म्हणजे काय आणि एजंटसाठी का आवश्यक आहे.
• मेमरीची अंमलबजावणी आणि साठवण: आपल्या AI एजंट्समध्ये मेमरीच्या क्षमता कशी जोडायची, विशेषतः अल्पकालीन आणि दीर्घकालीन मेमरीवर लक्ष केंद्रित करून.
• AI एजंट्सना स्वतःला सुधारण्यायोग्य बनवणे: मेमरी कशी एजंटना मागील संवादांपासून शिकण्याची आणि कालांतराने सुधारण्याची क्षमता देते.
हा धडा दोन सविस्तर नोटबुक ट्युटोरियल्स समाविष्ट करतो:
• 13-agent-memory.ipynb: Mem0 आणि Azure AI Search चा वापर करून Microsoft Agent Framework सह मेमरीची अंमलबजावणी करतो
• 13-agent-memory-cognee.ipynb: Cognee वापरून संरचित मेमरीची अंमलबजावणी करतो, जी इम्बेडिंगद्वारे समर्थित ज्ञान ग्राफ तयार करते, ग्राफचे दृश्य रूपात सादरीकरण आणि बुद्धिमान पुनर्प्राप्ती करते
हा धडा पूर्ण केल्यावर, आपण कसे करू शकाल:
• विविध प्रकारच्या AI एजंट मेमरीमधील फरक ओळखणे, ज्यात कार्यरत, अल्पकालीन आणि दीर्घकालीन मेमरी तसेच व्यक्तिमत्व (persona) आणि एपिसोडिक मेमरी यांसारख्या विशेष स्वरूपांचा समावेश आहे.
• Microsoft Agent Framework वापरून AI एजंटसाठी अल्पकालीन आणि दीर्घकालीन मेमरीची अंमलबजावणी आणि व्यवस्थापन करणे, Mem0, Cognee, Whiteboard memory यांसारख्या टूल्सचा वापर करून, तसेच Azure AI Search सह एकत्रीकरण करणे.
• स्वतःला सुधारत जाणाऱ्या AI एजंट्सच्या तत्त्वांची समज आणि कशी मजबूत मेमरी व्यवस्थापन प्रणाली साततत शिकण्यास आणि अनुकूलनास मदत करतात हे जाणून घेणे.
मूलभूतपणे, AI एजंटसाठी मेमरी म्हणजे अशा यंत्रणा ज्या त्यांना माहिती ठेवण्याची आणि पुनःस्मरण करण्याची परवानगी देतात. ही माहिती संभाषणातील विशिष्ट तपशील, वापरकर्ता पसंती, मागील क्रिया किंवा शिकलेले नमुने असू शकतात.
मेमरीशिवाय, AI अॅप्लिकेशन्स सहसा स्थितीबाह्य असतात, म्हणजे प्रत्येक संवाद नवीन सुरुवात असते. यामुळे वापरकर्त्याला वारंवार एकच गोष्ट विचारावी लागते किंवा एजंट आधीचा संदर्भ किंवा पसंती “भूलतो” आणि त्यामुळे त्रासदायक अनुभव तयार होतो.
एजंटची बुद्धिमत्ता त्याच्या मागील माहिती लक्षात ठेवण्याच्या आणि वापरण्याच्या क्षमतेशी घट्ट निगडीत आहे. मेमरी एजंट्सना सक्षम करते:
• परावर्तीत होण्यास (Reflective): मागील क्रिया आणि निकालातून शिकणे.
• संवादात्मक (Interactive): चालू संभाषणाचा संदर्भ टिकवून ठेवणे.
• प्रतिक्रियाशील आणि प्रोएक्टिव्ह (Proactive and Reactive): ऐतिहासिक डेटाच्या आधारे गरजा ओळखणे किंवा योग्य प्रतिसाद देणे.
• स्वायत्त (Autonomous): साठवलेल्या ज्ञानावर अवलंबून अधिक स्वतंत्रपणे काम करणे.
मेमरीची अंमलबजावणी करण्याचा उद्देश एजंट्सना अधिक विश्वसनीय आणि सक्षम बनवणे आहे.
याला एजंट एका चालू, सध्याच्या कार्य किंवा विचार प्रक्रिये दरम्यान वापरलेली स्क्रॅच पेपर म्हणून विचार करा. हे लगेच आवश्यक असलेली माहिती ठेवते जी पुढील टप्पा पूर्ण करण्यासाठी आवश्यक आहे.
AI एजंटसाठी, कार्यरत मेमरी संभाषणातील सर्वात संबंधित माहिती पकडते, अगदी जर पूर्ण चॅट इतिहास लांब अथवा संक्षिप्त असेल तरी. ही गरजे, प्रस्तावना, निर्णय, आणि क्रियांसारखे महत्त्वाचे घटक काढण्यात केंद्रित असते.
कार्यरत मेमरीचे उदाहरण
एका ट्रॅव्हल बुकिंग एजंटमध्ये, कार्यरत मेमरी वापरकर्त्याचा सध्या केलेला विनंती जसे “मला पॅरिसला प्रवास बुक करायचा आहे” या माहितीचा संदर्भ धरू शकते. ही विशिष्ट गरज एजंटच्या तात्काळ संदर्भात सध्याच्या संवादाला मार्गदर्शन करते.
ही मेमरी एका सत्र किंवा संभाषणाच्या कालावधीसाठी माहिती ठेवते. ही चालू चॅटचा संदर्भ आहे, ज्यामुळे एजंट मागच्या संवादांवर संदर्भ देऊ शकतो.
अल्पकालीन मेमरीचे उदाहरण
जर वापरकर्ता “पॅरिसला फ्लाइट किती खर्च येईल?” असे विचारले आणि नंतर “त्या ठिकाणी राहण्याचा काय?” असे विचारले, तर अल्पकालीन मेमरी या संभाषणातील “त्या ठिकाणी” म्हणजे “पॅरिस” असल्याचे सुनिश्चित करते.
ही माहिती अनेक संभाषणे किंवा सत्रांमध्ये टिकून राहते. यामुळे एजंट वापरकर्त्याच्या पसंती, ऐतिहासिक संवाद किंवा सामान्य ज्ञान लक्षात ठेवू शकतो, जे वैयक्तिकरणासाठी महत्त्वाचे आहे.
दीर्घकालीन मेमरीचे उदाहरण
दीर्घकालीन मेमरीमध्ये सद्यःस्थितीत “बेनला स्कीइंग आणि बाहेरील क्रियाकलाप आवडतात, तो कॉफी माउंटन व्यूने घेतो आणि भूतकाळातील दुखापतीमुळे प्रगत स्की सापळ्यांना टाळतो” असे संग्रहित केलेले असू शकते. या पूर्वीच्या संवादातून शिकलेल्या माहितीचा वापर पुढील प्रवास नियोजन सत्रात अत्यंत वैयक्तिकृत शिफारशी देण्यासाठी होतो.
ही विशेष मेमरी प्रकार एजंटला एक सातत्यपूर्ण “वैयक्तिकत्व” किंवा “व्यक्तिमत्व” विकसित करण्यात मदत करते. त्यामुळे एजंट त्याबद्दल किंवा त्याच्या भूमिकेबद्दल तपशील लक्षात ठेवू शकतो, ज्यामुळे संवाद अधिक सुरळीत आणि लक्ष केंद्रित होतो.
व्यक्तिमत्व मेमरीचे उदाहरण
जर ट्रॅव्हल एजंट “तज्ञ स्की नियोजक” म्हणून डिझाइन केला असेल, तर व्यक्तिमत्व मेमरी या भूमिकेला बळकट करू शकते आणि त्याच्या प्रतिसादात तज्ञाच्या टोन आणि ज्ञानानुसार परिणाम दिसून येतो.
ही मेमरी एजंटने जटिल काम करताना घेतलेले क्रमवार टप्पे, यश किंवा अपयश ठेवते. हे विशिष्ट “एपिसोड्स” किंवा भूतकाळातील अनुभव लक्षात ठेवून त्यातून शिकण्यासारखे आहे.
एपिसोडिक मेमरीचे उदाहरण
जर एजंटने एखादा विशिष्ट फ्लाइट बुक करण्याचा प्रयत्न केला पण तो अप्लब्धतेमुळे अयशस्वी झाला, तर एपिसोडिक मेमरी या अपयशाची नोंद ठेवू शकते, ज्यामुळे पुढील प्रयत्नात एजंट पर्यायी फ्लाइट्सची यादी तयार करू शकतो किंवा वापरकर्त्याला अधिक माहितीपूर्णपणे माहिती देऊ शकतो.
यामध्ये संभाषणांमधून विशिष्ट घटक (जसे लोक, ठिकाणे किंवा वस्तू) आणि घटना काढून लक्षात ठेवणे समाविष्ट आहे. ही एजंटला महत्वाच्या घटकांचा संरचित आकलन तयार करण्यास मदत करते.
घटक मेमरीचे उदाहरण
मागील प्रवासावर आधारित संभाषणातून, एजंट “पॅरिस,” “एफिल टॉवर,” आणि “ले चॅट नोयर रेस्टॉरंटमधील डिनर” सारखे घटक ओळखू शकतो. भविष्यातील संवादात एजंट “ले चॅट नोयर” लक्षात घेऊन तिथे नवीन आरक्षण करण्याची ऑफर देऊ शकतो.
RAG ही व्यापक तंत्र आहे, पण “संरचित RAG” ही एक शक्तिशाली मेमरी तंत्रज्ञान म्हणून अधोरेखित केली जाते. ती संभाषणे, ईमेल, प्रतिमा यांसारख्या विविध स्रोतांमधून घन, संरचित माहिती काढते आणि ती प्रतिसादात अचूकता, पुनर्प्राप्ती आणि वेग सुधारण्यासाठी वापरते. पारंपरिक RAG जी फक्त अर्थसांईनिक समानतेवर आधारित असते, त्यापेक्षा संरचित RAG माहितीच्या अंतर्निहित यथास्थितीसह कार्य करते.
संरचित RAG चे उदाहरण
फक्त कीवर्ड जुळवण्याऐवजी, संरचित RAG ईमेलमधून (गंतव्य, तारीख, वेळ, विमान कंपनी) फ्लाइट तपशील काढून त्यांना संरचित स्वरूपात साठवू शकते. त्यामुळे “मी मंगळवारी पॅरिससाठी कोणती फ्लाइट बुक केली?” असे अचूक प्रश्न विचारता येतात.
AI एजंटसाठी मेमरीची अंमलबजावणी म्हणजे एक सुसंगत प्रक्रिया ज्यामध्ये मेमरी व्यवस्थापन समाविष्ट आहे, ज्यात निर्मिती, साठवण, पुनर्प्राप्ती, एकत्रीकरण, अद्यतनीकरण, आणि अगदी ‘भूलले’ (किंवा हटवणे) देखील समाविष्ट आहे. या सर्वांमध्ये पुनर्प्राप्ती विशेषतः महत्त्वाचा भाग आहे.
एजंटची मेमरी साठवण्यासाठी आणि व्यवस्थापित करण्याचा एक मार्ग म्हणजे Mem0 सारखे विशेष टूल्स वापरणे. Mem0 ही सतत टिकणारी मेमरीची पातळी आहे, ज्यामुळे एजंट संबंधित संवाद लक्षात ठेवू शकतो, वापरकर्त्याच्या पसंती आणि तथ्यात्मक संदर्भ साठवू शकतो, आणि यश-अपयशांपासून कालांतराने शिकू शकतो. येथे स्थितीबाह्य एजंट्स स्थितीसमृद्ध एजंट्समध्ये रूपांतरित होतात.
ही दोन टप्प्यांत मेमरी प्रक्रिया म्हणजे काढणी आणि अद्यतन चालवते. प्रथम, एजंटच्या थ्रेडमध्ये संदेश जोडल्यावर ते Mem0 सेवेला पाठवले जातात, जी LLM वापरून संभाषणाचा सारांश काढते व नवीन मेमरी काढते. नंतर, LLM-चालित अद्यतन टप्पा ठरवतो की मेमरी जोडायची, बदलायची किंवा हटवायची आहे का; ही मेमरी वेक्टर, ग्राफ, आणि की-वॅल्यू डेटाबेससह हायब्रिड डेटा स्टोअरमध्ये संग्रहित केली जाते. हा प्रणाली वेगवेगळ्या मेमरी प्रकारांना समर्थन देते आणि घटकांमधील संबंध व्यवस्थापित करण्यासाठी ग्राफ मेमरी समाविष्ट करू शकते.
दुसरा शक्तिशाली दृष्टिकोन म्हणजे Cognee, एक ओपन-सोर्स सेमॅंटिक मेमरी जे AI एजंटसाठी संरचित आणि असंरचित डेटा क्वेरी करण्याजोग्या ज्ञान ग्राफमध्ये रूपांतरित करते, जो इम्बेडिंगने समर्थित असतो. Cognee मध्ये दुहेरी संच संरचना आहे, जिचा समावेश वेक्टर समानता शोध आणि ग्राफ संबंध बदलून एजंट्सना फक्त माहिती समान आहे का ते नव्हे, तर संकल्पना एकमेकांशी कशा संबंधित आहेत हे समजण्यास सक्षम करते.
हे हायब्रिड पुनर्प्राप्ती मध्ये उत्कृष्ट आहे, जे वेक्टर समानता, ग्राफ रचना, आणि LLM विचारसरणी यांचा मिलाप आहे - कच्च्या भाग शोधापासून ग्राफ समजून प्रश्न उत्तर करणे पर्यंत. हे प्रणाली जिवंत मेमरी ठेवते जी वाढते आणि विकसित होते, आणि क्वेरी करण्याजोगी असल्याने ती शॉर्ट-टर्म सत्र संदर्भ आणि दीर्घकालीन टिकणारी मेमरी दोन्हीला समर्थन देते.
Cognee नोटबुक ट्युटोरियल (13-agent-memory-cognee.ipynb) मध्ये या ऐक्य मेमरी स्तराचा बांधकाम दाखवले आहेत, ज्यात विविध डेटा स्रोतांकरिता इंग्गेशन्स, ज्ञान ग्राफचे दृश्य रूप, आणि विशिष्ट एजंट गरजांसाठी सानुकूल शोध धोरणे वापरून क्वेरी करणे यांचे व्यावहारिक उदाहरणे समाविष्ट आहेत.
mem0 सारख्या विशेष मेमरी टूल्सव्यतिरिक्त, आपण मजबूत शोध सेवा जसे की Azure AI Search चा वापर करून मेमरी साठवण्याचा आणि पुनर्प्राप्त करण्याचा आधार म्हणून वापर करू शकतो, विशेषतः संरचित RAG साठी.
हे आपल्याला आपल्या एजंटच्या प्रतिसादांना आपल्या स्वतःच्या डेटावर आधारित बनवण्याची परवानगी देते, ज्यामुळे अधिक संबंधित आणि अचूक उत्तरं मिळतात. Azure AI Search वापरकर्ता-विशिष्ट प्रवासाच्या मेमरी, उत्पादन कॅटलॉग किंवा इतर कोणत्याही डोमेन-स्पेसिफिक ज्ञानासाठी साठवण आणि पुनर्प्राप्ती करताना उपयुक्त ठरू शकतो.
Azure AI Search मध्ये संरचित RAG सारख्या क्षमतांचा समावेश आहे, ज्यामुळे मोठ्या डेटासेट्समधून (जसे संभाषणे, ईमेल, प्रतिमा) घन, संरचित माहिती काढणे आणि पुनर्प्राप्त करणे शक्य होते. पारंपरिक टेक्स्ट चंकिंग आणि इम्बेडिंग पद्धतींपेक्षा याला “अत्याधुनिक अचूकता आणि पुनर्प्राप्ती” मिळते.
स्वतःला सुधारत जाणाऱ्या एजंटसाठी एक सामान्य नमुना म्हणजे “ज्ञान एजंट” तयार करणे. हा वेगळा एजंट वापरकर्ता आणि मुख्य एजंट यांच्यातील मुख्य संभाषण निरीक्षण करतो. त्याची भूमिका आहे:
मूल्यवान माहिती ओळखणे: संभाषणातील कोणतीही माहिती सामान्य ज्ञान किंवा विशिष्ट वापरकर्त्याची पसंती म्हणून जतन करण्यायोग्य आहे का हे ठरवणे.
काढणे आणि सारांश तयार करणे: संभाषणातून आवश्यक शिकवण किंवा पसंती सारांशित करणे.
ज्ञान भांडारात साठवणे: हा काढलेला डेटा सतत वापरण्यासाठी, बहुधा वेक्टर डेटाबेसमध्ये, साठवणे.
पुढील क्वेरीज वाढवणे: जेव्हा वापरकर्ता नवीन क्वेरी सुरू करतो, तेव्हा ज्ञान एजंट विसरतांना संबंधित माहिती पुनर्प्राप्त करून वापरकर्त्याच्या प्रॉम्प्टसाठी जोडतो, ज्यामुळे मुख्य एजंटला अत्यंत महत्त्वाचा संदर्भ मिळतो (RAG प्रमाणे).
• प्रत्येक संवादाचा विलंब कमी करणे: वापरकर्त्याशी संवाद हळू न होण्याकरिता सुरुवातीला स्वस्त, वेगवान मॉडेल वापरून तपासणी केली जाते की माहिती संग्रहित किंवा पुनर्प्राप्त करण्यायोग्य आहे का, आणि फक्त गरजेनुसार जटिल काढणी/पुनर्प्राप्ती प्रक्रिया वापरली जाते.
• ज्ञान भांडाराचे व्यवस्थापन: वाढत्या ज्ञान भांडारासाठी कमी वापरलेली माहिती “कोल्ड स्टोरेज” मध्ये हलवून खर्च व्यवस्थापित करणे.
Microsoft Foundry Discord मध्ये सामील व्हा आणि इतर शिकणाऱ्यांशी भेटा, ऑफिस आवर्समध्ये सहभागी व्हा आणि आपल्या AI एजंट्सविषयी प्रश्नांची उत्तरे मिळवा.
इतिरेखा: हा दस्तऐवज AI अनुवाद सेवा Co-op Translator वापरून अनुवादित केला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित अनुवादांमध्ये त्रुटी किंवा चुकीचे अर्थ असू शकतात. मूळ दस्तऐवज त्याच्या मूळ भाषेत अधिकृत स्रोत म्हणून पाहिला पाहिजे. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानव अनुवाद घेण्याचा सल्ला दिला जातो. या अनुवादाच्या वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार नाही.