ai-agents-for-beginners

AI एजंटसाठी मेमरी

Agent Memory

AI एजंटस तयार करण्याच्या अद्वितीय फायद्यांवर चर्चा करताना दोन गोष्टी मुख्यत्वे चर्चिले जातात: कार्य पूर्ण करण्यासाठी टूल्स कॉल करण्याची क्षमता आणि वेळोवेळी सुधारणा करण्याची क्षमता. स्वतःला सुधारणा करणारा एजंट तयार करण्याचा पाया म्हणजे मेमरी, जी आपल्या वापरकर्त्यांसाठी चांगले अनुभव तयार करू शकते.

या धड्यात, आपण AI एजंटसाठी मेमरी म्हणजे काय आणि आपण त्याचे व्यवस्थापन कसे करू शकतो आणि आपल्या अनुप्रयोगांच्या फायद्यासाठी ते कसे वापरू शकतो हे पाहू.

परिचय

हा धडा खालील बाबींची माहिती देईल:

AI एजंट मेमरी समजून घेणे: मेमरी म्हणजे काय आणि एजंटसाठी ती का आवश्यक आहे.

मेमरीची अंमलबजावणी आणि साठवणूक: आपल्या AI एजंट्समध्ये मेमरी क्षमता जोडण्यासाठी व्यावहारिक पद्धती, ज्यात अल्पकालीन आणि दीर्घकालीन मेमरीवर भर दिला आहे.

AI एजंट्सना स्वतः सुधारणा करणारे बनविणे: मेमरी कशी एजंट्सना पूर्वीच्या संवादातून शिकायला आणि वेळोवेळी सुधारायला मदत करते.

उपलब्ध अंमलबजावण्या

हा धडा दोन सविस्तर नोटबुक ट्युटोरियल्सचा समावेश करतो:

13-agent-memory.ipynb: Mem0 आणि Azure AI Search सह Semantic Kernel फ्रेमवर्क वापरून मेमरीची अंमलबजावणी करते

13-agent-memory-cognee.ipynb: Cognee वापरून संरचित मेमरीची अंमलबजावणी करते, जी एम्बेडिंग्सद्वारे समर्थित ज्ञान ग्राफ तयार करते, ग्राफाचे दृश्य प्रस्तुत करते आणि बुद्धिमान पुनर्प्राप्ती करते

शिकण्याच्या उद्दिष्टांचा

हा धडा पूर्ण केल्यानंतर, आपण खालील गोष्टी शिकाल:

AI एजंट मेमरीच्या विविध प्रकारांमधील फरक ओळखणे, ज्यात कार्यकारी, अल्पकालीन आणि दीर्घकालीन मेमरी तसेच व्यक्तिमत्व आणि एपिसोडिक मेमरी सारखे विशेष प्रकार समाविष्ट आहेत.

Semantic Kernel फ्रेमवर्क वापरून अल्पकालीन आणि दीर्घकालीन मेमरी लागू आणि व्यवस्थापित करणे, Mem0, Cognee, व्हाइटबोर्ड मेमरीसारख्या टूल्सचा वापर आणि Azure AI Search सह एकत्रीकरण करून.

स्वतः सुधारणा करणाऱ्या AI एजंट्सच्या तत्त्वज्ञानाचा समज आणि मजबूत मेमरी व्यवस्थापन प्रणाली सतत शिक्षण आणि अनुकूलनात कशी मदत करते हे.

AI एजंट मेमरी समजून घेणे

मेमरीचा मूळ अर्थ म्हणजे AI एजंटसना माहिती ठेवण्याची आणि पुन्हा आठवण्याची क्षमता मिळवून देणाऱ्या मेकॅनिझम्स. ही माहिती संभाषणातील विशिष्ट तपशील, वापरकर्त्याच्या पसंती, पूर्वीच्या क्रियाकलाप किंवा शिकलेल्या नमुन्यांशी संबंधित असू शकते.

मेमरीशिवाय, AI अनुप्रयोग बहुतेकवेळा राज्यरहित (stateless) असतात, म्हणजे प्रत्येक संवाद पुन्हा सुरुवातीपासून सुरू होतो. यामुळे वापरकर्त्याला त्रासदायक आणि पुनरावृत्तीचा अनुभव होऊ शकतो, जिथे एजंट आधीचा संदर्भ किंवा पसंती “भूलतो”.

मेमरी महत्वाची का आहे?

एजंटचे बुद्धिमत्तेचे मूळ त्याच्या पूर्वीच्या माहितीला आठवण्याची आणि वापरण्याची क्षमता आहे. मेमरी एजंटना असे बनवते:

परावर्तक: पूर्वीच्या क्रिया आणि परिणामांमधून शिकणे.

आंतरक्रियात्मक: चालू संभाषणाचा संदर्भ टिकवून ठेवणे.

पूर्वसूचक आणि प्रतिक्रियाशील: ऐतिहासिक डेटावरून गरजा भाकीत करणे किंवा योग्य प्रतिसाद देणे.

स्वायत्त: संचयित ज्ञानावर अवलंबून अधिक स्वायत्तपणे कार्य करणे.

मेमरीची अंमलबजावणी करण्याचा उद्देश एजंट्सना अधिक विश्वसनीय आणि सक्षम बनवणे हा आहे.

मेमरीचे प्रकार

कार्यकारी मेमरी

हे तसू पत्र किंवा एका तुकड्याच्या कागदाच्या सारखे आहे जे एजंट एका चालू, सध्याच्या कार्य किंवा विचार प्रक्रियेदरम्यान वापरतो. हे पुढील टप्प्यासाठी लागणारी तत्काळ माहिती ठेवते.

AI एजंटसाठी, कार्यकारी मेमरी संभाषणातील सर्वात संबंधित माहिती पकडते, जरी पूर्ण चॅट इतिहास लांब अथवा कट झालेला असला तरी. ही महत्वाच्या बाबी जसे की आवश्यकताः, प्रस्ताव, निर्णय आणि क्रिया यावर लक्ष केंद्रित करते.

कार्यकारी मेमरीचे उदाहरण

प्रवास बुकिंग एजंटमध्ये, कार्यकारी मेमरी वापरकर्त्याच्या चालू विनंती जसे की “मला पॅरिसला प्रवास बुक करायचा आहे” ह्या विशेष मागणीला पकडते. ही माहिती एजंटच्या तात्काळ संदर्भात सध्याच्या संवादासाठी मार्गदर्शन करते.

अल्पकालीन मेमरी

हा मेमरी प्रकार एकाच संभाषण किंवा सत्रासाठी माहिती ठेवतो. हा सध्याच्या चॅटचा संदर्भ आहे, ज्यामुळे एजंट मागील संवादाच्या टप्प्यांकडे परत पाहू शकतो.

अल्पकालीन मेमरीचे उदाहरण

जर वापरकर्त्याने विचारले, “पॅरिसला फ्लाइट किती खर्च येईल?” आणि नंतर विचारले “त्या ठिकाणी निवासाबद्दल काय?”, तर अल्पकालीन मेमरी एजंटला “त्या” म्हणजे त्या संभाषणामध्ये “पॅरिस” असल्याची माहिती देतो.

दीर्घकालीन मेमरी

ही माहिती अनेक संवाद किंवा सत्रांमध्ये टिकून राहते. ती एजंटसना वापरकर्त्याच्या पसंती, ऐतिहासिक संवाद किंवा सामान्य ज्ञान आठवणे शक्य करते. ही वैयक्तिकरणासाठी महत्त्वाची आहे.

दीर्घकालीन मेमरीचे उदाहरण

दीर्घकालीन मेमरी मध्ये “बेनला स्कीइंग आणि बाहेरच्या क्रियांमध्ये रस आहे, त्याला पर्वत दृश्यासमवेत कॅफी आवडते, आणि एका पूर्वीच्या जखमेमुळे प्रगत स्की स्लोप्स टाळायचे आहेत” ही माहिती साठवली जाते. ही माहिती भविष्यातील प्रवास नियोजन सत्रांमध्ये शिफारसींवर प्रभाव टाकते, ज्यामुळे त्या सत्रे अत्यंत वैयक्तिकृत होतात.

व्यक्तिमत्व मेमरी

हा विशेष प्रकार एजंटला एक सातत्यपूर्ण “व्यक्तिमत्व” किंवा “प्रोल” विकसित करण्यात मदत करतो. तो एजंटला स्वतःबद्दल किंवा त्याच्या हेतूच्या भूमिकेबद्दल तपशील आठवू शकतो, ज्यामुळे संवाद अधिक सुरळीत आणि केंद्रित होतात.

व्यक्तिमत्व मेमरीचे उदाहरण

जर प्रवास एजंट “एक तज्ञ स्की नियोजक” म्हणून तयार केला असेल, तर व्यक्तिमत्व मेमरी ही भूमिका पुष्टी करेल, ज्यामुळे त्याच्या प्रतिसादांत तज्ञाचे आवाज आणि ज्ञान प्रतिबिंबित होईल.

वर्कफ्लो/एपिसोडिक मेमरी

ही मेमरी एका क्लिष्ट कार्यादरम्यान एजंटने घेतलेल्या टप्प्यांची मालिका साठवते, ज्यामध्ये यश आणि अपयश यांचा समावेश असतो. ही विशिष्ट “एपिसोड” किंवा पूर्वीच्या अनुभवांचे स्मरण ठेवून त्यातून शिकण्यासारखी आहे.

एपिसोडिक मेमरीचे उदाहरण

जर एजंटने एखाद्या विशिष्ट फ्लाइटची बुकिंग करण्याचा प्रयत्न केला पण ती उपलब्ध नसल्यामुळे अयशस्वी ठरला, तर एपिसोडिक मेमरी हा अपयश नोंदवते. यामुळे एजंट पुढच्या प्रयत्नात पर्यायी फ्लाइट्स बघू शकतो किंवा वापरकर्त्याला अधिक माहितीपूर्ण रीतीने समस्या सांगू शकतो.

घटक मेमरी

या प्रकारात संभाषणांमधून विशिष्ट घटक (जसे माणसं, ठिकाणे, किंवा वस्तू) आणि घटना ओळखून ठेवणे येते. यामुळे एजंटला चर्चिलेल्या मुख्य घटकांचे संरचित समज तयार करता येते.

घटक मेमरीचे उदाहरण

एखाद्या गत प्रवासाबद्दल संभाषणात, एजंट “पॅरिस,” “एफिल टॉवर,” आणि “ले शात नोअर रेस्टॉरंटमध्ये जेवण” अशी घटक काढू शकतो. भविष्यातील संवादात, एजंट “ले शात नोअर” आठवून तिथे नवीन आरक्षण करण्याची ऑफर देऊ शकतो.

संरचित RAG (रेट्रीवल ऑगमेंटेड जनरेशन)

RAG ही एक व्यापक तंत्र आहे, परंतु “संरचित RAG” एक शक्तिशाली मेमरी तंत्रज्ञान म्हणून अधोरेखित आहे. हे विविध स्रोतांमधून (संभाषणे, ईमेल, प्रतिमा) दाट, संरचित माहिती काढून त्याचा उपयोग प्रतिसादांमध्ये अचूकता, आठवण सुधारण्यासाठी आणि वेग वाढवण्यासाठी करते. पारंपरिक RAG ज्यामध्ये केवळ अर्थसंगत सादृश्यतेवर अवलंबून असते त्यापेक्षा भिन्न, संरचित RAG माहितीच्या अंतर्निहित रचनेवर काम करते.

संरचित RAG उदाहरण

फक्त कीवर्ड जुळवण्याऐवजी, संरचित RAG ईमेलमधून फ्लाइट तपशील (गंतव्य, तारीख, वेळ, विमानसेवा) काढून संरचित पद्धतीने साठवू शकते. यामुळे “मी मंगळवार रोजी पॅरिसला कोणती फ्लाइट बुक केली?” अशा अचूक प्रश्नांची उत्तरे देणे शक्य होते.

मेमरीची अंमलबजावणी आणि साठवणूक

AI एजंटसाठी मेमरी अंमलात आणणे ही एक प्रणालीबद्ध प्रक्रिया आहे ज्यात मेमरी व्यवस्थापन समाविष्ट आहे, ज्यात माहिती निर्माण करणे, साठवणे, पुनर्प्राप्त करणे, एकत्र करणे, अद्ययावत करणे आणि “भूलणे” (किंवा हटवणे) यांचा समावेश होतो. पुनर्प्राप्ती हा विशेष महत्वाचा भाग आहे.

विशेष मेमरी टूल्स

Mem0

एजंट मेमरी साठवण्यासाठी आणि व्यवस्थापित करण्याचा एक मार्ग म्हणजे Mem0 सारखे विशेष टूल्स वापरणे. Mem0 एक कायमस्वरूपी मेमरी स्तर म्हणून कार्य करते, ज्यामुळे एजंट पूर्वीच्या संबंधित संवादांची आठवण ठेवू शकतात, वापरकर्त्याच्या पसंती आणि तथ्यात्मक संदर्भ साठवू शकतात आणि यश-अपयशांमधून वेळोवेळी शिकू शकतात. ह्याचा अर्थ असा की राज्यरहित एजंट राज्ययुक्त एजंटमध्ये रूपांतरित होतात.

हे दोन टप्प्यातील मेमरी पाइपलाइन: संक्षेपण आणि अद्ययावत मार्फत कार्य करते. प्रथम, एजंटच्या थ्रेडमध्ये जोडलेल्या मेसेजेस Mem0 सेवेला पाठवले जातात, जिथे मोठ्या भाषा मॉडेलने (LLM) संभाषणाचा इतिहास संक्षेपित करतो आणि नवीन मेमरीज काढतो. नंतर LLM-चालित अद्ययावत टप्पा ठरवतो की या मेमरीज जोडायच्या, सुधारायच्या की हटवायच्या, ज्याचा संग्रहित डेटा वेक्टर, ग्राफ आणि की-वैल डेटाबेसचा मिश्रित स्वरूप असू शकतो. या प्रणालीमध्ये विविध मेमरी प्रकारांचा समावेश आहे आणि घटकांमधील नातेसंबंधासाठी ग्राफ मेमरीचा समावेशही केला जाऊ शकतो.

Cognee

एक आणखी शक्तिशाली पद्धत म्हणजे Cognee, जे AI एजंटसाठी एक ओपन-सोर्स सेमॅंटिक मेमरी आहे जी संरचित आणि असंरचित डेटा क्वेरीयोग्य ज्ञान ग्राफ मध्ये रूपांतरित करते, जे एम्बेडिंग्सने समर्थित आहे. Cognee एक द्वि-दुकान आर्किटेक्चर पुरवते ज्यात वेक्टर सादृश्य शोध आणि ग्राफ संबंध यांचा सुसंयोग केला जातो, ज्यामुळे एजंट्सना केवळ माहिती सादृश्य नाही तर संकल्पना कशा संबंधित आहेत हे देखील समजते.

हे हायब्रिड पुनर्प्राप्ती मध्ये उत्कृष्ट आहे, ज्यात वेक्टर सादृश्यता, ग्राफ रचना आणि LLM तर्कशुद्धी यांचा समावेश आहे – कच्च्या तुकड्याच्या शोधापासून ग्राफ-समजूतदार प्रश्नोत्तरेपर्यंत. हा सिस्टम सजीव मेमरी राखतो जी विकसित आणि वाढते आणि एकत्रित ग्राफ म्हणून क्वेरीयोग्य राहते, अल्पकालीन सत्र संदर्भ आणि दीर्घकालीन कायमस्वरूपी मेमरी दोन्ही समर्थित करतो.

Cognee नोटबुक ट्युटोरियल (13-agent-memory-cognee.ipynb) मध्ये या एकत्रित मेमरी स्तराची निर्मिती दर्शविली आहे, ज्यामध्ये विविध डेटा स्रोत घेणे, ज्ञान ग्राफचे दृश्य प्रस्तुत करणे आणि वेगवेगळ्या शोध धोरणांसह क्वेरी करणे याची व्यावहारिक उदाहरणे आहेत जी विशिष्ट एजंट गरजांसाठी तयार केलेली आहेत.

RAG सह मेमरी साठवणूक

Mem0 सारख्या विशेष मेमरी टूल्सव्यतिरिक्त, आपण मजबूत शोध सेवा वापरू शकता जसे की Azure AI Search मेमरीज साठवण्यासाठी आणि पुनर्प्राप्त करण्यासाठी विशेषतः संरचित RAG साठी.

हे आपल्याला आपला एजंटचे प्रतिसाद आपल्या स्वतःच्या डेटावर आधारित ठेवण्याची परवानगी देते, ज्यामुळे अधिक संबंधित आणि अचूक उत्तरे मिळतात. Azure AI Search वापरकर्त्यांच्या प्रवासाशी संबंधित मेमरीज, उत्पादन कॅटलॉग किंवा कोणत्याही विशिष्ट क्षेत्राच्या ज्ञानासाठी वापरला जाऊ शकतो.

Azure AI Search मध्ये संरचित RAG सारख्या क्षमताही आहेत, ज्यात मोठ्या डेटासेटमधून (संभाषण इतिहास, ईमेल, प्रतिमा) दाट, संरचित माहिती काढून ठेवणे आणि पुनर्प्राप्त करणे उत्कृष्टपणे केले जाते. हे पारंपरिक टेक्स्ट तुकड्यांच्या आणि एम्बेडिंग्सच्या तुलनेत “मानवी क्षमतेपलीकडचे अचूकता आणि आठवण” प्रदान करते.

AI एजंटना स्वतः सुधारणा करणे

स्वतः सुधारणा करणाऱ्या एजंटसाठी एक सामान्य नमुना म्हणजे “ज्ञान एजंट” ची ओळख करून देणे. हा वेगळा एजंट वापरकर्ता आणि मुख्य एजंट यांच्यातील मुख्य संभाषणाचे निरीक्षण करतो. त्याची भूमिका आहे:

  1. मूल्यवान माहिती ओळखणे: संभाषणातील कोणतीही भाग सामान्य ज्ञान किंवा विशिष्ट वापरकर्ता पसंती म्हणून जतन करण्यासारखे आहे का ते ठरवणे.

  2. काढणे आणि संक्षेप करणे: संभाषणातील आवश्यक शिकवण किंवा पसंती सारांशित करणे.

  3. ज्ञानसंपादित ठिकाणी साठवणे: ही माहिती साठवणे, बहुधा वेक्टर डेटाबेसमध्ये, जेणेकरून नंतर पुन्हा मिळवता येईल.

  4. भविष्यातील क्वेरींना सामावून घेणे: जेव्हा वापरकर्ता नवीन चौकशी करतो, तेव्हा ज्ञान एजंट संबंधित साठवलेली माहिती घेऊन वापरकर्त्याच्या प्रॉम्प्टमध्ये जोडतो, ज्यामुळे प्राथमिक एजंटला (RAG प्रमाणे) आवश्यक संदर्भ मिळतो.

मेमरीसाठी ऑप्टिमायझेशन्स

प्रतिक्रिया वेळेचे व्यवस्थापन: वापरकर्ता संवाद मंदावू नयेत म्हणून, सुरुवातीला एक स्वस्त, जलद मॉडेल वापरले जाऊ शकते जे लवकर तपासते की माहिती साठवणे किंवा पुनर्प्राप्त करणे आवश्यक आहे का, आणि केवळ गरज भासल्यास क्लिष्ट प्रक्रिया वापरते.

ज्ञानसंपादनाचे देखभाल: वाढत्या ज्ञानसंपादनासाठी, कमी वापरली जाणारी माहिती “कोल्ड स्टोरेज” मध्ये हलवून खर्चाचे नियमन केले जाऊ शकते.

एजंट मेमरीविषयी अजून प्रश्न आहेत का?

इतर शिकणाऱ्यांशी भेटण्यासाठी, ऑफिस तासांना उपस्थित राहण्यासाठी आणि आपल्या AI एजंटसंबंधी प्रश्नांची उत्तरे मिळवण्यासाठी Azure AI Foundry Discord मध्ये सहभागी व्हा.


अस्वीकरण: हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित केला आहे. आम्ही अचूकतेसाठी प्रयत्न करत असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये चुका किंवा अचूकतेत गैरसमज असू शकतो. मूळ दस्तऐवज त्याच्या स्थानिक भाषेत अधिकृत स्रोत मानली पाहिजे. महत्त्वाच्या माहितीकरिता व्यावसायिक मानवी भाषांतर शिफारस केली जाते. या भाषांतराच्या वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थलागीबद्दल आम्ही जबाबदार नाही.