ai-agents-for-beginners

AI एजंट्ससाठी मेमरी

एजंट मेमरी

AI एजंट्स तयार करण्याच्या अनोख्या फायद्यांबद्दल चर्चा करताना दोन गोष्टी मुख्यतः चर्चेत असतात: टूल्स वापरून कार्य पूर्ण करण्याची क्षमता आणि वेळोवेळी सुधारणा करण्याची क्षमता. मेमरी ही स्वतः सुधारणा करणाऱ्या एजंट्स तयार करण्याचा पाया आहे, ज्यामुळे आपल्या वापरकर्त्यांसाठी चांगले अनुभव निर्माण होतात.

या धड्यात, आपण AI एजंट्ससाठी मेमरी म्हणजे काय, ती कशी व्यवस्थापित करावी आणि आपल्या अॅप्लिकेशन्ससाठी ती कशी फायदेशीर ठरवावी यावर चर्चा करू.

परिचय

या धड्यात आपण शिकणार आहोत:

AI एजंट मेमरी समजून घेणे: मेमरी म्हणजे काय आणि एजंट्ससाठी ती का महत्त्वाची आहे.

मेमरी अंमलात आणणे आणि साठवणे: आपल्या AI एजंट्समध्ये मेमरी क्षमता जोडण्यासाठी व्यावहारिक पद्धती, ज्यामध्ये अल्पकालीन आणि दीर्घकालीन मेमरीवर लक्ष केंद्रित केले आहे.

AI एजंट्स स्वतः सुधारणा कसे करतात: मेमरी एजंट्सना भूतकाळातील संवादांमधून शिकण्यास आणि वेळोवेळी सुधारणा करण्यास कशी मदत करते.

उपलब्ध अंमलबजावणी

या धड्यात दोन सविस्तर नोटबुक ट्यूटोरियल्स समाविष्ट आहेत:

13-agent-memory.ipynb: Mem0 आणि Azure AI Search वापरून Semantic Kernel फ्रेमवर्कसह मेमरी अंमलात आणते.

13-agent-memory-cognee.ipynb: Cognee वापरून संरचित मेमरी अंमलात आणते, ज्यामध्ये एम्बेडिंगद्वारे समर्थित ज्ञान ग्राफ तयार करणे, ग्राफ व्हिज्युअलायझेशन आणि बुद्धिमान पुनर्प्राप्ती समाविष्ट आहे.

शिकण्याची उद्दिष्टे

हा धडा पूर्ण केल्यानंतर, तुम्हाला खालील गोष्टी माहित असतील:

AI एजंट्सच्या विविध प्रकारच्या मेमरीमध्ये फरक ओळखणे, ज्यामध्ये कार्यरत, अल्पकालीन आणि दीर्घकालीन मेमरी तसेच व्यक्तिमत्व आणि एपिसोडिक मेमरीसारख्या विशेष प्रकारांचा समावेश आहे.

AI एजंट्ससाठी अल्पकालीन आणि दीर्घकालीन मेमरी अंमलात आणणे आणि व्यवस्थापित करणे Semantic Kernel फ्रेमवर्क वापरून, Mem0, Cognee, Whiteboard मेमरी आणि Azure AI Search सह एकत्रित करून.

स्वतः सुधारणा करणाऱ्या AI एजंट्सच्या मागील तत्त्वे समजून घेणे आणि मजबूत मेमरी व्यवस्थापन प्रणाली सतत शिकण्यास आणि अनुकूलतेस कशी मदत करते.

AI एजंट मेमरी समजून घेणे

मूलत: AI एजंट्ससाठी मेमरी म्हणजे त्यांना माहिती टिकवून ठेवण्याची आणि आठवण्याची परवानगी देणारे यंत्रणा. ही माहिती संवादातील विशिष्ट तपशील, वापरकर्त्याच्या प्राधान्ये, भूतकाळातील कृती किंवा शिकलेले नमुने असू शकते.

मेमरीशिवाय, AI अॅप्लिकेशन्स अनेकदा स्टेटलेस असतात, म्हणजे प्रत्येक संवाद नव्याने सुरू होतो. यामुळे एजंट भूतकाळातील संदर्भ किंवा प्राधान्ये “विसरतो” आणि वापरकर्त्याचा अनुभव पुनरावृत्तीपूर्ण आणि निराशाजनक होतो.

मेमरी का महत्त्वाची आहे?

एजंट्सची बुद्धिमत्ता भूतकाळातील माहिती आठवण्याची आणि वापरण्याची क्षमता यावर खूप अवलंबून असते. मेमरी एजंट्सना खालील प्रकारे मदत करते:

प्रतिबिंबित: भूतकाळातील कृती आणि परिणामांमधून शिकणे.

संवादी: चालू संवादाचा संदर्भ टिकवून ठेवणे.

प्रोएक्टिव्ह आणि रिएक्टिव्ह: ऐतिहासिक डेटावर आधारित गरजा ओळखणे किंवा योग्य प्रतिसाद देणे.

स्वायत्त: साठवलेल्या ज्ञानाचा वापर करून अधिक स्वतंत्रपणे कार्य करणे.

मेमरी अंमलात आणण्याचे उद्दिष्ट एजंट्स अधिक विश्वसनीय आणि सक्षम बनवणे आहे.

मेमरीचे प्रकार

कार्यरत मेमरी

याला एजंट एका विशिष्ट कार्य किंवा विचार प्रक्रियेदरम्यान वापरत असलेल्या तात्पुरत्या माहितीचा तुकडा समजले जाते. हे पुढील चरणाची गणना करण्यासाठी आवश्यक तात्काळ माहिती ठेवते.

AI एजंट्ससाठी, कार्यरत मेमरी अनेकदा संवादातील सर्वात संबंधित माहिती कॅप्चर करते, जरी पूर्ण चॅट इतिहास लांब किंवा कापलेला असला तरी. हे आवश्यकता, प्रस्ताव, निर्णय आणि कृती यासारख्या प्रमुख घटक काढण्यावर लक्ष केंद्रित करते.

कार्यरत मेमरीचे उदाहरण

प्रवास बुकिंग एजंटमध्ये, कार्यरत मेमरी वापरकर्त्याच्या सध्याच्या विनंतीसाठी “मला पॅरिसला प्रवास बुक करायचा आहे” असे कॅप्चर करू शकते. ही विशिष्ट आवश्यकता सध्याच्या संवादाचे मार्गदर्शन करण्यासाठी एजंटच्या तात्काळ संदर्भात ठेवली जाते.

अल्पकालीन मेमरी

हा प्रकार एका संवाद किंवा सत्राच्या कालावधीसाठी माहिती टिकवून ठेवतो. हे चालू चॅटचे संदर्भ आहे, ज्यामुळे एजंटला संवादातील मागील टप्प्यांचा संदर्भ घेता येतो.

अल्पकालीन मेमरीचे उदाहरण

जर वापरकर्त्याने विचारले, “पॅरिसला फ्लाइट किती खर्च येईल?” आणि नंतर “तेथे निवासस्थानाबद्दल काय?”, तर अल्पकालीन मेमरी एजंटला “तेथे” म्हणजे “पॅरिस” असल्याचे माहित ठेवते.

दीर्घकालीन मेमरी

ही माहिती अनेक संवाद किंवा सत्रांमध्ये टिकून राहते. यामुळे एजंट्सना वापरकर्त्याच्या प्राधान्ये, ऐतिहासिक संवाद किंवा सामान्य ज्ञान दीर्घकाळ टिकवून ठेवता येते. वैयक्तिकरणासाठी हे महत्त्वाचे आहे.

दीर्घकालीन मेमरीचे उदाहरण

दीर्घकालीन मेमरी “बेनला स्कीइंग आणि बाह्य क्रियाकलाप आवडतात, माउंटन व्ह्यूसह कॉफी आवडते आणि भूतकाळातील दुखापतीमुळे प्रगत स्की स्लोप्स टाळायचे आहेत” असे साठवू शकते. ही माहिती, मागील संवादांमधून शिकलेली, भविष्यातील प्रवास नियोजन सत्रांमध्ये शिफारसींवर प्रभाव टाकते, ज्यामुळे त्या अत्यंत वैयक्तिकृत होतात.

व्यक्तिमत्व मेमरी

हा विशेष मेमरी प्रकार एजंटला सुसंगत “व्यक्तिमत्व” किंवा “व्यक्तिमत्व” विकसित करण्यात मदत करतो. यामुळे एजंटला स्वतःबद्दल किंवा त्याच्या इच्छित भूमिकेबद्दल तपशील लक्षात ठेवता येतो, ज्यामुळे संवाद अधिक प्रवाही आणि केंद्रित होतो.

व्यक्तिमत्व मेमरीचे उदाहरण

जर प्रवास एजंट “तज्ञ स्की प्लॅनर” म्हणून डिझाइन केलेला असेल, तर व्यक्तिमत्व मेमरी ही भूमिका मजबूत करू शकते, ज्यामुळे त्याच्या प्रतिसादांवर तज्ञाच्या टोन आणि ज्ञानाशी सुसंगत परिणाम होतो.

कार्यप्रवाह/एपिसोडिक मेमरी

ही मेमरी एजंटने जटिल कार्यादरम्यान घेतलेल्या चरणांचा क्रम, यश आणि अपयश साठवते. हे भूतकाळातील विशिष्ट “एपिसोड” किंवा अनुभव लक्षात ठेवण्यासारखे आहे, ज्यामुळे त्यातून शिकता येते.

एपिसोडिक मेमरीचे उदाहरण

जर एजंटने विशिष्ट फ्लाइट बुक करण्याचा प्रयत्न केला पण ती अनुपलब्धतेमुळे अयशस्वी झाली, तर एपिसोडिक मेमरी ही अयशस्वीता नोंदवू शकते, ज्यामुळे एजंटला पर्यायी फ्लाइट्सचा प्रयत्न करता येतो किंवा वापरकर्त्याला पुढील प्रयत्नादरम्यान अधिक माहितीपूर्ण पद्धतीने समस्या सांगता येते.

घटक मेमरी

यामध्ये संवादांमधून विशिष्ट घटक (जसे की लोक, ठिकाणे किंवा वस्तू) आणि घटना काढणे आणि लक्षात ठेवणे समाविष्ट आहे. यामुळे एजंटला चर्चेत असलेल्या प्रमुख घटकांची संरचित समज तयार करता येते.

घटक मेमरीचे उदाहरण

भूतकाळातील प्रवासाबद्दलच्या संवादातून, एजंट “पॅरिस,” “आयफेल टॉवर,” आणि “ले चॅट नोयर रेस्टॉरंटमध्ये डिनर” असे घटक काढू शकतो. भविष्यातील संवादात, एजंट “ले चॅट नोयर” लक्षात ठेवू शकतो आणि तेथे नवीन आरक्षण करण्याची ऑफर देऊ शकतो.

संरचित RAG (पुनर्प्राप्ती वाढवलेली निर्मिती)

RAG ही एक व्यापक तंत्र आहे, परंतु “संरचित RAG” हे एक शक्तिशाली मेमरी तंत्रज्ञान म्हणून अधोरेखित केले जाते. हे विविध स्रोतांमधून (संवाद, ईमेल, प्रतिमा) घन, संरचित माहिती काढते आणि प्रतिसादांमध्ये अचूकता, पुनर्प्राप्ती आणि गती वाढवण्यासाठी वापरते. क्लासिक RAG केवळ सेमॅंटिक साम्यावर अवलंबून असते, तर संरचित RAG माहितीच्या अंतर्गत संरचनेवर कार्य करते.

संरचित RAG चे उदाहरण

फक्त कीवर्ड जुळवण्याऐवजी, संरचित RAG ईमेलमधून फ्लाइट तपशील (गंतव्यस्थान, तारीख, वेळ, एअरलाइन) पार्स करू शकते आणि ते संरचित पद्धतीने साठवू शकते. यामुळे “मंगळवारी पॅरिसला कोणती फ्लाइट बुक केली?” यासारख्या अचूक क्वेरींना परवानगी मिळते.

मेमरी अंमलात आणणे आणि साठवणे

AI एजंट्ससाठी मेमरी अंमलात आणणे म्हणजे मेमरी व्यवस्थापन प्रक्रिया, ज्यामध्ये माहिती निर्माण करणे, साठवणे, पुनर्प्राप्त करणे, एकत्रित करणे, अद्यतनित करणे आणि “विसरणे” (किंवा हटवणे) समाविष्ट आहे. पुनर्प्राप्ती हा विशेषतः महत्त्वाचा पैलू आहे.

विशेष मेमरी टूल्स

Mem0

एजंट मेमरी साठवण्यासाठी आणि व्यवस्थापित करण्याचा एक मार्ग म्हणजे Mem0 सारख्या विशेष टूल्सचा वापर. Mem0 एक स्थिर मेमरी लेयर म्हणून कार्य करते, ज्यामुळे एजंट्सना संबंधित संवाद आठवणे, वापरकर्त्याच्या प्राधान्ये आणि तथ्यात्मक संदर्भ साठवणे आणि वेळोवेळी यश आणि अपयशांमधून शिकणे शक्य होते. येथे कल्पना अशी आहे की स्टेटलेस एजंट्स स्टेटफुल बनतात.

हे दोन-चरणीय मेमरी पाइपलाइन: एक्स्ट्रॅक्शन आणि अपडेट द्वारे कार्य करते. प्रथम, एजंटच्या थ्रेडमध्ये जोडलेले संदेश Mem0 सेवेकडे पाठवले जातात, जे संवाद इतिहासाचा सारांश तयार करण्यासाठी आणि नवीन मेमरी काढण्यासाठी मोठ्या भाषा मॉडेल (LLM) वापरते. त्यानंतर, LLM-चालित अपडेट टप्पा ठरवतो की या मेमरी जोडायच्या, सुधारायच्या किंवा हटवायच्या आहेत का, आणि त्यांना व्हेक्टर, ग्राफ आणि की-वॅल्यू डेटाबेस समाविष्ट असलेल्या हायब्रिड डेटा स्टोअरमध्ये साठवतो. ही प्रणाली विविध मेमरी प्रकारांना समर्थन देते आणि घटकांमधील संबंध व्यवस्थापित करण्यासाठी ग्राफ मेमरी समाविष्ट करू शकते.

Cognee

आणखी एक शक्तिशाली दृष्टिकोन म्हणजे Cognee वापरणे, AI एजंट्ससाठी एक ओपन-सोर्स सेमॅंटिक मेमरी जी संरचित आणि असंरचित डेटाला क्वेरी करण्यायोग्य ज्ञान ग्राफमध्ये रूपांतरित करते, एम्बेडिंगद्वारे समर्थित. Cognee एक दुहेरी स्टोअर आर्किटेक्चर प्रदान करते जे व्हेक्टर साम्य शोध आणि ग्राफ संबंध एकत्रित करते, ज्यामुळे एजंट्सना केवळ कोणती माहिती समान आहे हे समजण्यास मदत होते, तर संकल्पना एकमेकांशी कशा संबंधित आहेत हे देखील समजते.

हे हायब्रिड पुनर्प्राप्ती मध्ये उत्कृष्ट आहे जे व्हेक्टर साम्य, ग्राफ संरचना आणि LLM तर्क यांचे मिश्रण करते - कच्च्या तुकड्यांच्या शोधापासून ग्राफ-जागरूक प्रश्न उत्तर देण्यापर्यंत. प्रणाली जिवंत मेमरी टिकवते जी विकसित होते आणि वाढते, एकत्रित ग्राफ म्हणून क्वेरी करण्यायोग्य राहते, अल्पकालीन सत्र संदर्भ आणि दीर्घकालीन स्थिर मेमरी दोन्हीला समर्थन देते.

Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) हे एकत्रित मेमरी लेयर तयार करण्याचे प्रात्यक्षिक देते, विविध डेटा स्रोतांचे इनजेस्टिंग, ज्ञान ग्राफ व्हिज्युअलायझेशन आणि विशिष्ट एजंट गरजांसाठी तयार केलेल्या वेगवेगळ्या शोध रणनीतींसह क्वेरी करण्याचे व्यावहारिक उदाहरणे.

RAG सह मेमरी साठवणे

Mem0 सारख्या विशेष मेमरी टूल्स व्यतिरिक्त, तुम्ही Azure AI Search सारख्या मजबूत शोध सेवांचा वापर मेमरी साठवण्यासाठी आणि पुनर्प्राप्त करण्यासाठी करू शकता, विशेषतः संरचित RAG साठी.

यामुळे तुमच्या एजंटच्या प्रतिसादांना तुमच्या स्वतःच्या डेटासह आधार देणे शक्य होते, ज्यामुळे अधिक संबंधित आणि अचूक उत्तर मिळते. Azure AI Search वापरकर्त्याच्या प्रवासाच्या विशिष्ट मेमरी, उत्पादन कॅटलॉग किंवा इतर कोणत्याही डोमेन-विशिष्ट ज्ञान साठवण्यासाठी वापरले जाऊ शकते.

Azure AI Search संरचित RAG सारख्या क्षमता समर्थित करते, जे संवाद इतिहास, ईमेल किंवा प्रतिमा यासारख्या मोठ्या डेटासेटमधून घन, संरचित माहिती काढण्यात आणि पुनर्प्राप्त करण्यात उत्कृष्ट आहे. हे पारंपरिक टेक्स्ट चंकिंग आणि एम्बेडिंग दृष्टिकोनांच्या तुलनेत “अतिमानवी अचूकता आणि पुनर्प्राप्ती” प्रदान करते.

AI एजंट्स स्वतः सुधारणा कसे करतात

स्वतः सुधारणा करणाऱ्या एजंट्ससाठी एक सामान्य नमुना म्हणजे “ज्ञान एजंट” सादर करणे. हा स्वतंत्र एजंट वापरकर्त्याच्या आणि प्राथमिक एजंटच्या मुख्य संवादाचे निरीक्षण करतो. त्याची भूमिका आहे:

  1. मूल्यवान माहिती ओळखणे: संवादाचा कोणताही भाग सामान्य ज्ञान किंवा विशिष्ट वापरकर्ता प्राधान्य म्हणून साठवण्यास योग्य आहे का ते ठरवणे.

  2. काढणे आणि सारांश तयार करणे: संवादातून आवश्यक शिक्षण किंवा प्राधान्य काढणे.

  3. ज्ञान बेसमध्ये साठवणे: काढलेली माहिती टिकवणे, अनेकदा व्हेक्टर डेटाबेसमध्ये, जेणेकरून ती नंतर पुनर्प्राप्त करता येईल.

  4. भविष्यातील क्वेरी वाढवणे: जेव्हा वापरकर्ता नवीन क्वेरी सुरू करतो, तेव्हा ज्ञान एजंट संबंधित साठवलेली माहिती पुनर्प्राप्त करतो आणि ती वापरकर्त्याच्या प्रॉम्प्टमध्ये जोडतो, प्राथमिक एजंटला महत्त्वाचा संदर्भ प्रदान करतो (RAG प्रमाणे).

मेमरीसाठी ऑप्टिमायझेशन

लेटन्सी व्यवस्थापन: वापरकर्त्याच्या संवादांना धीमा होण्यापासून टाळण्यासाठी, माहिती साठवणे किंवा पुनर्प्राप्त करणे योग्य आहे का हे जलद तपासण्यासाठी स्वस्त, जलद मॉडेल वापरले जाऊ शकते, केवळ आवश्यक असल्यास अधिक जटिल प्रक्रिया सुरू केली जाते.

ज्ञान बेस देखभाल: वाढत्या ज्ञान बेससाठी, कमी वारंवार वापरली जाणारी माहिती “कोल्ड स्टोरेज” मध्ये हलवली जाऊ शकते, ज्यामुळे खर्च व्यवस्थापित होतो.

एजंट मेमरीबद्दल अधिक प्रश्न आहेत का?

Azure AI Foundry Discord मध्ये सामील व्हा, इतर शिकणाऱ्यांशी भेटा, ऑफिस तासांमध्ये सहभागी व्हा आणि तुमचे AI एजंट्ससंबंधित प्रश्न विचारून उत्तर मिळवा.


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपयास लक्षात ठेवा की स्वयंचलित भाषांतरे त्रुटी किंवा अचूकतेच्या अभावाने युक्त असू शकतात. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार नाही.