ai-agents-for-beginners

AI एजंट्ससाठी मेमरी

एजंट मेमरी

AI एजंट्स तयार करण्याच्या अनोख्या फायद्यांबद्दल चर्चा करताना दोन गोष्टी मुख्यतः चर्चेत असतात: टूल्स वापरून कार्य पूर्ण करण्याची क्षमता आणि वेळोवेळी सुधारणा करण्याची क्षमता. मेमरी ही स्वतः सुधारणा करणाऱ्या एजंट्स तयार करण्याचा पाया आहे, ज्यामुळे आपल्या वापरकर्त्यांसाठी चांगले अनुभव निर्माण होतात.

या धड्यात, आपण AI एजंट्ससाठी मेमरी म्हणजे काय, ती कशी व्यवस्थापित करावी आणि आपल्या अॅप्लिकेशन्ससाठी ती कशी फायदेशीर ठरवावी यावर चर्चा करू.

परिचय

या धड्यात आपण शिकणार आहोत:

AI एजंट मेमरी समजून घेणे: मेमरी म्हणजे काय आणि एजंट्ससाठी ती का महत्त्वाची आहे.

मेमरी अंमलात आणणे आणि साठवणे: AI एजंट्समध्ये मेमरी क्षमता जोडण्यासाठी व्यावहारिक पद्धती, ज्यामध्ये अल्पकालीन आणि दीर्घकालीन मेमरीवर लक्ष केंद्रित केले आहे.

AI एजंट्स स्वतः सुधारणा कसे करतात: मेमरी एजंट्सना भूतकाळातील संवादांमधून शिकण्यास आणि वेळोवेळी सुधारणा करण्यास कशी मदत करते.

शिकण्याची उद्दिष्टे

हा धडा पूर्ण केल्यानंतर, तुम्हाला खालील गोष्टी माहित असतील:

AI एजंट्सच्या विविध प्रकारच्या मेमरीमध्ये फरक ओळखणे, ज्यामध्ये वर्किंग, अल्पकालीन आणि दीर्घकालीन मेमरी तसेच व्यक्तिमत्व आणि एपिसोडिक मेमरीसारख्या विशेष प्रकारांचा समावेश आहे.

AI एजंट्ससाठी अल्पकालीन आणि दीर्घकालीन मेमरी अंमलात आणणे आणि व्यवस्थापित करणे Semantic Kernel फ्रेमवर्क वापरून, Mem0 आणि Whiteboard मेमरीसारख्या टूल्सचा उपयोग करून आणि Azure AI Search सह एकत्रित करून.

स्वतः सुधारणा करणाऱ्या AI एजंट्सच्या मागील तत्त्वे समजून घेणे आणि मजबूत मेमरी व्यवस्थापन प्रणाली सतत शिकण्यास आणि अनुकूलतेस कशी योगदान देते.

AI एजंट मेमरी समजून घेणे

मूलत: AI एजंट्ससाठी मेमरी म्हणजे अशी यंत्रणा जी त्यांना माहिती टिकवून ठेवण्यास आणि आठवण्यास सक्षम करते. ही माहिती संवादातील विशिष्ट तपशील, वापरकर्त्याच्या पसंती, भूतकाळातील कृती किंवा शिकलेले नमुने असू शकते.

मेमरीशिवाय, AI अॅप्लिकेशन्स बहुतेक वेळा “स्टेटलेस” असतात, म्हणजे प्रत्येक संवाद नव्याने सुरू होतो. यामुळे एजंट भूतकाळातील संदर्भ किंवा पसंती “विसरतो” आणि वापरकर्त्याचा अनुभव पुनरावृत्तीपूर्ण आणि निराशाजनक होतो.

मेमरी का महत्त्वाची आहे?

एजंट्सची बुद्धिमत्ता भूतकाळातील माहिती आठवण्याची आणि वापरण्याची क्षमता यावर अवलंबून असते. मेमरी एजंट्सना खालील प्रकारे सक्षम करते:

प्रतिबिंबित: भूतकाळातील कृती आणि परिणामांमधून शिकणे.

संवादी: चालू संवादाचा संदर्भ टिकवून ठेवणे.

प्रोएक्टिव्ह आणि रिएक्टिव्ह: ऐतिहासिक डेटाच्या आधारे गरजा ओळखणे किंवा योग्य प्रतिसाद देणे.

स्वायत्त: साठवलेल्या ज्ञानाचा उपयोग करून अधिक स्वतंत्रपणे कार्य करणे.

मेमरी अंमलात आणण्याचा उद्देश एजंट्स अधिक विश्वसनीय आणि सक्षम बनवणे आहे.

मेमरीचे प्रकार

वर्किंग मेमरी

याला एजंट एका विशिष्ट कार्य किंवा विचार प्रक्रियेदरम्यान वापरणाऱ्या तात्काळ माहितीचा तुकडा समजले जाते. हे पुढील पायरीसाठी आवश्यक माहिती ठेवते.

AI एजंट्ससाठी, वर्किंग मेमरी संवादातील सर्वात संबंधित माहिती कॅप्चर करते, जरी पूर्ण चॅट इतिहास लांब किंवा कापलेला असला तरी. हे आवश्यकता, प्रस्ताव, निर्णय आणि कृती यासारख्या मुख्य घटकांवर लक्ष केंद्रित करते.

वर्किंग मेमरीचे उदाहरण

एका प्रवास बुकिंग एजंटमध्ये, वर्किंग मेमरी वापरकर्त्याची सध्याची विनंती कॅप्चर करू शकते, जसे की “मला पॅरिसला प्रवास बुक करायचा आहे”. ही विशिष्ट आवश्यकता सध्याच्या संवादाचे मार्गदर्शन करण्यासाठी एजंटच्या तात्काळ संदर्भात ठेवली जाते.

अल्पकालीन मेमरी

हा प्रकार एका संवाद किंवा सत्राच्या कालावधीसाठी माहिती टिकवून ठेवतो. हे चालू चॅटचा संदर्भ आहे, ज्यामुळे एजंट संवादातील मागील टप्प्यांचा संदर्भ घेऊ शकतो.

अल्पकालीन मेमरीचे उदाहरण

जर वापरकर्त्याने विचारले, “पॅरिसला फ्लाइटचा खर्च किती होईल?” आणि नंतर विचारले, “तेथे राहण्याचा खर्च काय असेल?”, तर अल्पकालीन मेमरी एजंटला “तेथे” म्हणजे “पॅरिस” आहे हे माहित ठेवते.

दीर्घकालीन मेमरी

ही माहिती अनेक संवाद किंवा सत्रांमध्ये टिकून राहते. यामुळे एजंट्सला वापरकर्त्याच्या पसंती, ऐतिहासिक संवाद किंवा सामान्य ज्ञान दीर्घ कालावधीसाठी लक्षात ठेवता येते. वैयक्तिकरणासाठी हे महत्त्वाचे आहे.

दीर्घकालीन मेमरीचे उदाहरण

दीर्घकालीन मेमरी “बेनला स्कीइंग आणि बाह्य क्रियाकलाप आवडतात, कॉफी पर्वताच्या दृश्यासह आवडते आणि भूतकाळातील दुखापतीमुळे प्रगत स्की स्लोप्स टाळायचे आहेत” हे साठवू शकते. ही माहिती, मागील संवादांमधून शिकलेली, भविष्यातील प्रवास नियोजन सत्रांमध्ये शिफारसींवर प्रभाव टाकते, ज्यामुळे त्या अत्यंत वैयक्तिकृत होतात.

व्यक्तिमत्व मेमरी

हा विशेष प्रकार एजंटला सुसंगत “व्यक्तिमत्व” किंवा “भूमिका” विकसित करण्यात मदत करतो. यामुळे एजंटला स्वतःबद्दल किंवा त्याच्या इच्छित भूमिकेबद्दल तपशील लक्षात ठेवता येतो, ज्यामुळे संवाद अधिक प्रवाही आणि केंद्रित होतो.

व्यक्तिमत्व मेमरीचे उदाहरण

जर प्रवास एजंट “स्की नियोजन तज्ञ” म्हणून डिझाइन केलेला असेल, तर व्यक्तिमत्व मेमरी ही भूमिका मजबूत करू शकते, ज्यामुळे त्याच्या प्रतिसादांवर तज्ञाच्या टोन आणि ज्ञानाशी सुसंगत परिणाम होतो.

वर्कफ्लो/एपिसोडिक मेमरी

ही मेमरी एजंटने जटिल कार्यादरम्यान घेतलेल्या पायऱ्यांचा क्रम, यश आणि अपयश साठवते. हे भूतकाळातील विशिष्ट “एपिसोड्स” किंवा अनुभव लक्षात ठेवण्यासारखे आहे.

एपिसोडिक मेमरीचे उदाहरण

जर एजंटने विशिष्ट फ्लाइट बुक करण्याचा प्रयत्न केला पण ती उपलब्ध नसल्यामुळे अपयशी ठरली, तर एपिसोडिक मेमरी हे अपयश नोंदवू शकते, ज्यामुळे एजंटला पर्यायी फ्लाइट्सचा प्रयत्न करण्यास किंवा वापरकर्त्याला पुढील प्रयत्नादरम्यान अधिक माहितीपूर्ण पद्धतीने समस्या सांगण्यास मदत होते.

एंटिटी मेमरी

यामध्ये संवादांमधून विशिष्ट घटक (जसे की व्यक्ती, ठिकाणे किंवा वस्तू) आणि घटना काढणे आणि लक्षात ठेवणे समाविष्ट आहे. यामुळे एजंटला चर्चेत असलेल्या प्रमुख घटकांची संरचित समज तयार करता येते.

एंटिटी मेमरीचे उदाहरण

मागील प्रवासाबद्दलच्या संवादातून, एजंट “पॅरिस,” “आयफेल टॉवर,” आणि “Le Chat Noir रेस्टॉरंटमध्ये डिनर” यासारख्या घटक काढू शकतो. भविष्यातील संवादात, एजंट “Le Chat Noir” लक्षात ठेवून तिथे नवीन आरक्षण करण्याची ऑफर देऊ शकतो.

स्ट्रक्चर्ड RAG (रिट्रीव्हल ऑगमेंटेड जनरेशन)

RAG ही एक व्यापक तंत्र आहे, परंतु “स्ट्रक्चर्ड RAG” हे एक शक्तिशाली मेमरी तंत्रज्ञान म्हणून अधोरेखित केले जाते. हे विविध स्रोतांमधून (संवाद, ईमेल्स, प्रतिमा) घन, संरचित माहिती काढते आणि प्रतिसादांमध्ये अचूकता, आठवण आणि वेग वाढवण्यासाठी वापरते. क्लासिक RAG केवळ सेमॅंटिक साम्यावर अवलंबून असते, तर स्ट्रक्चर्ड RAG माहितीच्या अंतर्गत संरचनेवर कार्य करते.

स्ट्रक्चर्ड RAG चे उदाहरण

फक्त कीवर्ड जुळवण्याऐवजी, स्ट्रक्चर्ड RAG ईमेलमधून फ्लाइट तपशील (गंतव्यस्थान, तारीख, वेळ, एअरलाइन) पार्स करू शकते आणि ते संरचित पद्धतीने साठवू शकते. यामुळे “मी मंगळवारी पॅरिसला कोणती फ्लाइट बुक केली?” यासारख्या अचूक चौकशी शक्य होते.

मेमरी अंमलात आणणे आणि साठवणे

AI एजंट्ससाठी मेमरी अंमलात आणणे म्हणजे मेमरी व्यवस्थापन प्रक्रियेचा एक प्रणालीबद्ध दृष्टिकोन, ज्यामध्ये माहिती निर्माण करणे, साठवणे, पुनर्प्राप्त करणे, एकत्रित करणे, अद्यतनित करणे आणि “विसरणे” (किंवा हटवणे) यांचा समावेश आहे. पुनर्प्राप्ती हा विशेषतः महत्त्वाचा पैलू आहे.

विशेष मेमरी टूल्स

एजंट मेमरी साठवण्यासाठी आणि व्यवस्थापित करण्याचा एक मार्ग म्हणजे Mem0 सारख्या विशेष टूल्सचा वापर. Mem0 एक स्थिर मेमरी स्तर म्हणून कार्य करते, ज्यामुळे एजंट्सना संबंधित संवाद आठवणे, वापरकर्त्याच्या पसंती आणि तथ्यात्मक संदर्भ साठवणे आणि वेळोवेळी यश आणि अपयशांमधून शिकणे शक्य होते. यामागील कल्पना अशी आहे की स्टेटलेस एजंट्स स्टेटफुल बनतात.

हे दोन-टप्प्यांच्या मेमरी पाइपलाइनद्वारे कार्य करते: एक्स्ट्रॅक्शन आणि अपडेट. प्रथम, एजंटच्या थ्रेडमध्ये जोडलेले संदेश Mem0 सेवेला पाठवले जातात, जे संवाद इतिहासाचा सारांश तयार करण्यासाठी आणि नवीन मेमरी काढण्यासाठी मोठ्या भाषा मॉडेल (LLM) वापरते. त्यानंतर, LLM-चालित अपडेट टप्पा ठरवतो की या मेमरी जोडायच्या, सुधारायच्या किंवा हटवायच्या आहेत का, आणि त्या व्हेक्टर, ग्राफ आणि की-वॅल्यू डेटाबेससह हायब्रिड डेटा स्टोअरमध्ये साठवतो. ही प्रणाली विविध प्रकारच्या मेमरीला समर्थन देते आणि एंटिटींमधील संबंध व्यवस्थापित करण्यासाठी ग्राफ मेमरी समाविष्ट करू शकते.

RAG सह मेमरी साठवणे

Mem0 सारख्या विशेष मेमरी टूल्स व्यतिरिक्त, तुम्ही Azure AI Search सारख्या मजबूत शोध सेवांचा उपयोग मेमरी साठवण्यासाठी आणि पुनर्प्राप्त करण्यासाठी करू शकता, विशेषतः स्ट्रक्चर्ड RAG साठी.

यामुळे तुमच्या एजंटच्या प्रतिसादांना तुमच्या स्वतःच्या डेटासह आधार मिळतो, ज्यामुळे अधिक संबंधित आणि अचूक उत्तरांची खात्री होते. Azure AI Search वापरकर्त्याच्या प्रवासाच्या विशिष्ट आठवणी, उत्पादन कॅटलॉग किंवा इतर कोणत्याही डोमेन-विशिष्ट ज्ञान साठवण्यासाठी वापरले जाऊ शकते.

Azure AI Search स्ट्रक्चर्ड RAG सारख्या क्षमता समर्थित करते, जे संवाद इतिहास, ईमेल्स किंवा प्रतिमा यासारख्या मोठ्या डेटासेटमधून घन, संरचित माहिती काढण्यात आणि पुनर्प्राप्त करण्यात उत्कृष्ट आहे. हे पारंपरिक टेक्स्ट चंकिंग आणि एम्बेडिंग पद्धतींशी तुलना करता “सुपरह्युमन अचूकता आणि आठवण” प्रदान करते.

AI एजंट्स स्वतः सुधारणा कसे करतात

स्वतः सुधारणा करणाऱ्या एजंट्ससाठी एक सामान्य नमुना म्हणजे “ज्ञान एजंट” सादर करणे. हा स्वतंत्र एजंट वापरकर्त्याच्या आणि प्राथमिक एजंटच्या मुख्य संवादाचे निरीक्षण करतो. त्याची भूमिका खालीलप्रमाणे आहे:

  1. मूल्यवान माहिती ओळखणे: संवादातील कोणताही भाग सामान्य ज्ञान किंवा विशिष्ट वापरकर्ता पसंती म्हणून साठवण्यास योग्य आहे का हे ठरवणे.

  2. काढणे आणि सारांश तयार करणे: संवादातून आवश्यक शिक्षण किंवा पसंती काढणे.

  3. ज्ञान बेसमध्ये साठवणे: काढलेली माहिती टिकवून ठेवणे, अनेकदा व्हेक्टर डेटाबेसमध्ये, जेणेकरून ती नंतर पुनर्प्राप्त केली जाऊ शकते.

  4. भविष्यातील चौकशींमध्ये सुधारणा करणे: जेव्हा वापरकर्ता नवीन चौकशी सुरू करतो, तेव्हा ज्ञान एजंट संबंधित साठवलेली माहिती पुनर्प्राप्त करतो आणि ती वापरकर्त्याच्या प्रॉम्प्टमध्ये जोडतो, प्राथमिक एजंटला महत्त्वाचा संदर्भ प्रदान करतो (RAG प्रमाणे).

मेमरीसाठी ऑप्टिमायझेशन्स

लेटन्सी व्यवस्थापन: वापरकर्त्याच्या संवादात विलंब टाळण्यासाठी, माहिती साठवणे किंवा पुनर्प्राप्त करणे योग्य आहे का हे जलद तपासण्यासाठी स्वस्त, जलद मॉडेल वापरले जाऊ शकते, केवळ आवश्यक असल्यास अधिक जटिल एक्स्ट्रॅक्शन/रिट्रीव्हल प्रक्रिया सुरू केली जाते.

ज्ञान बेस देखभाल: वाढत्या ज्ञान बेससाठी, कमी वारंवार वापरली जाणारी माहिती “कोल्ड स्टोरेज” मध्ये हलवली जाऊ शकते, ज्यामुळे खर्च व्यवस्थापित होतो.

एजंट मेमरीबद्दल अधिक प्रश्न आहेत का?

Azure AI Foundry Discord मध्ये सामील व्हा, इतर शिकणाऱ्यांशी भेटा, ऑफिस तासांमध्ये सहभागी व्हा आणि तुमचे AI एजंट्ससंबंधित प्रश्न विचारून उत्तर मिळवा.


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.