AI एजंट तयार करण्याचे अद्वितीय फायदे चर्चा करताना मुख्यतः दोन गोष्टींचा विचार होतो: टास्क पूर्ण करण्यासाठी उपकरणे कॉल करण्याची क्षमता आणि वेळेनुसार सुधारणा करण्याची क्षमता. मेमरी ही एक स्व-सुधारण करणाऱ्या एजंट तयार करण्याच्या पाया आहे जी आमच्या वापरकर्त्यांसाठी चांगले अनुभव तयार करू शकते.
या धड्यात, आपण AI एजंटसाठी मेमरी म्हणजे काय हे पाहणार आहोत आणि ते कसे व्यवस्थापित करू शकतो आणि आमच्या अनुप्रयोगांच्या फायद्यासाठी त्याचा कसा वापर करावा हे पाहणार आहोत.
हा धडा समाविष्ट करतो:
• AI एजंट मेमरी समजून घेणे: मेमरी म्हणजे काय आणि ती एजंटसाठी का आवश्यक आहे.
• मेमरीची अंमलबजावणी आणि संचयन: आपल्या AI एजंटमध्ये मेमरीची क्षमता जोडण्यासाठी व्यावहारिक पद्धती, ज्यात लघुकालीन आणि दीर्घकालीन मेमरीवर लक्ष केंद्रित केले आहे.
• AI एजंट्सना स्व-सुधारण करणारे बनवणे: मेमरी कशी एजंटना पूर्वीच्या संवादांमधून शिकण्याची आणि काळानुसार सुधारणा करण्याची परवानगी देते.
हा धडा दोन सर्वसमावेशक नोटबुक ट्यूटोरियल्स समाविष्ट करतो:
• 13-agent-memory.ipynb: Microsoft Agent Framework सह Mem0 आणि Azure AI Search वापरून मेमरीची अंमलबजावणी
• 13-agent-memory-cognee.ipynb: Cognee वापरून संरचित मेमरीची अंमलबजावणी, ज्यात एम्बेडिंग्सला आधार देणारा ज्ञान ग्राफ आपोआप तयार करणे, ग्राफचे दृश्योंकरण आणि बुद्धिमान पुनरावृत्ती
हा धडा पूर्ण केल्यानंतर, तुम्हाला माहिती असेल की:
• AI एजंट मेमरीच्या विविध प्रकारांमधील भेद ओळखणे, ज्यात वर्किंग, लघुकालीन, दीर्घकालीन मेमरी तसेच व्यक्तिमत्व आणि एपिसोडिक मेमरीसारखे विशेष प्रकार आहेत.
• Microsoft Agent Framework वापरून AI एजंटसाठी लघुकालीन आणि दीर्घकालीन मेमरीची अंमलबजावणी आणि व्यवस्थापन करणे, ज्यात Mem0, Cognee, Whiteboard मेमरी आणि Azure AI Search सह समाकलित करणे यांचा समावेश आहे.
• स्व-सुधारण करणाऱ्या AI एजंटसाठीचे तत्त्वज्ञान समजून घेणे आणि मजबूत मेमरी व्यवस्थापन प्रणाली सततच्या शिक्षणासाठी आणि अनुकूलनासाठी कशी मदत करतात.
मूळतः, AI एजंटसाठी मेमरी म्हणजे अशी पद्धत जी त्यांना माहिती कायम ठेवण्याची आणि पुनरावलोकन करण्याची परवानगी देते. ही माहिती संभाषणातील विशिष्ट तपशील, वापरकर्त्याच्या पसंती, मागील क्रिया किंवा शिकलेल्या नमुन्यांची असू शकते.
मेमरी नसल्यास, AI अनुप्रयोग बहुधा स्टेटलेस असतात, म्हणजे प्रत्येक संवाद नवीन सुरुवात असतो. त्यामुळे वापरकर्त्याला वारंवार आणि त्रासदायक अनुभव येतो जेथे एजंट मागील संदर्भ किंवा पसंती “भूलतो”.
एजंटची बुद्धिमत्ता त्याच्या मागील माहिती उजाळून वापरण्याच्या क्षमता यावर खोलवर अवलंबून असते. मेमरी एजंटना सक्षम करते:
• परावर्तनीय: मागील कृती आणि निकालांमधून शिकणे.
• परस्परसंबंधित: चालू संभाषणातील संदर्भ कायम ठेवणे.
• पूर्वसूचक आणि प्रतिसादी: ऐतिहासिक डेटावरून आवश्यकतांची अपेक्षा करणे किंवा योग्य प्रतिसाद देणे.
• स्वायत्त: साठवलेल्या ज्ञानाचा आधार घेऊन अधिक स्वतंत्रपणे कार्य करणे.
मेमरीची अंमलबजावणी करण्याचा उद्देश एजंटना अधिक विश्वसनीय आणि सक्षम बनवणे आहे.
हे एखाद्या एजंटकडून एकच चालू काम किंवा विचार प्रक्रियेदरम्यान वापरलेले एक तात्पुरते मालिका असते. ते पुढील टप्पा मोजण्यासाठी आवश्यक तत्काळ माहिती ठेवते.
AI एजंटसाठी, वर्किंग मेमरी वारंवार संभाषणातील सर्वात संबंधित माहिती मिळवते, जरी पूर्ण चॅट इतिहास लांबगा किंवा संक्षिप्त असला तरी. हे आवश्यक घटक जसे की आवश्यकता, प्रस्ताव, निर्णय आणि क्रियाकलाप यांवर लक्ष केंद्रित करते.
वर्किंग मेमरीचे उदाहरण
एका प्रवास बुकिंग एजंटमध्ये, वर्किंग मेमरी वापरकर्त्याच्या सध्याच्या विनंतीवर लक्ष ठेवू शकते, जसे “मला पॅरिसला प्रवास बुक करायचा आहे”. ही विशिष्ट आवश्यकता एजंटच्या तत्काळ संदर्भात ठेवल्या जाते ज्यामुळे चालू संवाद दिशादर्शित होतो.
हा मेमरीचा प्रकार एका सत्र किंवा एका संभाषणासाठी माहिती टिकवून ठेवतो. तो चालू चॅटचा संदर्भ राखतो ज्यामुळे एजंट मागील संवादाच्या टप्प्यांकडे परत बघू शकतो.
Microsoft Agent Framework Python SDK नमुन्यांमध्ये, हे AgentSession शी संबंधित असते, जे agent.create_session() द्वारे तयार केले जाते. सत्र हे फ्रेमवर्कचे अंगभूत लघुकालीन मेमरी आहे: ते त्या सत्रात संभाषणाचा संदर्भ उपलब्ध ठेवते, पण सत्र संपल्यावर किंवा अनुप्रयोग रिस्टार्ट झाल्यावर तो संदर्भ जतन होत नाही. सत्रांमधून टिकून राहणाऱ्या तथ्ये आणि पसंतीसाठी दीर्घकालीन मेमरी वापरा, सहसा डेटाबेस, व्हेक्टर निर्देशांक, किंवा दुसऱ्या कोणत्यातरी स्थायी संग्रहणाद्वारे.
लघुकालीन मेमरीचे उदाहरण
जर एखाद्या वापरकर्त्याने विचारले, “पॅरिसला जाणाऱ्या फ्लाइटची किंमत किती आहे?” आणि नंतर विचारले, “तेथेच्या निवासाबाबत काय?”, तर लघुकालीन मेमरी एजंटला “तेथे” या शब्दाचा संदर्भ “पॅरिस” या संभाषणादरम्यान ठेवण्यास मदत करते.
ही अनेक संभाषणे किंवा सत्रांदरम्यान टिकणारी माहिती आहे. यामुळे एजंट वापरकर्त्याच्या पसंती, ऐतिहासिक संवाद, किंवा सामान्य ज्ञान विस्तृत कालावधीसाठी लक्षात ठेवू शकतो. हे वैयक्तिकरणासाठी महत्त्वाचे आहे.
दीर्घकालीन मेमरीचे उदाहरण
दीर्घकालीन मेमरीमध्ये असे संग्रहित असू शकते की “बेनला स्कीइंग आणि बाह्य उपक्रम आवडतात, तो कॉफी माउंटन व्ह्यूसह आवडतो, आणि पूर्वीच्या जखमेमुळे प्रगत स्की लांब ठेवतो”. ही पूर्वीच्या संवादातून शिकलेली माहिती भविष्यकालीन प्रवास नियोजन सत्रांमध्ये अत्यंत वैयक्तिकृत शिफारसींवर प्रभाव टाकते.
हा विशेष प्रकार एजंटला सुसंगत “व्यक्तिमत्व” किंवा “व्यक्तिमत्व” विकसित करण्यात मदत करतो. त्यामुळे एजंट स्वतःबद्दल किंवा त्याच्या नियोजित भूमिकेबद्दल माहिती लक्षात ठेवतो, ज्यामुळे संवाद अधिक सुलभ आणि केंद्रित होतो.
व्यक्तिमत्व मेमरीचे उदाहरण
जर प्रवास एजंट “तज्ञ स्की नियोजक” म्हणून डिझाइन केलेला असेल, तर व्यक्तिमत्व मेमरी त्याची भूमिका बलवती करून त्याच्या प्रतिसादांवर तज्ज्ञाच्या टोन आणि ज्ञानाचा प्रभाव पडू शकतो.
ही मेमरी एजंटने क्लिष्ट टास्कद्वारे घडवलेल्या टप्प्यांची मालिका ठेवते, ज्यात यश आणि अपयश दोन्ही समाविष्ट आहेत. हे विशिष्ट “एपिसोड” किंवा मागील अनुभव लक्षात ठेवण्यासारखे आहे ज्यातून शिकता येते.
एपिसोडिक मेमरीचे उदाहरण
जर एजंटने एखाद्या विशिष्ट फ्लाइटचे बुकिंग करण्याचा प्रयत्न केला आणि ती उपलब्ध नसल्यामुळे अपयशी ठरली, तर एपिसोडिक मेमरी त्या अपयशाची नोंद करू शकते, ज्यामुळे एजंट नंतर पर्यायी फ्लाइट्सचा प्रयत्न करू शकतो किंवा वापरकर्त्याला अधिक माहितीपूर्ण पद्धतीने समस्या सांगू शकतो.
यात संभाषणातून विशिष्ट घटक (लोक, ठिकाणे किंवा वस्तू) आणि घटना काढून लक्षात ठेवणे समाविष्ट आहे. यामुळे एजंटला चर्चिलेले मुख्य घटकांचे संरचित समज तयार करता येते.
एंटीटी मेमरीचे उदाहरण
मागील प्रवासाबाबत संवादातून एजंट “पॅरिस,” “एफिल टॉवर,” आणि “ले शॅट नोअर रेस्टॉरंटमध्ये जेवण” या घटक काढू शकतो. भविष्यातील संवादात एजंट “ले शॅट नोअर” लक्षात ठेवून तिथे नवीन आरक्षण करण्याचा प्रस्ताव देऊ शकतो.
RAG हा एक विस्तृत तंत्र आहे, पण “संरचित RAG” ही एक प्रभावी मेमरी तंत्रज्ञान म्हणून अधोरेखित आहे. हे विविध स्त्रोतांमधून (संभाषणे, ईमेल, प्रतिमा) घनदाट, संरचित माहिती काढते आणि ती प्रतिसादांमधील अचूकता, पुनरावृत्ती आणि वेग सुधारण्यासाठी वापरते. पारंपारिक RAG ज्याला केवळ अर्थसमानता वापरते त्यापेक्षा वेगळे, संरचित RAG माहितीच्या अंतर्निहित संरचनेवर कार्य करते.
संरचित RAG चे उदाहरण
फक्त कीवर्ड जुळवण्याऐवजी, संरचित RAG एखाद्या ईमेलमधून फ्लाइट तपशील (गंतव्य, तारीख, वेळ, विमानसेवा) काढू शकते आणि ते संरचित मार्गाने संग्रहित करू शकते. यामुळे “मंगळवारी पॅरिसला कोणता फ्लाइट मी बुक केला?” असे नेमके क्वेरी करू शकतो.
AI एजंटसाठी मेमरीची अंमलबजावणी करणे म्हणजे मेमरी व्यवस्थापन या संयोजित प्रक्रियेतून जाणे, ज्यात तयार करणे, संचयित करणे, पुनर्प्राप्त करणे, एकत्र करणे, अद्यतन करणे आणि अगदी “भूलणे” (किंवा हटवणे) यांचा समावेश आहे. पुनर्प्राप्ती ही विशेषतः महत्त्वाची बाब आहे.
एजंट मेमरी संचयित आणि व्यवस्थापित करण्याचा एक मार्ग म्हणजे Mem0 सारखे विशेष साधने वापरणे. Mem0 हा एक स्थायी मेमरी स्तर म्हणून कार्य करतो, ज्यामुळे एजंट संबंधित संवाद किंवा वापरकर्त्याच्या पसंती आणि तथ्यात्मक संदर्भ लक्षात ठेवू शकतो, आणि यश आणि अपयशांमधून काळानुसार शिकू शकतो. याचा अर्थ स्टेटलेस एजंट स्टेटफुल एजंटमध्ये रूपांतरित होतात.
हे दोन टप्प्याच्या मेमरी प्रक्रियेद्वारे: काढणे आणि अद्यतन करणे काम करते. प्रथम, एजंटच्या थ्रेडमध्ये जोडलेल्या संदेशांना Mem0 सेवेवर पाठवले जाते, जी एक मोठा भाषा मॉडेल (LLM) वापरून संभाषण इतिहासाचे सारांश करते आणि नवीन स्मृती काढते. नंतर, LLM-चालित अद्यतन टप्पा ठरवतो की स्मृती जोडायच्या, बदलायच्या किंवा हटवायच्या आहेत का, आणि त्यांना व्हेक्टर, ग्राफ आणि की-व्हॅल्यू डेटाबेस असलेल्या मिश्रित डेटा स्टोअरमध्ये संग्रहित करते. हा प्रणाली विविध मेमरी प्रकारांना समर्थन देतो आणि घटकांमधील संबंध व्यवस्थापित करण्यासाठी ग्राफ मेमरी देखील समाविष्ट करू शकतो.
दुसरा शक्तिशाली दृष्टिकोन म्हणजे Cognee, एक ओपन-सोर्स सेमांटिक मेमरी तंत्रज्ञान जे संरचित आणि असंरचित डेटा क्वेरी करण्यायोग्य ज्ञान ग्राफमध्ये रूपांतरित करते ज्यामध्ये एम्बेडिंग्सचा आधार आहे. Cognee एक दुहेरी-स्टोर आर्किटेक्चर प्रदान करते, ज्यात व्हेक्टर सादृश्य शोध आणि ग्राफ संबंध एकत्र आहेत, ज्यामुळे एजंटना फक्त माहिती काय समान आहे ते माहित नसून, संकल्पना कशा संबंधित आहेत हे समजण्यास मदत होते.
हे व्हेक्टर सादृश्यता, ग्राफ संरचना आणि LLM विचारसरणी यांचे मिश्रण करणाऱ्या पुनर्प्राप्तीत उत्कृष्ठ आहे - कच्च्या तुकड्यांच्या शोधापासून ते ग्राफ-ज्ञानाधारित प्रश्न उत्तरेपर्यंत. प्रणाली जिवंत मेमरी टिकवते जी वाढते आणि विकसित होते, तसेच एका जोडलेल्या ग्राफसारखी क्वेरी करता येणारी राहते, ज्यामुळे लघुकाळीन सत्र संदर्भ आणि दीर्घकालीन स्थायी मेमरी दोन्ही समर्थित असतात.
Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) या एकत्रित मेमरी स्तराचे बांधकाम दर्शवितो, ज्यामध्ये विविध डेटा स्त्रोत घेतले जातात, ज्ञान ग्राफचे दृश्योंकरण आणि भिन्न शोध धोरणे वापरून क्वेरी करण्याची व्यावहारिक उदाहरणे दिली आहेत.
Mem0 सारख्या विशेष साधनांव्यतिरिक्त, तुम्ही मजबूत शोध सेवा म्हणून Azure AI Search वापरू शकता, विशेषतः संरचित RAG साठी मेमरी संचयित करण्यासाठी आणि पुनर्प्राप्त करण्यासाठी.
हे तुमच्या एजंटच्या प्रतिसादाला तुमच्या स्वतःच्या डेटाशी जोडण्याची अनुमती देते, ज्यामुळे अधिक संबंधित आणि अचूक उत्तरं मिळतात. Azure AI Search वापरकर्त्याच्या प्रवासाबाबतच्या स्मृती, उत्पादन कॅटलॉग किंवा इतर कोणत्याही क्षेत्र-सापेक्ष ज्ञान संचयित करण्यासाठी वापरले जाऊ शकते.
Azure AI Search मध्ये संरचित RAG सारख्या क्षमता आहेत, ज्या मोठ्या डेटा संचातून घनदाट, संरचित माहिती काढून आणि पुनर्प्राप्त करून “अत्यंत अचूकता आणि पुनरावलोकन” प्रदान करतात, पारंपारिक टेक्स्ट तुकड्यांवर आधारित व एम्बेडिंग पद्धतींपेक्षा.
स्व-सुधारण करणाऱ्या एजंटसाठी एक सामान्य नमुना म्हणजे “ज्ञान एजंट” ओळखणे. हा स्वतंत्र एजंट वापरकर्ता आणि मुख्य एजंट यांच्यातील मुख्य संभाषणाचे निरीक्षण करतो. त्याचा हेतू:
मूल्यवान माहिती ओळखणे: संभाषणातील कोणतीही माहिती सामान्य ज्ञान किंवा विशिष्ट वापरकर्त्याच्या पसंतीसाठी जतन करण्यायोग्य आहे का हे ठरवणे.
काढणे आणि सारांश करणे: संभाषणातील मौलिक शिकवण किंवा पसंती संक्षेप करणे.
ज्ञानसंग्रहात संचयित करणे: ही काढलेली माहिती जसे की एक व्हेक्टर डेटाबेस मध्ये साठवणे, जे नंतर पुनर्प्राप्त करता येईल.
भाविष्याच्या क्वेरीज सुधारित करणे: जेव्हा वापरकर्ता नवीन क्वेरी सुरू करतो, तेव्हा ज्ञान एजंट संबंधित जतन केलेली माहिती घेतो आणि वापरकर्त्याच्या प्रॉम्प्टमध्ये जोडतो, यामुळे मुख्य एजंटला संदर्भ मिळतो (RAG प्रमाणे).
• Latency व्यवस्थापन: वापरकर्ता संवादामध्ये मंदगती टाळण्यासाठी, सुरुवातीला एक स्वस्त आणि जलद मॉडल वापरून जलद पद्धतीने तपासले जाऊ शकते की माहिती संचयित किंवा पुनर्प्राप्त करण्यायोग्य आहे का, आणि अधिक जटिल काढणी/पुनर्प्राप्ती प्रक्रिया फक्त आवश्यकतेनुसार वापरली जाते.
• ज्ञानसंग्रह देखभाल: वाढणाऱ्या ज्ञानसंग्रहासाठी, कमी वापरली जाणारी माहिती “कोल्ड स्टोरेज” मध्ये हलवून खर्च व्यवस्थापित केला जाऊ शकतो.
Microsoft Foundry Discord मध्ये सामील व्हा आणि इतर शिकणाऱ्यांशी भेटा, ऑफिस तासांना उपस्थित राहा आणि तुमचे AI एजंटबाबत प्रश्न सोडवा.
अस्वीकरण: हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून अनुवादित केला आहे. जरी आम्ही अचूकतेसाठी प्रयत्न करतो, तरी कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेची कमतरता असू शकते. मूळ दस्तऐवज त्याच्या मूळ भाषेत अधिकृत स्रोत मानला पाहिजे. महत्त्वाची माहिती असल्यास, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराच्या वापरामुळे उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थलावणीसाठी आम्ही जबाबदार नाही.