AI एजेन्टहरू सिर्जना गर्दा अनौंठा लाभहरू मध्ये दुई कुरा मुख्य रूपमा उल्लेख गरिन्छ: कार्यहरू पूरा गर्न उपकरणहरू बोलाउन सक्ने क्षमता र समयसँगै सुधार गर्ने क्षमता। मेमोरी भनेको एक आत्म-सुधार गर्ने एजेन्ट सिर्जना गर्ने आधार हो जसले हाम्रा प्रयोगकर्ताहरूका लागि राम्रो अनुभवहरू सिर्जना गर्न सक्छ।
यस पाठमा, हामी हेर्ने छौं कि AI एजेन्टहरूको लागि मेमोरी के हो र हामी यसलाई कसरी व्यवस्थापन गर्न र हाम्रा अनुप्रयोगहरूको लाभका लागि प्रयोग गर्न सक्छौं।
यस पाठले समेट्नेछ:
• AI एजेन्ट मेमोरी बुझ्नु: मेमोरी के हो र किन यो एजेन्टहरूका लागि आवश्यक छ।
• मेमोरी लागू गर्न र भण्डारण गर्न: तपाईंका AI एजेन्टहरूमा मेमोरी क्षमताहरू जोड्ने व्यावहारिक विधिहरू, छोटो अवधिको र दीर्घकालीन मेमोरीमा केन्द्रित।
• AI एजेन्टहरूलाई आत्म-सुधार गर्ने बनाउन: कसरी मेमोरीले एजेन्टहरूलाई भूतपूर्व अन्तरक्रियाबाट सिक्न र समयसँगै सुधार गर्न सक्षम बनाउँछ।
यस पाठमा दुई सम्पूर्ण नोटबुक ट्यूटोरियलहरू छन्:
• 13-agent-memory.ipynb: Microsoft Agent Framework सँग Mem0 र Azure AI Search प्रयोग गरेर मेमोरी लागू गर्दछ
• 13-agent-memory-cognee.ipynb: Cognee प्रयोग गरेर संरचित मेमोरी लागू गर्दछ, embeddings द्वारा समर्थन गरिएको ज्ञान ग्राफ स्वचालित रूपमा निर्माण गर्दै, ग्राफ भिजुअलाइज गरी बुद्धिमानी पुनःप्राप्ति गर्दछ
यस पाठ पूरा गरेपछि, तपाईंले जान्नुपर्नेछ:
• विभिन्न प्रकारका AI एजेन्ट मेमोरीहरू बीच फरक छुट्याउन, जसमा कार्य स्मृति, छोटो अवधिको मेमोरी, दीर्घकालीन मेमोरी, र persona तथा episodic मेमोरीजस्ता विशेष प्रकारहरू समावेश छन्।
• Microsoft Agent Framework प्रयोग गरेर छोटो अवधिको र दीर्घकालीन मेमोरी लागू र व्यवस्थापन गर्न, Mem0, Cognee, Whiteboard मेमोरी जस्ता उपकरणहरूको उपयोग गर्दै, र Azure AI Search सँग एकीकरण गरि।
• आत्म-सुधार गर्ने AI एजेन्टहरूको आधारभूत सिद्धान्तहरू बुझ्न र कसरी बलियो मेमोरी व्यवस्थापन प्रणालीहरूले निरन्तर सिकाई र अनुकूलनमा योगदान पुर्याउँछन्।
मूल रूपमा, AI एजेन्टहरूको लागि मेमोरी भनेको उनीहरूलाई जानकारी सङ्ग्रह गर्न र सम्झन सक्ने प्रक्रियाहरू हुन्। यी जानकारीहरूमा वार्तालापका विशिष्ट विवरणहरू, प्रयोगकर्ता प्राथमिकताहरू, विगतका क्रियाकलापहरू, वा सिकेका ढाँचाहरू समावेश हुन सक्छन्।
मेमोरी बिना, AI अनुप्रयोगहरू प्रायः स्टेटलेस हुन्छन्, जसको अर्थ हरेक अन्तरक्रिया नयाँबाट सुरू हुन्छ। यसले दोहोरिने र निराशाजनक प्रयोगकर्ता अनुभव ल्याउँछ जहाँ एजेन्टले पहिलेको प्रसंग वा प्राथमिकताहरू “बिर्सन्छ”।
एजेन्टको बुद्धिमत्ताले आफ्ना विगत जानकारी सम्झन र प्रयोग गर्न सक्ने क्षमतासँग गहिरो सम्बन्ध राख्छ। मेमोरीले एजेन्टलाई सक्षम बनाउँछ:
• प्रतिबिम्बित गर्ने: विगत क्रियाकलाप र परिणामबाट सिक्ने।
• इन्तरेक्टिभ: जारी वार्तालापको प्रसंग कायम राख्ने।
• पूर्वानुमान र प्रतिक्रिया दिने: ऐतिहासिक डाटाको आधारमा आवश्यकतालाई अनुमान लगाउने वा उपयुक्त रूपमा प्रतिक्रिया दिने।
• स्वायत्त: भण्डारित ज्ञान प्रयोग गरेर बढी स्वतन्त्र रूपमा काम गर्ने।
मेमोरी लागू गर्ने लक्ष्य भनेको एजेन्टहरूलाई अधिक विश्वसनीय र सक्षम बनाउनु हो।
यसलाई एउटा चाँडो लेखिने पानाको रूपमा सोच्नुहोस् जुन एजेन्टले एउटै चलिरहेको कार्य वा सोच प्रक्रियाको क्रममा प्रयोग गर्छ। यसले अर्को कदम गणना गर्न आवश्यक तत्कालीन जानकारी समातेको हुन्छ।
AI एजेन्टहरूका लागि, कार्य स्मृतिले प्रायः वार्तालापबाट सबैभन्दा सम्बन्धित जानकारी समेट्छ, चाहे पुरा च्याट इतिहास लामो वा छोटो होस्। यो आवश्यक तत्वहरू जस्तै आवश्यकता, प्रस्ताव, निर्णय, र क्रियाकलाप निकाल्न केन्द्रित हुन्छ।
कार्य स्मृति उदाहरण
यात्रा बुकिङ एजेन्टमा, कार्य स्मृतिले प्रयोगकर्ताको वर्तमान अनुरोध समात्न सक्छ, जस्तै “म पेरिसको यात्रा बुक गर्न चाहन्छु”। यो विशिष्ट आवश्यकता एजेन्टको तत्कालीन प्रसंगमा राखिन्छ ताकि वर्तमान अन्तरक्रिया सन्चालित होस्।
यो मेमोरी प्रकारले एकै वार्तालाप वा सत्रको अवधिका लागि जानकारी सम्हाल्छ। यो हालको च्याटको प्रसंग हो, जसले एजेन्टलाई संवादका पूर्व टर्नहरूमा सङ्केत गर्न अनुमति दिन्छ।
Microsoft Agent Framework को Python SDK नमूनाहरूमा, यो AgentSession सँग मेल खान्छ, जुन agent.create_session() द्वारा सिर्जना हुन्छ। सत्र नै फ्रेमवर्कमा अन्तर्गतको छोटो अवधिको मेमोरी हो: त्यो सत्र पुनः प्रयोग हुँदा वार्तालापको प्रसंग उपलब्ध रहन्छ, तर सत्र समाप्त हुँदा वा अनुप्रयोग पुनः सुरु हुँदा त्यो प्रसंग स्थायी हुँदैन। स्थायी तथ्य तथा प्राथमिकताहरूको लागि दीर्घकालीन मेमोरी प्रयोग गर्नुहोस्, जुन सामान्यतया डेटाबेस, भेक्टर सूची, वा अन्य स्थायी सञ्चयस्थानमार्फत हुन्छ।
छोटो अवधिको मेमोरी उदाहरण
यदि प्रयोगकर्ताले सोध्छ, “पेरिसको लागि फ्लाइट कति पर्छ?” र त्यसपछि “त्यहाँको आवासको के?” सोध्छ भने, छोटो अवधिको मेमोरीले एजेन्टलाई थाहा हुन्छ कि “त्यहाँ” भनेको “पेरिस” लाई जनाउँछ।
यो धेरै वार्तालाप वा सत्रहरूमा टिकिरहने सूचना हो। यसले एजेन्टलाई प्रयोगकर्ताका प्राथमिकताहरू, ऐतिहासिक अन्तरक्रियाहरू, वा सामान्य ज्ञान दीर्घकालीन रूपमा सम्झन मद्दत गर्छ। यो व्यक्तिगत रुचिका लागि महत्वपूर्ण छ।
दीर्घकालीन मेमोरी उदाहरण
दीर्घकालीन मेमोरीले भण्डारण गर्न सक्छ कि “बेन स्किइङ र बाहिरी गतिविधिहरू मन पराउँछन्, पहाडी दृश्यसहित कफी मन पराउँछन्, र विगत चोटको कारण उन्नत स्की ढलानहरूबाट बच्न चाहन्छन्”। यो जानकारी, अघिका अन्तरक्रियाबाट सिकिएको हो, भविष्यको यात्रा योजना सत्रमा अत्यन्त व्यक्तिगत सिफारिसहरू बनाउन मद्दत गर्छ।
यो विशेष मेमोरी प्रकार एजेन्टलाई एक सुसंगत “व्यक्तित्व” वा “पर्सोना” विकास गर्न मद्दत गर्छ। यसले एजेन्टलाई आफ्नै बारे वा उसको निर्धारित भूमिकाको विवरण सम्झन अनुमति दिन्छ, जसले अन्तरक्रियाहरूलाई अधिक प्रवाहपूर्ण र केन्द्रित बनाउँछ।
पर्सोना मेमोरी उदाहरण
यदि यात्रा एजेन्टलाई “विशेषज्ञ स्की योजनाकार” को रूपमा डिजाइन गरिएको छ भने, पर्सोना मेमोरीले यो भूमिकालाई सुदृढ पार्न सक्छ, जसले यसको प्रतिक्रियाहरूलाई विशेषज्ञको टोन र ज्ञानसँग मिल्न प्रभाव पार्दछ।
यसले जटिल कार्यका क्रममा एजेन्टले लिएका चरणहरूको अनुक्रम भण्डारण गर्छ, जसमा सफलताहरू र असफलताहरू समावेश हुन्छन्। यो खास “एपिसोडहरू” वा विगत अनुभवहरू सम्झन जस्तै हो जसबाट सिक्न सकिन्छ।
एपिसोडिक मेमोरी उदाहरण
एजेन्टले कुनै विशेष फ्लाइट बुक गर्न प्रयास गर्यो तर उपलब्ध नभएको कारण असफल भयो भने, एपिसोडिक मेमोरीले यो असफलता रेकर्ड गर्न सक्छ, जसले अर्को प्रयासमा वैकल्पिक फ्लाइट प्रयास गर्न वा प्रयोगकर्तालाई समस्या बारे अधिक जानकारी सहित सूचित गर्न मद्दत गर्छ।
यसमा वार्तालापबाट विशिष्ट तत्वहरू (जस्तै मानिसहरू, स्थानहरू, वा वस्तुहरू) र घटनाहरू निकालेर सम्झने प्रक्रिया समावेश हुन्छ। यसले एजेन्टलाई छलफल गरिएका मुख्य तत्वहरूको संरचित बुझाइ बनाउन अनुमति दिन्छ।
Entity Memory उदाहरण
पुरानो यात्राको बारेमा भएको कुराकानीबाट, एजेन्टले “पेरिस”, “आईफल टावर”, र “Le Chat Noir रेस्टुरेन्टमा डिनर” तत्वहरू निकाल्न सक्छ। भविष्यको अन्तरक्रियामा, एजेन्टले “Le Chat Noir” सम्झिन सक्छ र त्यहाँ नयाँ आरक्षण गर्न प्रस्ताव गर्न सक्छ।
RAG विशिष्ट प्रविधि भए पनि, “संरचित RAG” एक शक्तिशाली मेमोरी प्रविधिको रूपमा हाइलाइट गरिएको छ। यसले विभिन्न स्रोतहरू (वार्तालापहरू, इमेलहरू, तस्वीरहरू) बाट घना, संरचित जानकारी निकाल्छ र प्रयोग गर्छ जसले जवाफहरूमा परिशुद्धता, स्मरण र गति बढाउँछ। पारंपरिक RAG मात्र अर्थगत समानतामा निर्भर रहँदा, संरचित RAG सूचना संरचनाका साथ काम गर्छ।
संरचित RAG उदाहरण
केवल कुञ्जीशब्द मिलाउनुभन्दा, संरचित RAG ले इमेलबाट फ्लाइट विवरणहरू (गन्तव्य, मिति, समय, एयरलाइन) पार्स गरी संरचित तरिकाले भण्डारण गर्न सक्छ। यसले “मले मंगलबार पेरिसका लागि कुन फ्लाइट बुक गरेको थिएँ?” जस्ता सटीक प्रश्नहरू गर्न अनुमति दिन्छ।
AI एजेन्टहरूको लागि मेमोरी लागू गर्ने कार्य प्रणालीगत रूपमा मेमोरी व्यवस्थापन को प्रक्रिया हो, जसमा निर्माण, भण्डारण, पुनःप्राप्ति, एकीकरण, अपडेट, र कहिलेकाहीँ “भुल्ने” (वा मेट्ने) प्रक्रिया समावेश हुन्छ। पुनःप्राप्ति विशेष रूपमा महत्वपूर्ण पक्ष हो।
एजेन्ट मेमोरी भण्डारण र व्यवस्थापन गर्न एउटा तरिका Mem0 जस्ता विशेष उपकरणहरू प्रयोग गर्नु हो। Mem0 एक स्थायी मेमोरी तहको रूपमा काम गर्छ, जसले एजेन्टहरूलाई सम्बन्धित अन्तरक्रियाहरू सम्झन, प्रयोगकर्ता प्राथमिकताहरू र तथ्यात्मक प्रसंग संग्रह गर्न, र सफलताहरू तथा असफलताबाट समयसँगै सिक्न अनुमति दिन्छ। यस विचारमा, स्टेटलेस एजेन्टहरू स्टेटफुल एजेन्टहरूमा परिणत हुन्छन्।
यसले दुई चरणीय मेमोरी पाइपलाइन: निकास र अपडेट माध्यमबाट काम गर्छ। सुरुमा, एजेन्टको थ्रेडमा थपिएका सन्देशहरू Mem0 सेवामा पठाइन्छ, जहाँ ठूलो भाषा मोडल (LLM) ले वार्तालाप इतिहास संक्षेप गर्छ र नयाँ मेमोरीहरू निकाल्छ। त्यसपछि, LLM-सञ्चालित अपडेट चरणले यी मेमोरीहरू थप्ने, परिमार्जन गर्ने, वा मेट्ने तिर्न निर्णय गर्दछ, र तिनीहरूलाई भेक्टर, ग्राफ, र कुञ्जी-मूल्य डेटाबेसहरू भएको हाइब्रिड डाटास्टोरमा भण्डार गर्छ। यो प्रणाली विभिन्न मेमोरी प्रकारहरूलाई समर्थन गर्दछ र संस्थाहरू बीच सम्बन्ध व्यवस्थापनका लागि ग्राफ मेमोरी पनि समावेश गर्न सक्छ।
अर्को शक्तिशाली दृष्टिकोण भनेको Cognee हो, जुन AI एजेन्टहरूको लागि खुला स्रोत सेम्यान्टिक मेमोरी हो जसले संरचित र असंरचित डाटालाई embeddings द्वारा समर्थित प्रश्नयोग्य ज्ञान ग्राफहरूमा रूपान्तरण गर्छ। Cognee ले द्वैध-स्टोर संरचना प्रदान गर्छ जसले भेक्टर समानता खोज र ग्राफ सम्बन्धहरूको संयोजन गर्छ, जसले एजेन्टहरूलाई केवल सूचना के समान छ मात्र होइन, तर विचारहरू कसरी सम्बन्धित छन् पनि बुझ्न सक्षम बनाउँछ।
यो विशेष गरी हाइब्रिड पुनःप्राप्ति मा उत्कृष्ट छ जसले भेक्टर समानता, ग्राफ संरचना, र LLM तर्कलाई मिश्रण गर्छ - कच्चा खण्ड खोजीबाट ग्राफ-सचेत प्रश्न उत्तरसम्म। प्रणालीले जीवित मेमोरी कायम राख्छ जुन विकास र वृद्धि हुन्छ र एकजुट ग्राफको रूपमा प्रश्नयोग्य रहन्छ, छोटो अवधिको सत्र प्रसंग र दीर्घकालीन स्थायी मेमोरी दुवैलाई समर्थन गर्दै।
Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) ले यो एकीकृत मेमोरी तह निर्माण गर्ने देखाउँछ, विविध डेटा स्रोतहरूको अवशोषण, ज्ञान ग्राफ भिजुअलाइज गर्ने, र फरक-फरक खोज रणनीतिहरू प्रयोग गरेर प्रश्नहरूको व्यावहारिक उदाहरणहरूसहित जुन विशिष्ट एजेन्ट आवश्यकताहरूलाई उपयुक्त हुन्छ।
Mem0 जस्ता विशेष मेमोरी उपकरणहरू बाहेक, तपाईंले मजबूत खोज सेवाहरू जस्तै Azure AI Search लाई मेमोरीहरू भण्डारण र पुनःप्राप्तिको लागि ब्याकएन्डको रूपमा प्रयोग गर्न सक्नुहुन्छ, विशेष गरी संरचित RAG को लागि।
यसले तपाईंको एजेन्टका जवाफहरू तपाईंको आफ्नै डाटासँग आधारभूत बनाउँछ, जसले अझ सान्दर्भिक र सही उत्तरहरू सुनिश्चित गर्दछ। Azure AI Search प्रयोगकर्ताको विशेष यात्रा मेमोरीहरू, उत्पादन सूची वा कुनै पनि डोमेन-विशिष्ट ज्ञान भण्डारण गर्न प्रयोग गर्न सकिन्छ।
Azure AI Search ले संरचित RAG जस्ता क्षमता समर्थन गर्दछ, जुन वार्तालाप इतिहासहरू, इमेलहरू, वा तस्वीरहरू जस्ता ठूलो डेटासेटहरूबाट घना, संरचित जानकारी निकाल्न र पुनःप्राप्त गर्न उत्कृष्ट छ। यसले पारंपरिक टेक्स्ट खण्ड र एम्बेडिङ विधिहरू भन्दा “अति मानवीय परिशुद्धता र स्मरण” उपलब्ध गराउँछ।
आत्म-सुधार गर्ने एजेन्टहरूको एक सामान्य ढाँचा भनेको “ज्ञान एजेन्ट” प्रबेश गराउनु हो। यो अलग एजेन्ट प्रयोगकर्ता र मुख्य एजेन्टको बीचको मुख्य वार्तालापलाई अनुगमन गर्छ। यसको भूमिका हो:
मूल्यवान जानकारी पहिचान गर्ने: वार्तालापको कुनै भाग सामान्य ज्ञान वा विशेष प्रयोगकर्ता प्राथमिकता रूपमा सुरक्षित गर्ने योग्य छ कि छैन निर्धारण गर्ने।
निकालन र सारांश गर्ने: वार्तालापबाट आवश्यक सिकाइ वा प्राथमिकता संक्षेप गर्ने।
ज्ञान आधारमा भण्डारण गर्ने: यस निकालेको जानकारीलाई सामान्यतया भेक्टर डेटाबेसमा स्थाई रूपमा राख्ने ताकि पछि पुनःप्राप्त गर्न सकियोस्।
भविष्यका प्रश्नहरू वृद्धि गर्ने: जब प्रयोगकर्ताले नयाँ प्रश्न गर्छ, ज्ञान एजेन्टले सम्बन्धित भण्डारित जानकारी फिर्ता ल्याएर प्रयोगकर्ताको प्रॉम्प्टमा थप्छ, जसले मुख्य एजेन्टलाई आवश्यक प्रसंग प्रदान गर्छ (RAG जस्तै)।
• ढिलोपन व्यवस्थापन: प्रयोगकर्ता अन्तरक्रियालाई ढिलो बनाउनबाट बच्न, सुरुमै सस्तो र छिटो मोडल प्रयोग गर्न सकिन्छ जसले छिटो जाँच गर्छ कि जानकारी भण्डारण वा पुनःप्राप्ति योग्य छ कि छैन, र आवश्यक परे जटिल निकास/पुनःप्राप्ति प्रक्रियालाई मात्र चलाउँछ।
• ज्ञान आधार मर्मत: बढ्दो ज्ञान आधारका लागि कम प्रयोग हुने जानकारीहरूलाई लागत व्यवस्थापनका लागि “शीतल भण्डारण” मा सार्न सकिन्छ।
Microsoft Foundry Discord मा सामेल हुनुहोस् अन्य सिकाउनेलाई भेट्न, कार्यालय समयहरूमा सहभागी हुन र तपाईका AI एजेन्ट सम्बन्धी प्रश्नहरूको उत्तर पाउन।
अस्वीकरण: यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको हो। हामी सही हुन प्रयास गर्छौं, तर कृपया जानकार हुनुस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छन्। मूल दस्तावेज़ यसको मूल भाषामा आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीका लागि व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न कुनै पनि गलत बुझाइ वा त्रुटिको लागि हामी जिम्मेवार छैनौं।