ai-agents-for-beginners

AI एजेन्टहरूको लागि मेमोरी

Agent Memory

AI एजेन्टहरू सिर्जना गर्दा अनौंठा लाभहरू मध्ये दुई कुरा मुख्य रूपमा उल्लेख गरिन्छ: कार्यहरू पूरा गर्न उपकरणहरू बोलाउन सक्ने क्षमता र समयसँगै सुधार गर्ने क्षमता। मेमोरी भनेको एक आत्म-सुधार गर्ने एजेन्ट सिर्जना गर्ने आधार हो जसले हाम्रा प्रयोगकर्ताहरूका लागि राम्रो अनुभवहरू सिर्जना गर्न सक्छ।

यस पाठमा, हामी हेर्ने छौं कि AI एजेन्टहरूको लागि मेमोरी के हो र हामी यसलाई कसरी व्यवस्थापन गर्न र हाम्रा अनुप्रयोगहरूको लाभका लागि प्रयोग गर्न सक्छौं।

परिचय

यस पाठले समेट्नेछ:

AI एजेन्ट मेमोरी बुझ्नु: मेमोरी के हो र किन यो एजेन्टहरूका लागि आवश्यक छ।

मेमोरी लागू गर्न र भण्डारण गर्न: तपाईंका AI एजेन्टहरूमा मेमोरी क्षमताहरू जोड्ने व्यावहारिक विधिहरू, छोटो अवधिको र दीर्घकालीन मेमोरीमा केन्द्रित।

AI एजेन्टहरूलाई आत्म-सुधार गर्ने बनाउन: कसरी मेमोरीले एजेन्टहरूलाई भूतपूर्व अन्तरक्रियाबाट सिक्न र समयसँगै सुधार गर्न सक्षम बनाउँछ।

उपलब्ध कार्यान्वयनहरू

यस पाठमा दुई सम्पूर्ण नोटबुक ट्यूटोरियलहरू छन्:

13-agent-memory.ipynb: Microsoft Agent Framework सँग Mem0 र Azure AI Search प्रयोग गरेर मेमोरी लागू गर्दछ

13-agent-memory-cognee.ipynb: Cognee प्रयोग गरेर संरचित मेमोरी लागू गर्दछ, embeddings द्वारा समर्थन गरिएको ज्ञान ग्राफ स्वचालित रूपमा निर्माण गर्दै, ग्राफ भिजुअलाइज गरी बुद्धिमानी पुनःप्राप्ति गर्दछ

सिकाई लक्ष्यहरू

यस पाठ पूरा गरेपछि, तपाईंले जान्नुपर्नेछ:

विभिन्न प्रकारका AI एजेन्ट मेमोरीहरू बीच फरक छुट्याउन, जसमा कार्य स्मृति, छोटो अवधिको मेमोरी, दीर्घकालीन मेमोरी, र persona तथा episodic मेमोरीजस्ता विशेष प्रकारहरू समावेश छन्।

Microsoft Agent Framework प्रयोग गरेर छोटो अवधिको र दीर्घकालीन मेमोरी लागू र व्यवस्थापन गर्न, Mem0, Cognee, Whiteboard मेमोरी जस्ता उपकरणहरूको उपयोग गर्दै, र Azure AI Search सँग एकीकरण गरि।

आत्म-सुधार गर्ने AI एजेन्टहरूको आधारभूत सिद्धान्तहरू बुझ्न र कसरी बलियो मेमोरी व्यवस्थापन प्रणालीहरूले निरन्तर सिकाई र अनुकूलनमा योगदान पुर्याउँछन्।

AI एजेन्ट मेमोरी बुझ्न

मूल रूपमा, AI एजेन्टहरूको लागि मेमोरी भनेको उनीहरूलाई जानकारी सङ्ग्रह गर्न र सम्झन सक्ने प्रक्रियाहरू हुन्। यी जानकारीहरूमा वार्तालापका विशिष्ट विवरणहरू, प्रयोगकर्ता प्राथमिकताहरू, विगतका क्रियाकलापहरू, वा सिकेका ढाँचाहरू समावेश हुन सक्छन्।

मेमोरी बिना, AI अनुप्रयोगहरू प्रायः स्टेटलेस हुन्छन्, जसको अर्थ हरेक अन्तरक्रिया नयाँबाट सुरू हुन्छ। यसले दोहोरिने र निराशाजनक प्रयोगकर्ता अनुभव ल्याउँछ जहाँ एजेन्टले पहिलेको प्रसंग वा प्राथमिकताहरू “बिर्सन्छ”।

मेमोरी किन महत्वपूर्ण छ?

एजेन्टको बुद्धिमत्ताले आफ्ना विगत जानकारी सम्झन र प्रयोग गर्न सक्ने क्षमतासँग गहिरो सम्बन्ध राख्छ। मेमोरीले एजेन्टलाई सक्षम बनाउँछ:

प्रतिबिम्बित गर्ने: विगत क्रियाकलाप र परिणामबाट सिक्ने।

इन्तरेक्टिभ: जारी वार्तालापको प्रसंग कायम राख्ने।

पूर्वानुमान र प्रतिक्रिया दिने: ऐतिहासिक डाटाको आधारमा आवश्यकतालाई अनुमान लगाउने वा उपयुक्त रूपमा प्रतिक्रिया दिने।

स्वायत्त: भण्डारित ज्ञान प्रयोग गरेर बढी स्वतन्त्र रूपमा काम गर्ने।

मेमोरी लागू गर्ने लक्ष्य भनेको एजेन्टहरूलाई अधिक विश्वसनीय र सक्षम बनाउनु हो।

मेमोरीका प्रकारहरू

कार्य स्मृति (Working Memory)

यसलाई एउटा चाँडो लेखिने पानाको रूपमा सोच्नुहोस् जुन एजेन्टले एउटै चलिरहेको कार्य वा सोच प्रक्रियाको क्रममा प्रयोग गर्छ। यसले अर्को कदम गणना गर्न आवश्यक तत्कालीन जानकारी समातेको हुन्छ।

AI एजेन्टहरूका लागि, कार्य स्मृतिले प्रायः वार्तालापबाट सबैभन्दा सम्बन्धित जानकारी समेट्छ, चाहे पुरा च्याट इतिहास लामो वा छोटो होस्। यो आवश्यक तत्वहरू जस्तै आवश्यकता, प्रस्ताव, निर्णय, र क्रियाकलाप निकाल्न केन्द्रित हुन्छ।

कार्य स्मृति उदाहरण

यात्रा बुकिङ एजेन्टमा, कार्य स्मृतिले प्रयोगकर्ताको वर्तमान अनुरोध समात्न सक्छ, जस्तै “म पेरिसको यात्रा बुक गर्न चाहन्छु”। यो विशिष्ट आवश्यकता एजेन्टको तत्कालीन प्रसंगमा राखिन्छ ताकि वर्तमान अन्तरक्रिया सन्चालित होस्।

छोटो अवधिको मेमोरी (Short Term Memory)

यो मेमोरी प्रकारले एकै वार्तालाप वा सत्रको अवधिका लागि जानकारी सम्हाल्छ। यो हालको च्याटको प्रसंग हो, जसले एजेन्टलाई संवादका पूर्व टर्नहरूमा सङ्केत गर्न अनुमति दिन्छ।

Microsoft Agent Framework को Python SDK नमूनाहरूमा, यो AgentSession सँग मेल खान्छ, जुन agent.create_session() द्वारा सिर्जना हुन्छ। सत्र नै फ्रेमवर्कमा अन्तर्गतको छोटो अवधिको मेमोरी हो: त्यो सत्र पुनः प्रयोग हुँदा वार्तालापको प्रसंग उपलब्ध रहन्छ, तर सत्र समाप्त हुँदा वा अनुप्रयोग पुनः सुरु हुँदा त्यो प्रसंग स्थायी हुँदैन। स्थायी तथ्य तथा प्राथमिकताहरूको लागि दीर्घकालीन मेमोरी प्रयोग गर्नुहोस्, जुन सामान्यतया डेटाबेस, भेक्टर सूची, वा अन्य स्थायी सञ्चयस्थानमार्फत हुन्छ।

छोटो अवधिको मेमोरी उदाहरण

यदि प्रयोगकर्ताले सोध्छ, “पेरिसको लागि फ्लाइट कति पर्छ?” र त्यसपछि “त्यहाँको आवासको के?” सोध्छ भने, छोटो अवधिको मेमोरीले एजेन्टलाई थाहा हुन्छ कि “त्यहाँ” भनेको “पेरिस” लाई जनाउँछ।

दीर्घकालीन मेमोरी (Long Term Memory)

यो धेरै वार्तालाप वा सत्रहरूमा टिकिरहने सूचना हो। यसले एजेन्टलाई प्रयोगकर्ताका प्राथमिकताहरू, ऐतिहासिक अन्तरक्रियाहरू, वा सामान्य ज्ञान दीर्घकालीन रूपमा सम्झन मद्दत गर्छ। यो व्यक्तिगत रुचिका लागि महत्वपूर्ण छ।

दीर्घकालीन मेमोरी उदाहरण

दीर्घकालीन मेमोरीले भण्डारण गर्न सक्छ कि “बेन स्किइङ र बाहिरी गतिविधिहरू मन पराउँछन्, पहाडी दृश्यसहित कफी मन पराउँछन्, र विगत चोटको कारण उन्नत स्की ढलानहरूबाट बच्न चाहन्छन्”। यो जानकारी, अघिका अन्तरक्रियाबाट सिकिएको हो, भविष्यको यात्रा योजना सत्रमा अत्यन्त व्यक्तिगत सिफारिसहरू बनाउन मद्दत गर्छ।

पर्सोना मेमोरी (Persona Memory)

यो विशेष मेमोरी प्रकार एजेन्टलाई एक सुसंगत “व्यक्तित्व” वा “पर्सोना” विकास गर्न मद्दत गर्छ। यसले एजेन्टलाई आफ्नै बारे वा उसको निर्धारित भूमिकाको विवरण सम्झन अनुमति दिन्छ, जसले अन्तरक्रियाहरूलाई अधिक प्रवाहपूर्ण र केन्द्रित बनाउँछ।

पर्सोना मेमोरी उदाहरण

यदि यात्रा एजेन्टलाई “विशेषज्ञ स्की योजनाकार” को रूपमा डिजाइन गरिएको छ भने, पर्सोना मेमोरीले यो भूमिकालाई सुदृढ पार्न सक्छ, जसले यसको प्रतिक्रियाहरूलाई विशेषज्ञको टोन र ज्ञानसँग मिल्न प्रभाव पार्दछ।

कार्यप्रवाह/एपिसोडिक मेमोरी (Workflow/Episodic Memory)

यसले जटिल कार्यका क्रममा एजेन्टले लिएका चरणहरूको अनुक्रम भण्डारण गर्छ, जसमा सफलताहरू र असफलताहरू समावेश हुन्छन्। यो खास “एपिसोडहरू” वा विगत अनुभवहरू सम्झन जस्तै हो जसबाट सिक्न सकिन्छ।

एपिसोडिक मेमोरी उदाहरण

एजेन्टले कुनै विशेष फ्लाइट बुक गर्न प्रयास गर्यो तर उपलब्ध नभएको कारण असफल भयो भने, एपिसोडिक मेमोरीले यो असफलता रेकर्ड गर्न सक्छ, जसले अर्को प्रयासमा वैकल्पिक फ्लाइट प्रयास गर्न वा प्रयोगकर्तालाई समस्या बारे अधिक जानकारी सहित सूचित गर्न मद्दत गर्छ।

Entity Memory

यसमा वार्तालापबाट विशिष्ट तत्वहरू (जस्तै मानिसहरू, स्थानहरू, वा वस्तुहरू) र घटनाहरू निकालेर सम्झने प्रक्रिया समावेश हुन्छ। यसले एजेन्टलाई छलफल गरिएका मुख्य तत्वहरूको संरचित बुझाइ बनाउन अनुमति दिन्छ।

Entity Memory उदाहरण

पुरानो यात्राको बारेमा भएको कुराकानीबाट, एजेन्टले “पेरिस”, “आईफल टावर”, र “Le Chat Noir रेस्टुरेन्टमा डिनर” तत्वहरू निकाल्न सक्छ। भविष्यको अन्तरक्रियामा, एजेन्टले “Le Chat Noir” सम्झिन सक्छ र त्यहाँ नयाँ आरक्षण गर्न प्रस्ताव गर्न सक्छ।

संरचित RAG (Retrieval Augmented Generation)

RAG विशिष्ट प्रविधि भए पनि, “संरचित RAG” एक शक्तिशाली मेमोरी प्रविधिको रूपमा हाइलाइट गरिएको छ। यसले विभिन्न स्रोतहरू (वार्तालापहरू, इमेलहरू, तस्वीरहरू) बाट घना, संरचित जानकारी निकाल्छ र प्रयोग गर्छ जसले जवाफहरूमा परिशुद्धता, स्मरण र गति बढाउँछ। पारंपरिक RAG मात्र अर्थगत समानतामा निर्भर रहँदा, संरचित RAG सूचना संरचनाका साथ काम गर्छ।

संरचित RAG उदाहरण

केवल कुञ्जीशब्द मिलाउनुभन्दा, संरचित RAG ले इमेलबाट फ्लाइट विवरणहरू (गन्तव्य, मिति, समय, एयरलाइन) पार्स गरी संरचित तरिकाले भण्डारण गर्न सक्छ। यसले “मले मंगलबार पेरिसका लागि कुन फ्लाइट बुक गरेको थिएँ?” जस्ता सटीक प्रश्नहरू गर्न अनुमति दिन्छ।

मेमोरी लागू गर्न र भण्डारण गर्न

AI एजेन्टहरूको लागि मेमोरी लागू गर्ने कार्य प्रणालीगत रूपमा मेमोरी व्यवस्थापन को प्रक्रिया हो, जसमा निर्माण, भण्डारण, पुनःप्राप्ति, एकीकरण, अपडेट, र कहिलेकाहीँ “भुल्ने” (वा मेट्ने) प्रक्रिया समावेश हुन्छ। पुनःप्राप्ति विशेष रूपमा महत्वपूर्ण पक्ष हो।

विशेष मेमोरी उपकरणहरू

Mem0

एजेन्ट मेमोरी भण्डारण र व्यवस्थापन गर्न एउटा तरिका Mem0 जस्ता विशेष उपकरणहरू प्रयोग गर्नु हो। Mem0 एक स्थायी मेमोरी तहको रूपमा काम गर्छ, जसले एजेन्टहरूलाई सम्बन्धित अन्तरक्रियाहरू सम्झन, प्रयोगकर्ता प्राथमिकताहरू र तथ्यात्मक प्रसंग संग्रह गर्न, र सफलताहरू तथा असफलताबाट समयसँगै सिक्न अनुमति दिन्छ। यस विचारमा, स्टेटलेस एजेन्टहरू स्टेटफुल एजेन्टहरूमा परिणत हुन्छन्।

यसले दुई चरणीय मेमोरी पाइपलाइन: निकास र अपडेट माध्यमबाट काम गर्छ। सुरुमा, एजेन्टको थ्रेडमा थपिएका सन्देशहरू Mem0 सेवामा पठाइन्छ, जहाँ ठूलो भाषा मोडल (LLM) ले वार्तालाप इतिहास संक्षेप गर्छ र नयाँ मेमोरीहरू निकाल्छ। त्यसपछि, LLM-सञ्चालित अपडेट चरणले यी मेमोरीहरू थप्ने, परिमार्जन गर्ने, वा मेट्ने तिर्न निर्णय गर्दछ, र तिनीहरूलाई भेक्टर, ग्राफ, र कुञ्जी-मूल्य डेटाबेसहरू भएको हाइब्रिड डाटास्टोरमा भण्डार गर्छ। यो प्रणाली विभिन्न मेमोरी प्रकारहरूलाई समर्थन गर्दछ र संस्थाहरू बीच सम्बन्ध व्यवस्थापनका लागि ग्राफ मेमोरी पनि समावेश गर्न सक्छ।

Cognee

अर्को शक्तिशाली दृष्टिकोण भनेको Cognee हो, जुन AI एजेन्टहरूको लागि खुला स्रोत सेम्यान्टिक मेमोरी हो जसले संरचित र असंरचित डाटालाई embeddings द्वारा समर्थित प्रश्नयोग्य ज्ञान ग्राफहरूमा रूपान्तरण गर्छ। Cognee ले द्वैध-स्टोर संरचना प्रदान गर्छ जसले भेक्टर समानता खोज र ग्राफ सम्बन्धहरूको संयोजन गर्छ, जसले एजेन्टहरूलाई केवल सूचना के समान छ मात्र होइन, तर विचारहरू कसरी सम्बन्धित छन् पनि बुझ्न सक्षम बनाउँछ।

यो विशेष गरी हाइब्रिड पुनःप्राप्ति मा उत्कृष्ट छ जसले भेक्टर समानता, ग्राफ संरचना, र LLM तर्कलाई मिश्रण गर्छ - कच्चा खण्ड खोजीबाट ग्राफ-सचेत प्रश्न उत्तरसम्म। प्रणालीले जीवित मेमोरी कायम राख्छ जुन विकास र वृद्धि हुन्छ र एकजुट ग्राफको रूपमा प्रश्नयोग्य रहन्छ, छोटो अवधिको सत्र प्रसंग र दीर्घकालीन स्थायी मेमोरी दुवैलाई समर्थन गर्दै।

Cognee नोटबुक ट्यूटोरियल (13-agent-memory-cognee.ipynb) ले यो एकीकृत मेमोरी तह निर्माण गर्ने देखाउँछ, विविध डेटा स्रोतहरूको अवशोषण, ज्ञान ग्राफ भिजुअलाइज गर्ने, र फरक-फरक खोज रणनीतिहरू प्रयोग गरेर प्रश्नहरूको व्यावहारिक उदाहरणहरूसहित जुन विशिष्ट एजेन्ट आवश्यकताहरूलाई उपयुक्त हुन्छ।

RAG सँग मेमोरी भण्डारण

Mem0 जस्ता विशेष मेमोरी उपकरणहरू बाहेक, तपाईंले मजबूत खोज सेवाहरू जस्तै Azure AI Search लाई मेमोरीहरू भण्डारण र पुनःप्राप्तिको लागि ब्याकएन्डको रूपमा प्रयोग गर्न सक्नुहुन्छ, विशेष गरी संरचित RAG को लागि।

यसले तपाईंको एजेन्टका जवाफहरू तपाईंको आफ्नै डाटासँग आधारभूत बनाउँछ, जसले अझ सान्दर्भिक र सही उत्तरहरू सुनिश्चित गर्दछ। Azure AI Search प्रयोगकर्ताको विशेष यात्रा मेमोरीहरू, उत्पादन सूची वा कुनै पनि डोमेन-विशिष्ट ज्ञान भण्डारण गर्न प्रयोग गर्न सकिन्छ।

Azure AI Search ले संरचित RAG जस्ता क्षमता समर्थन गर्दछ, जुन वार्तालाप इतिहासहरू, इमेलहरू, वा तस्वीरहरू जस्ता ठूलो डेटासेटहरूबाट घना, संरचित जानकारी निकाल्न र पुनःप्राप्त गर्न उत्कृष्ट छ। यसले पारंपरिक टेक्स्ट खण्ड र एम्बेडिङ विधिहरू भन्दा “अति मानवीय परिशुद्धता र स्मरण” उपलब्ध गराउँछ।

AI एजेन्टहरूलाई आत्म सुधार गर्न बनाउने

आत्म-सुधार गर्ने एजेन्टहरूको एक सामान्य ढाँचा भनेको “ज्ञान एजेन्ट” प्रबेश गराउनु हो। यो अलग एजेन्ट प्रयोगकर्ता र मुख्य एजेन्टको बीचको मुख्य वार्तालापलाई अनुगमन गर्छ। यसको भूमिका हो:

  1. मूल्यवान जानकारी पहिचान गर्ने: वार्तालापको कुनै भाग सामान्य ज्ञान वा विशेष प्रयोगकर्ता प्राथमिकता रूपमा सुरक्षित गर्ने योग्य छ कि छैन निर्धारण गर्ने।

  2. निकालन र सारांश गर्ने: वार्तालापबाट आवश्यक सिकाइ वा प्राथमिकता संक्षेप गर्ने।

  3. ज्ञान आधारमा भण्डारण गर्ने: यस निकालेको जानकारीलाई सामान्यतया भेक्टर डेटाबेसमा स्थाई रूपमा राख्ने ताकि पछि पुनःप्राप्त गर्न सकियोस्।

  4. भविष्यका प्रश्नहरू वृद्धि गर्ने: जब प्रयोगकर्ताले नयाँ प्रश्न गर्छ, ज्ञान एजेन्टले सम्बन्धित भण्डारित जानकारी फिर्ता ल्याएर प्रयोगकर्ताको प्रॉम्प्टमा थप्छ, जसले मुख्य एजेन्टलाई आवश्यक प्रसंग प्रदान गर्छ (RAG जस्तै)।

मेमोरीका लागि अनुकूलनहरू

ढिलोपन व्यवस्थापन: प्रयोगकर्ता अन्तरक्रियालाई ढिलो बनाउनबाट बच्न, सुरुमै सस्तो र छिटो मोडल प्रयोग गर्न सकिन्छ जसले छिटो जाँच गर्छ कि जानकारी भण्डारण वा पुनःप्राप्ति योग्य छ कि छैन, र आवश्यक परे जटिल निकास/पुनःप्राप्ति प्रक्रियालाई मात्र चलाउँछ।

ज्ञान आधार मर्मत: बढ्दो ज्ञान आधारका लागि कम प्रयोग हुने जानकारीहरूलाई लागत व्यवस्थापनका लागि “शीतल भण्डारण” मा सार्न सकिन्छ।

एजेन्ट मेमोरीबारे थप प्रश्नहरू छन्?

Microsoft Foundry Discord मा सामेल हुनुहोस् अन्य सिकाउनेलाई भेट्न, कार्यालय समयहरूमा सहभागी हुन र तपाईका AI एजेन्ट सम्बन्धी प्रश्नहरूको उत्तर पाउन।


अस्वीकरण: यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको हो। हामी सही हुन प्रयास गर्छौं, तर कृपया जानकार हुनुस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छन्। मूल दस्तावेज़ यसको मूल भाषामा आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीका लागि व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न कुनै पनि गलत बुझाइ वा त्रुटिको लागि हामी जिम्मेवार छैनौं।