एआई एजेन्टहरू निर्माण गर्दा हुने विशेष फाइदाहरूको चर्चा गर्दा मुख्यत: दुई कुराहरूमा ध्यान दिइन्छ: टास्क पूरा गर्न उपकरणहरू प्रयोग गर्ने क्षमता र समयसँगै सुधार गर्ने क्षमता। मेमोरी भनेको आत्म-सुधार गर्ने एजेन्ट निर्माणको आधार हो, जसले हाम्रो प्रयोगकर्ताहरूलाई राम्रो अनुभव प्रदान गर्न सक्छ।
यस पाठमा, हामी एआई एजेन्टहरूको लागि मेमोरी के हो, कसरी यसलाई व्यवस्थापन गर्ने र हाम्रो एप्लिकेसनहरूको फाइदाका लागि प्रयोग गर्ने भन्ने कुरा हेर्नेछौं।
यस पाठले निम्न विषयहरू समेट्छ:
• एआई एजेन्ट मेमोरीको समझ: मेमोरी के हो र एजेन्टहरूको लागि किन आवश्यक छ।
• मेमोरी कार्यान्वयन र भण्डारण: छोटो अवधिको र लामो अवधिको मेमोरीमा केन्द्रित गर्दै, एआई एजेन्टहरूमा मेमोरी क्षमता थप्ने व्यावहारिक विधिहरू।
• एआई एजेन्टहरूलाई आत्म-सुधार गर्ने बनाउने: मेमोरीले कसरी एजेन्टहरूलाई अघिल्लो अन्तरक्रियाबाट सिक्न र समयसँगै सुधार गर्न सक्षम बनाउँछ।
यस पाठमा दुई व्यापक नोटबुक ट्युटोरियलहरू समावेश छन्:
• 13-agent-memory.ipynb: मेमोरीलाई Mem0 र Azure AI Search प्रयोग गरेर Semantic Kernel फ्रेमवर्कसँग कार्यान्वयन गर्दछ।
• 13-agent-memory-cognee.ipynb: Cognee प्रयोग गरेर संरचित मेमोरी कार्यान्वयन गर्दछ, जसले embeddings द्वारा समर्थित ज्ञान ग्राफ निर्माण, ग्राफ दृश्य, र बौद्धिक पुनःप्राप्ति प्रदान गर्दछ।
यस पाठ पूरा गरेपछि, तपाईंलाई निम्न कुराहरू थाहा हुनेछ:
• एआई एजेन्ट मेमोरीका विभिन्न प्रकारहरू छुट्याउन सक्ने, जस्तै कार्यरत, छोटो अवधिको, र लामो अवधिको मेमोरी, साथै विशेष प्रकारहरू जस्तै पर्सोना र एपिसोडिक मेमोरी।
• एआई एजेन्टहरूको लागि छोटो र लामो अवधिको मेमोरी कार्यान्वयन र व्यवस्थापन गर्ने, Semantic Kernel फ्रेमवर्क प्रयोग गर्दै, Mem0, Cognee, Whiteboard मेमोरी जस्ता उपकरणहरू प्रयोग गर्दै र Azure AI Searchसँग एकीकृत गर्दै।
• आत्म-सुधार गर्ने एआई एजेन्टहरूको पछाडि रहेको सिद्धान्तहरू बुझ्ने र कसरी बलियो मेमोरी व्यवस्थापन प्रणालीहरूले निरन्तर सिकाइ र अनुकूलनमा योगदान पुर्याउँछ।
यसको मूलमा, एआई एजेन्टहरूको लागि मेमोरी भनेको तिनीहरूले जानकारी राख्न र सम्झन सक्ने संयन्त्रहरूलाई जनाउँछ। यो जानकारी वार्ताको विशिष्ट विवरणहरू, प्रयोगकर्ताको प्राथमिकताहरू, अघिल्लो कार्यहरू, वा सिकिएका ढाँचाहरू हुन सक्छ।
मेमोरी बिना, एआई एप्लिकेसनहरू प्राय: स्टेटलेस हुन्छन्, जसको अर्थ प्रत्येक अन्तरक्रिया नयाँबाट सुरु हुन्छ। यसले एजेन्टले अघिल्लो सन्दर्भ वा प्राथमिकताहरू “भुल्ने” दोहोरिने र निराशाजनक प्रयोगकर्ता अनुभवको कारण बनाउँछ।
एजेन्टको बुद्धिमत्ता अघिल्लो जानकारी सम्झन र प्रयोग गर्ने क्षमतासँग गहिरो रूपमा जोडिएको छ। मेमोरीले एजेन्टहरूलाई निम्न प्रकारका बनाउँछ:
• प्रतिबिम्बित: अघिल्लो कार्यहरू र परिणामहरूबाट सिक्ने।
• अन्तरक्रियात्मक: चलिरहेको वार्ताको सन्दर्भ कायम राख्ने।
• प्रोएक्टिभ र प्रतिक्रियात्मक: ऐतिहासिक डाटाको आधारमा आवश्यकताहरू अनुमान गर्ने वा उपयुक्त प्रतिक्रिया दिने।
• स्वायत्त: भण्डारण गरिएको ज्ञानको आधारमा स्वतन्त्र रूपमा काम गर्ने।
मेमोरी कार्यान्वयनको लक्ष्य एजेन्टहरूलाई थप विश्वसनीय र सक्षम बनाउनु हो।
यसलाई एजेन्टले एकल, चलिरहेको कार्य वा सोच प्रक्रियाको समयमा प्रयोग गर्ने स्क्र्याच पेपरको रूपमा सोच्न सकिन्छ। यसले अर्को चरण गणना गर्न आवश्यक तत्काल जानकारी राख्छ।
एआई एजेन्टहरूको लागि, कार्यरत मेमोरीले वार्ताबाट सबैभन्दा सान्दर्भिक जानकारी समेट्छ, चाहे पूर्ण च्याट इतिहास लामो वा छोटो हो। यसले आवश्यकताहरू, प्रस्तावहरू, निर्णयहरू, र कार्यहरू जस्ता प्रमुख तत्वहरू निकाल्नमा ध्यान केन्द्रित गर्दछ।
कार्यरत मेमोरी उदाहरण
यात्रा बुक गर्ने एजेन्टमा, कार्यरत मेमोरीले प्रयोगकर्ताको वर्तमान अनुरोध समेट्न सक्छ, जस्तै “म पेरिसको यात्रा बुक गर्न चाहन्छु”। यो विशिष्ट आवश्यकता एजेन्टको तत्काल सन्दर्भमा राखिन्छ ताकि वर्तमान अन्तरक्रियालाई मार्गदर्शन गर्न सकियोस्।
यो प्रकारको मेमोरीले एकल वार्ता वा सत्रको अवधिको लागि जानकारी राख्छ। यो वर्तमान च्याटको सन्दर्भ हो, जसले एजेन्टलाई संवादको अघिल्लो चरणहरूमा फर्केर हेर्न अनुमति दिन्छ।
छोटो अवधिको मेमोरी उदाहरण
यदि प्रयोगकर्ताले सोध्छ, “पेरिसको उडानको लागत कति हुन्छ?” र त्यसपछि “त्यहाँको आवासको बारेमा के?” भन्छ भने, छोटो अवधिको मेमोरीले सुनिश्चित गर्दछ कि एजेन्टलाई थाहा छ “त्यहाँ” भनेको “पेरिस” हो।
यो जानकारी हो जुन धेरै वार्ता वा सत्रहरूमा कायम रहन्छ। यसले एजेन्टहरूलाई प्रयोगकर्ताको प्राथमिकताहरू, ऐतिहासिक अन्तरक्रियाहरू, वा सामान्य ज्ञान लामो समयसम्म सम्झन अनुमति दिन्छ। यो व्यक्तिगतकरणको लागि महत्त्वपूर्ण छ।
लामो अवधिको मेमोरी उदाहरण
लामो अवधिको मेमोरीले “बेनलाई स्कीइङ र बाहिरी गतिविधिहरू मनपर्छ, पहाडको दृश्यसहित कफी मनपर्छ, र अघिल्लो चोटका कारण उन्नत स्की ढलानहरूबाट बच्न चाहन्छ” भन्ने जानकारी भण्डारण गर्न सक्छ। यो जानकारी, अघिल्लो अन्तरक्रियाबाट सिकिएको, भविष्यको यात्रा योजना सत्रहरूमा सिफारिसहरूलाई अत्यधिक व्यक्तिगत बनाउँछ।
यो विशेष मेमोरी प्रकारले एजेन्टलाई एक सुसंगत “व्यक्तित्व” वा “पर्सोना” विकास गर्न मद्दत गर्दछ। यसले एजेन्टलाई आफू वा आफ्नो इच्छित भूमिकाको बारेमा विवरण सम्झन अनुमति दिन्छ, जसले अन्तरक्रियालाई थप तरल र केन्द्रित बनाउँछ।
पर्सोना मेमोरी उदाहरण
यदि यात्रा एजेन्टलाई “विशेषज्ञ स्की योजनाकार” को रूपमा डिजाइन गरिएको छ भने, पर्सोना मेमोरीले यो भूमिका सुदृढ गर्न सक्छ, जसले यसको प्रतिक्रियाहरूलाई विशेषज्ञको स्वर र ज्ञानसँग मेल खाने बनाउँछ।
यो मेमोरीले जटिल कार्यको क्रममा एजेन्टले लिएको चरणहरूको क्रम, सफलताहरू र असफलताहरू भण्डारण गर्दछ। यो अघिल्लो “एपिसोडहरू” वा अनुभवहरू सम्झन जस्तै हो।
एपिसोडिक मेमोरी उदाहरण
यदि एजेन्टले विशिष्ट उडान बुक गर्न प्रयास गर्यो तर उपलब्धता अभावका कारण असफल भयो भने, एपिसोडिक मेमोरीले यो असफलता रेकर्ड गर्न सक्छ, जसले एजेन्टलाई वैकल्पिक उडानहरू प्रयास गर्न वा प्रयोगकर्तालाई अर्को प्रयासको क्रममा थप जानकारीसहित समस्या बारे सूचित गर्न अनुमति दिन्छ।
यसले वार्ताबाट विशिष्ट इकाईहरू (जस्तै व्यक्ति, स्थान, वा वस्तुहरू) र घटनाहरू निकाल्न र सम्झन समेट्छ। यसले एजेन्टलाई छलफल गरिएका प्रमुख तत्वहरूको संरचित समझ निर्माण गर्न अनुमति दिन्छ।
इकाई मेमोरी उदाहरण
अघिल्लो यात्राको बारेमा वार्ताबाट, एजेन्टले “पेरिस,” “एफिल टावर,” र “ले च्याट नोइर रेस्टुरेन्टमा डिनर” जस्ता इकाईहरू निकाल्न सक्छ। भविष्यको अन्तरक्रियामा, एजेन्टले “ले च्याट नोइर” सम्झन सक्छ र त्यहाँ नयाँ आरक्षण गर्न प्रस्ताव गर्न सक्छ।
RAG एक व्यापक प्रविधि हो, तर “संरचित RAG” लाई शक्तिशाली मेमोरी प्रविधिको रूपमा हाइलाइट गरिएको छ। यसले विभिन्न स्रोतहरू (वार्ता, इमेल, छविहरू) बाट घना, संरचित जानकारी निकाल्छ र प्रतिक्रियामा सटीकता, पुनःप्राप्ति, र गति बढाउन प्रयोग गर्दछ।
संरचित RAG उदाहरण
केवल कीवर्ड मिलाउने मात्र होइन, संरचित RAG ले इमेलबाट उडान विवरणहरू (गन्तव्य, मिति, समय, एयरलाइन) पार्स गर्न सक्छ र तिनीहरूलाई संरचित रूपमा भण्डारण गर्न सक्छ। यसले “मंगलबार पेरिसको लागि मैले कुन उडान बुक गरे?” जस्ता सटीक प्रश्नहरूलाई अनुमति दिन्छ।
एआई एजेन्टहरूको लागि मेमोरी कार्यान्वयनले मेमोरी व्यवस्थापन को व्यवस्थित प्रक्रियालाई समेट्छ, जसमा जानकारी उत्पन्न गर्ने, भण्डारण गर्ने, पुनःप्राप्ति गर्ने, एकीकृत गर्ने, अद्यावधिक गर्ने, र “भुल्ने” (वा मेट्ने) समावेश छ। पुनःप्राप्ति विशेष रूपमा महत्त्वपूर्ण पक्ष हो।
एजेन्ट मेमोरी भण्डारण र व्यवस्थापन गर्ने एक तरिका Mem0 जस्ता विशेष उपकरणहरू प्रयोग गर्नु हो। Mem0 एक स्थायी मेमोरी तहको रूपमा काम गर्दछ, जसले एजेन्टहरूलाई सान्दर्भिक अन्तरक्रिया सम्झन, प्रयोगकर्ताको प्राथमिकताहरू र तथ्यात्मक सन्दर्भ भण्डारण गर्न, र समयसँगै सफलताहरू र असफलताहरूबाट सिक्न अनुमति दिन्छ।
यसले दुई-चरण मेमोरी पाइपलाइन: निकासी र अद्यावधिक मार्फत काम गर्दछ। पहिलो, एजेन्टको थ्रेडमा थपिएका सन्देशहरू Mem0 सेवामा पठाइन्छ, जसले वार्ता इतिहासलाई संक्षेपमा प्रस्तुत गर्न र नयाँ मेमोरीहरू निकाल्न ठूलो भाषा मोडेल (LLM) प्रयोग गर्दछ। त्यसपछि, LLM-संचालित अद्यावधिक चरणले यी मेमोरीहरू थप्ने, संशोधन गर्ने वा मेट्ने निर्णय गर्दछ, तिनीहरूलाई भेक्टर, ग्राफ, र की-वैल्यू डाटाबेसहरू समावेश गर्ने हाइब्रिड डाटा स्टोरमा भण्डारण गर्दछ। यो प्रणालीले विभिन्न मेमोरी प्रकारहरूलाई समर्थन गर्दछ र इकाईहरूको बीचको सम्बन्ध व्यवस्थापन गर्न ग्राफ मेमोरी समावेश गर्न सक्छ।
अर्को शक्तिशाली दृष्टिकोण Cognee प्रयोग गर्नु हो, एआई एजेन्टहरूको लागि खुला-स्रोत सिमेन्टिक मेमोरी, जसले संरचित र असंरचित डाटालाई क्वेरी गर्न मिल्ने ज्ञान ग्राफमा रूपान्तरण गर्दछ। Cognee ले भेक्टर समानता खोज र ग्राफ सम्बन्धहरूको संयोजन गर्ने द्वै-भण्डारण वास्तुकला प्रदान गर्दछ, जसले एजेन्टहरूलाई केवल समान जानकारी मात्र होइन, अवधारणाहरू कसरी एक-अर्कासँग सम्बन्धित छन् भन्ने कुरा बुझ्न सक्षम बनाउँछ।
यसले हाइब्रिड पुनःप्राप्ति मा उत्कृष्टता प्राप्त गर्दछ, जसले भेक्टर समानता, ग्राफ संरचना, र LLM तर्कलाई मिश्रण गर्दछ - कच्चा चंक लुकअपदेखि ग्राफ-सचेत प्रश्न उत्तरसम्म। प्रणालीले जीवित मेमोरी कायम राख्छ, जसले बढ्दै र विकसित हुँदै एक जडित ग्राफको रूपमा क्वेरी गर्न मिल्ने रहन्छ, छोटो अवधिको सत्र सन्दर्भ र लामो अवधिको स्थायी मेमोरी दुवैलाई समर्थन गर्दै।
Cognee नोटबुक ट्युटोरियल (13-agent-memory-cognee.ipynb) ले यो एकीकृत मेमोरी तह निर्माण गर्ने व्यावहारिक उदाहरणहरू प्रदर्शन गर्दछ, विविध डाटा स्रोतहरू समाहित गर्ने, ज्ञान ग्राफ दृश्य गर्ने, र विभिन्न खोज रणनीतिहरू प्रयोग गरेर एजेन्टको आवश्यकताहरूमा अनुकूलित क्वेरी गर्ने।
विशेष मेमोरी उपकरणहरू जस्तै Mem0 बाहेक, तपाईं Azure AI Search जस्ता बलियो खोज सेवाहरूलाई मेमोरी भण्डारण र पुनःप्राप्ति गर्न ब्याकएन्डको रूपमा प्रयोग गर्न सक्नुहुन्छ, विशेष गरी संरचित RAG को लागि।
यसले तपाईंको एजेन्टको प्रतिक्रियाहरूलाई तपाईंको आफ्नै डाटासँग आधार प्रदान गर्न अनुमति दिन्छ, जसले थप सान्दर्भिक र सटीक उत्तरहरू सुनिश्चित गर्दछ। Azure AI Search प्रयोगकर्ताको यात्रा मेमोरीहरू, उत्पादन क्याटलगहरू, वा कुनै पनि डोमेन-विशिष्ट ज्ञान भण्डारण गर्न प्रयोग गर्न सकिन्छ।
Azure AI Search ले संरचित RAG जस्ता क्षमताहरूलाई समर्थन गर्दछ, जसले वार्ता इतिहास, इमेल, वा छविहरू जस्ता ठूला डाटासेटहरूबाट घना, संरचित जानकारी निकाल्न र पुनःप्राप्ति गर्न उत्कृष्टता प्राप्त गर्दछ। यसले परम्परागत टेक्स्ट चंकिङ र एम्बेडिङ दृष्टिकोणहरूको तुलनामा “सुपरह्युमन सटीकता र पुनःप्राप्ति” प्रदान गर्दछ।
आत्म-सुधार गर्ने एजेन्टहरूको लागि सामान्य ढाँचाले “ज्ञान एजेन्ट” परिचय गराउँछ। यो छुट्टै एजेन्टले प्रयोगकर्ता र प्राथमिक एजेन्ट बीचको मुख्य वार्तालाई अवलोकन गर्दछ। यसको भूमिका निम्न छ:
महत्त्वपूर्ण जानकारी पहिचान गर्ने: वार्ताको कुनै भाग सामान्य ज्ञान वा विशिष्ट प्रयोगकर्ता प्राथमिकता रूपमा बचत गर्न योग्य छ कि छैन निर्धारण गर्ने।
निकाल्ने र संक्षेप गर्ने: वार्ताबाट आवश्यक सिकाइ वा प्राथमिकतालाई संक्षेपमा प्रस्तुत गर्ने।
ज्ञान आधारमा भण्डारण गर्ने: निकालिएको जानकारीलाई भेक्टर डाटाबेसमा स्थायी रूपमा राख्ने ताकि पछि पुनःप्राप्ति गर्न सकियोस्।
भविष्यका क्वेरीहरूलाई बढावा दिने: जब प्रयोगकर्ताले नयाँ क्वेरी सुरु गर्छ, ज्ञान एजेन्टले सान्दर्भिक भण्डारण गरिएको जानकारी पुनःप्राप्ति गर्छ र प्रयोगकर्ताको प्रम्प्टमा थप्छ, प्राथमिक एजेन्टलाई महत्त्वपूर्ण सन्दर्भ प्रदान गर्दै (RAG जस्तै)।
• लेटेन्सी व्यवस्थापन: प्रयोगकर्ता अन्तरक्रियालाई ढिलो हुनबाट बचाउन, सस्तो, छिटो मोडेल सुरुमा प्रयोग गर्न सकिन्छ ताकि जानकारी भण्डारण वा पुनःप्राप्ति गर्न योग्य छ कि छैन छिटो जाँच गर्न सकियोस्, केवल आवश्यक पर्दा जटिल निकासी/पुनःप्राप्ति प्रक्रिया सुरु गर्ने।
• ज्ञान आधार मर्मत: बढ्दो ज्ञान आधारको लागि, कम बारम्बार प्रयोग गरिने जानकारीलाई “चिसो भण्डारण” मा सार्न सकिन्छ ताकि लागत व्यवस्थापन गर्न सकियोस्।
Azure AI Foundry Discord मा सामेल हुनुहोस् ताकि अन्य सिक्नेहरूसँग भेट्न, कार्यालय समयमा सहभागी हुन र तपाईंको एआई एजेन्टहरूको प्रश्नहरूको उत्तर पाउन सकियोस्।
अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरेर अनुवाद गरिएको छ। हामी सटीकताको लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटिहरू वा अशुद्धताहरू हुन सक्छ। यसको मूल भाषा मा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्वपूर्ण जानकारीको लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुनेछैनौं।