एआई एजेन्टहरू सिर्जना गर्दा फरक फाइदाहरूमा प्रायः दुइवटा कुरा मुख्य रूपमा उठ्छन्: कार्य पूरा गर्न उपकरणहरू कल गर्ने क्षमता र समयसँगै सुधार गर्ने क्षमता। मेमोरी आत्म-सुधार हुने एजेन्ट निर्माण गर्ने आधार हो जसले हाम्रो प्रयोगकर्ताहरूका लागि राम्रो अनुभव सिर्जना गर्न सक्छ।
यस पाठमा, हामी एआई एजेन्टहरूको लागि मेमोरी के हो र हामी यसलाई कसरी व्यवस्थापन र प्रयोग गर्न सक्छौं भनी हेर्नेछौं।
यस पाठले समेट्नेछ:
• एआई एजेन्ट मेमोरी बुझ्नु: मेमोरी के हो र एजेन्टहरूको लागि किन आवश्यक छ।
• मेमोरी लागू गर्ने र भण्डारण गर्ने: तपाईंका एआई एजेन्टहरूमा मेमोरी क्षमताहरू थप्ने व्यावहारिक विधिहरू, छोटो अवधिको र दीर्घकालीन स्मृतिमा केन्द्रित।
• एआई एजेन्टहरूलाई आत्म-सुधार बनाउने: मेमोरीले कसरी एजेन्टहरूलाई विगतका अन्तरक्रियाबाट सिक्न र समयसँग सुधार गर्न सक्षम बनाउँछ।
यस पाठमा दुईवटा व्यापक नोटबुक ट्युटोरियलहरू समावेश छन्:
• 13-agent-memory.ipynb: Mem0 र Azure AI Search सँग Semantic Kernel framework प्रयोग गरी मेमोरी लागू गर्दछ
• 13-agent-memory-cognee.ipynb: Cognee प्रयोग गरी संरचित मेमोरी लागू गर्दछ, जुन embeddings द्वारा समर्थित ज्ञान ग्राफ स्वचालित रूपमा निर्माण गर्दछ, ग्राफ भिजुअलाइज गर्छ र बुद्धिमानीपूर्ण प्राप्ति गर्दछ
यस पाठ पूरा गरेपछि, तपाईं जान्ने हुनुहुनेछ:
• विभिन्न प्रकारका एआई एजेन्ट मेमोरी बीच फरक कसरी छुट्याउने, जसमा कार्यशील, छोटो-अवधिको, र दीर्घकालीन स्मृति समावेश छन्, साथै persona र एपिसोडिक जस्ता विशिष्ट रूपहरू।
• Semantic Kernel framework प्रयोग गरी एआई एजेन्टहरूको लागि छोटो-अवधि र दीर्घकालीन स्मृति लागू र व्यवस्थापन गर्ने तरिकाहरू, Mem0, Cognee, Whiteboard memory जस्ता उपकरणहरूको उपयोग र Azure AI Search सँग एकीकरण गरेर।
• आत्म-सुधार गर्ने एआई एजेन्टहरूको सिद्धान्तहरू बुझ्ने र कसरी मजबुत मेमोरी व्यवस्थापन प्रणालीहरूले निरन्तर सिकाइ र अनुकूलनमा योगदान गर्दछन्।
आधारमा, एआई एजेन्टहरूको लागि मेमोरीले उनीहरूलाई जानकारी राख्न र पुनःस्मरण गर्न सक्षम बनाउने मेकानिज्महरूलाई जनाउँछ। यो जानकारी वार्तालापका विशेष विवरणहरू, प्रयोगकर्ता प्राथमिकताहरू, विगतका कार्यहरू, वा सिकिएका ढाँचाहरू हुन सक्छ।
मेमोरी बिना, एआई अनुप्रयोगहरू प्रायः स्टेटलेस हुन्छन्, जुन भन्नुको अर्थ प्रत्येक अन्तरक्रिया नयाँबाट सुरु हुन्छ। यसले पुनरावृत्त र निराशाजनक प्रयोगकर्ता अनुभव उत्पन्न गर्दछ जहाँ एजेन्टले पहिलेको सन्दर्भ वा प्राथमिकताहरू “भुल्छ”।
एजेन्टको बुद्धिमत्ता यसको विगत जानकारी सम्झने र प्रयोग गर्ने क्षमतासँग गहिरो रूपमा जडित छ। मेमोरीले एजेन्टहरूलाई निम्न बनाउन अनुमति दिन्छ:
• प्रतिबिम्बात्मक: विगतका कार्य र परिणामहरूबाट सिक्ने।
• अन्तर्क्रियात्मक: एक चलिरहेको वार्तालापमा सन्दर्भ कायम राख्ने।
• प्रोएक्टिभ र प्रतिक्रियाशील: ऐतिहासिक डाटाको आधारमा आवश्यकताहरू अनुमान गर्न वा उपयुक्त रूपमा प्रतिक्रिया दिन।
• स्वायत्त: सञ्चित ज्ञानको आधारमा बढी स्वतन्त्र रूपमा सञ्चालन गर्ने।
मेमोरी कार्यान्वयन गर्ने लक्ष्य एजेन्टहरूलाई बढी भरपर्दो र सक्षम बनाउन हो।
यसलाई एउटै, चलिरहेको कार्य वा चिन्तन प्रक्रियाको दौरान एजेन्टले प्रयोग गर्ने एउटा स्क्र्याच पेपरको टुक्रा जस्तो सोचे। यसले अर्को कदम गणना गर्न आवश्यक तत्काल जानकारी राख्छ।
एआई एजेन्टहरूको लागि, कार्यशील स्मृतिले प्रायः वार्तालापबाट सबैभन्दा सान्दर्भिक जानकारी सङ्कलन गर्दछ, भले नै पूरा च्याट इतिहास लामो वा ट्रंकटेड किन नहोस्। यसले आवश्यकताहरू, प्रस्तावहरू, निर्णयहरू, र कार्यहरू जस्ता प्रमुख तत्वहरू निकाल्नमा केन्द्रित हुन्छ।
कार्यशील स्मृतिको उदाहरण
एक यात्रा बुकिंग एजेन्टमा, कार्यशील स्मृतिले प्रयोगकर्ताको वर्तमान अनुरोध जस्तो “म पेरिसको लागि यात्रा बुक गर्न चाहन्छु” समात्न सक्छ। यो विशेष आवश्यकतालाई एजेन्टको तत्काल सन्दर्भमा राखेर वर्तमान अन्तरक्रियालाई मार्गदर्शन गरिन्छ।
यस प्रकारको स्मृतिले एकल वार्तालाप वा सत्रको अवधिका लागि जानकारी राख्छ। यो वर्तमान च्याटको सन्दर्भ हो, जसले एजेन्टलाई संवादका अघिल्ला चरणहरूलाई फेरी सन्दर्भ गर्न अनुमति दिन्छ।
छोटो-अवधि स्मृतिको उदाहरण
यदि प्रयोगकर्ताले सोध्छन्, “पेरिस जानको लागि उडान कति हुन्छ?” र त्यसपछि “त्यहाँ आवासको के?” भन्छन् भने, छोटो-अवधि स्मृतिले सुनिश्चित गर्छ कि एजेन्टलाई “त्यहाँ”ले सोही वार्तालाप भित्र “पेरिस”लाई जनाउने कुरा थाहा छ।
यो त्यस्तो जानकारी हो जुन धेरै वार्तालाप वा सत्रहरूमा कायम रहन्छ। यसले एजेन्टहरूलाई प्रयोगकर्ताका प्राथमिकताहरू, ऐतिहासिक अन्तरक्रियाहरू, वा लामो अवधिका लागि सामान्य ज्ञान सम्झन अनुमति दिन्छ। यो निजीकरणका लागि महत्वपूर्ण हुन्छ।
दीर्घकालीन स्मृतिको उदाहरण
दीर्घकालीन स्मृतिले भण्डारण गर्न सक्छ कि “Ben लाई स्किइङ र बाहिरी गतिविधिहरू मनपर्छ, ऊ पहाडको दृश्यसहितको कफी मनाउँछ, र विगतको चोटका कारण उन्नत स्की ढलानहरूबाट बच्न चाहन्छ”। अघिल्लो अन्तरक्रियाबाट सिकिएको यो जानकारी भविष्यका यात्रा योजना सत्रहरूमा सिफारिशहरूलाई प्रभाव पार्छ, जसले ती सिफारिशहरू अत्यधिक व्यक्तिगत बनाउँछ।
यो विशिष्ट स्मृति प्रकारले एजेन्टलाई एक निरन्तर “व्यक्तित्व” वा “पर्सोना” विकास गर्न मद्दत गर्छ। यसले एजेन्टलाई आफू वा यसको लक्षित भूमिकाबारे विवरण सम्झन अनुमति दिन्छ, जसले अन्तरक्रियाहरूलाई बढी द्रुत र केन्द्रित बनाउँछ।
पर्सोना स्मृतिको उदाहरण यदि यात्रा एजेन्टलाई “विशेषज्ञ स्की योजनाकार” रूपमा डिजाइन गरिएको छ भने, पर्सोना स्मृतिले यो भूमिकालाई सुदृढ गर्न सक्छ, जसले यसका प्रतिक्रियाहरूलाई विशेषज्ञको टोन र ज्ञानसँग मेल खाने बनाउँछ।
यो स्मृतिले जटिल कार्यका क्रममा एजेन्टले लिएका कदमहरूको अनुक्रम, सफलताहरू र असफलताहरू समात्छ। यो विशेष “एपिसोडहरू” वा विगतका अनुभवहरूलाई सम्झिनु जस्तै हो र तिनीहरूबाट सिक्न मद्दत गर्दछ।
एपिसोडिक स्मृतिको उदाहरण
यदि एजेन्टले विशिष्ट उडान बुक गर्न प्रयास गर्यो तर उपलब्धताका कारण असफल भयो भने, एपिसोडिक स्मृतिले यस असफलतालाई रेकर्ड गर्न सक्छ, जसले एजेन्टलाई वैकल्पिक उडानहरू प्रयास गर्न वा प्रयोगकर्तालाई आगामी प्रयासमा समस्या बारे अधिक सूचित तरिकाले जानकारी दिन मद्दत गर्दछ।
यसमा संवादबाट विशेष एकाइहरू (जस्तै व्यक्ति, स्थान, वा वस्तुहरू) र घटनाहरू निकालेर सम्झनु समावेश हुन्छ। यसले एजेन्टलाई छलफल गरिएका प्रमुख तत्वहरूको संरचित बुझाइ निर्माण गर्न अनुमति दिन्छ।
एकाइ स्मृतिको उदाहरण
अघिल्लो यात्राको बारेमा भएका कुराकानीबाट, एजेन्टले “पेरिस,” “आइफेल टावर,” र “Le Chat Noir रेस्टुरेन्टमा डिनर” जस्ता एकाइहरू निकाल्न सक्छ। भविष्यको अन्तरक्रियामा, एजेन्टले “Le Chat Noir” सम्झेर त्यहाँ नयाँ आरक्षण गर्दिन प्रस्ताव गर्न सक्छ।
RAG फराकिलो प्रविधि भए तापनि, “संरचित RAG” लाई शक्तिशाली मेमोरी प्रविधिको रूपमा हाइलाइट गरिएको छ। यसले विभिन्न स्रोतहरू (वार्तालापहरू, इमेलहरू, छविहरू) बाट घना, संरचित जानकारी निकाल्छ र यसलाई उत्तरहरूमा सटीकता, रिकोल, र गति बढाउन प्रयोग गर्छ। क्लासिक RAG जस्तो केवल सिमान्टिक समानतामा निर्भर नभएर, संरचित RAG सूचना को आन्तरिक संरचनासँग काम गर्छ।
संरचित RAG को उदाहरण
शब्दहरू मात्र मिलाउनुभन्दा, संरचित RAG ले इमेलबाट उडान विवरणहरू (गन्तव्य, मिति, समय, एयरलाइन) पार्स गरेर संरचित तरिकाले भण्डारण गर्न सक्छ। यसले “मैले मंगलवार कस्तो उडान पेरिसको लागि बुक गरेको थिएँ?” जस्ता सटीक प्रश्नहरूलाई सम्भव बनाउँछ।
एआई एजेन्टहरूका लागि मेमोरी लागू गर्न व्यवस्थित प्रक्रिया आवश्यक हुन्छ जुनमा समावेश हुन्छ: उत्पन्न गर्ने, भण्डारण गर्ने, पुनःप्राप्त गर्ने, एकीकृत गर्ने, अद्यावधिक गर्ने, र यहाँसम्म कि “भुल्ने” (वा मेटाउने) पनि। प्राप्ति विशेष गरी महत्वपूर्ण पक्ष हो।
एजेन्ट मेमोरी भण्डारण र व्यवस्थापन गर्ने एउटा तरिका Mem0 जस्ता विशेष उपकरण प्रयोग गर्नु हो। Mem0 एक स्थायी मेमोरी लेयरको रूपमा काम गर्दछ, जसले एजेन्टहरूलाई सान्दर्भिक अन्तरक्रियाहरू सम्झन, प्रयोगकर्ता प्राथमिकताहरू र तथ्यगत सन्दर्भहरू भण्डारण गर्न, र समयसँगै सफलताहरू र असफलताबाट सिक्न अनुमति दिन्छ। यहाँको विचार भनेको स्टेटलेस एजेन्टहरूलाई स्टेटफुल बनाउनु हो।
यो दुई-चरणीय मेमोरी पाइपलाइन मार्फत काम गर्दछ: निक्षेप र अद्यावधिक। पहिले, एजेन्टको थ्रेडमा थपिएका सन्देशहरू Mem0 सेवामा पठाइन्छन्, जसले एक Large Language Model (LLM) प्रयोग गरी संवाद इतिहास सारांस गर्छ र नयाँ सम्झनाहरू निकाल्छ। त्यसपछि, LLM-चालित अद्यावधिक चरणले ती सम्झनाहरू थप्ने, संशोधन गर्ने, वा मेटाउने निर्णय गर्छ, र तिनीहरूलाई भेक्टर, ग्राफ, र की-भ्यालु डाटाबेसहरू समावेश गर्न सक्ने हाइब्रिड डाटा स्टोरमा भण्डारण गर्छ। यो प्रणाली विभिन्न मेमोरी प्रकारहरूको समर्थन पनि गर्छ र संस्थाहरू बीचको सम्बन्ध व्यवस्थापन गर्न ग्राफ मेमोरी समावेश गर्न सक्छ।
अर्को शक्तिशाली दृष्टिकोण भनेको Cognee प्रयोग गर्नु हो, जुन खुला स्रोत सेम्यान्टिक मेमोरी हो र संरचित तथा अशंरचित डाटालाई embeddings द्वारा समर्थित क्वेरेबल ज्ञान ग्राफमा परिवर्तन गर्छ। Cognee ले भेक्टर समानता खोज र ग्राफ सम्बन्धहरू मिलाउने द्वैध-स्टोर आर्किटेक्चर प्रदान गर्छ, जसले एजेन्टहरूलाई के जानकारी समान छ मात्र होइन, कुन तरिकाले अवधारणाहरू एकअर्कासँग सम्बन्धित छन् भन्ने बुझ्न सक्षम बनाउँछ।
यो हाइब्रिड प्राप्तिमा विशेष छ जुन भेक्टर समानता, ग्राफ संरचना, र LLM तर्कलाई मिश्रण गर्छ—कच्चा चंक लुकअपदेखि ग्राफ-जागरूक प्रश्नोत्तरसम्म। प्रणालीले जीवित स्मृति कायम राख्छ जुन बिस्तारै विकसित र बढ्छ र एक जडित ग्राफको रूपमा क्वेरेबल रहन्छ, जसले छोटो-अवधि सत्र सन्दर्भ र दीर्घकालीन स्थायी स्मृत दुवैलाई समर्थन गर्छ।
Cognee नोटबुक ट्युटोरियल (13-agent-memory-cognee.ipynb) ले यस एकीकृत मेमोरी लेयर निर्माण गर्ने प्रदर्शन गर्दछ, विभिन्न डाटा स्रोतहरू इन्जेस्ट गर्ने व्यावहारिक उदाहरणहरू, ज्ञान ग्राफ भिजुअलाइजेसन, र विशिष्ट एजेन्ट आवश्यकताहरू अनुरूप फरक खोज रणनीतिहरू प्रयोग गरेर क्वेरी गर्ने तरिकाहरू समावेश गरी।
Mem0 जस्ता विशेष मेमोरी उपकरणहरू बाहेक, तपाईं मजबूत खोज सेवाहरू जस्तै Azure AI Search लाई मेमोरीहरू भण्डारण र पुनःप्राप्तिको ब्याकएन्ड रूपमा प्रयोग गर्न सक्नुहुन्छ, विशेष गरेर संरचित RAG का लागि।
यसले तपाईंको एजेन्टको प्रतिक्रियाहरूलाई तपाईंका आफ्नै डाटासँग ग्राउन्ड गर्न अनुमति दिन्छ, जसले बढी सान्दर्भिक र शुद्ध उत्तर सुनिश्चित गर्छ। Azure AI Search लाई प्रयोगकर्ताविशेष यात्रा स्मृतिहरू, उत्पादन सूचीहरू, वा कुनै पनि डोमेन-विशेष ज्ञान भण्डारण गर्न प्रयोग गर्न सकिन्छ।
Azure AI Search ले संरचित RAG जस्ता क्षमताहरू समर्थन गर्छ, जुन ठूलो डेटासेटहरू जस्तै संवाद इतिहास, इमेलहरू, वा छविहरूबाट घना, संरचित जानकारी निकाल्ने र पुनःप्राप्त गर्न उत्कृष्ट हुन्छ। यसले पारम्परिक पाठ चंकिङ र एम्बेडिङ दृष्टिकोणको तुलनामा “अधिमानव समान सटीकता र रिकोल” प्रदान गर्छ।
आत्म-सुधार गर्ने एजेन्टहरूको लागि एउटा साझा ढाँचा भनेको “ज्ञान एजेन्ट” परिचय गराउनु हो। यो अलग एजेन्टले प्रयोगकर्ता र मुख्य एजेन्टबीचको मुख्य संवादलाई अवलोकन गर्छ। यसको भूमिका:
मूल्यवान जानकारी पहिचान गर्नु: संवादको कुनै भाग सामान्य ज्ञान वा विशेष प्रयोगकर्ता प्राथमिकता रूपमा बचत गर्ने योग्य छ कि छैन निर्धारण गर्नु।
निकाल्नु र सारांश बनाउनु: संवादबाट आवश्यक सिकाइ वा प्राथमिकता संक्षेप गर्ने।
ज्ञान आधारमा भण्डारण गर्नु: यो निकालेको जानकारी प्रायः भेक्टर डाटाबेसमा कायम राख्नु ताकि पछि पुनःप्राप्त गर्न सकियोस्।
भविष्यका क्वेरीहरूलाई वृद्धि गर्नु: जब प्रयोगकर्ताले नयाँ क्वेरी सुरु गर्छन्, ज्ञान एजेन्टले सान्दर्भिक भण्डारित जानकारी पुनःप्राप्त गरेर प्रयोगकर्ताको प्राम्प्टमा थप्छ, जसले प्राथमिक एजेन्टलाई महत्वपूर्ण सन्दर्भ प्रदान गर्छ (RAG जस्तै)।
• लेटेन्सी व्यवस्थापन: प्रयोगकर्ता अन्तरक्रियालाई सुस्त नबनाउनका लागि, सुरुमा सस्तो र छिटो मोडेलले छिटो जाँच गर्न सक्छ कि जानकारी भण्डारण वा पुनःप्राप्त गर्न लायक छ कि छैन, र मात्र आवश्यक परेमा अझ जटिल निक्षेप/प्राप्ति प्रक्रिया बोलाउने।
• ज्ञान आधार मर्मतसम्भार: बृद्धि हुने ज्ञान आधारका लागि, कम प्रयोग हुने जानकारीलाई लागत व्यवस्थापन गर्न “कोल्ड स्टोरेज” मा सार्न सकिन्छ।
Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.
अस्वीकरण: यो दस्तावेज AI अनुवाद सेवा Co-op Translator (https://github.com/Azure/co-op-translator) प्रयोग गरी अनुवाद गरिएको हो। हामी शुद्धताको लागि प्रयास गर्छौं, तर कृपया जान्नुहोस् कि स्वचालित अनुवादमा त्रुटि वा अशुद्धता हुनसक्छ। मूल दस्तावेजलाई यसको मूल भाषामा आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि पेशेवर मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी उत्तरदायी हुनेछैनौं।