ai-agents-for-beginners

AI एजेन्टहरूको स्मृति

एजेन्ट स्मृति

एआई एजेन्टहरू सिर्जना गर्दा विशेष फाइदाहरू मध्ये दुई कुरा प्रायः छलफल गरिन्छ: कार्यहरू पूरा गर्न टुलहरू कल गर्ने क्षमता र समयसँग सुधार गर्ने क्षमता। स्मृति_self-improving_ एजेन्ट सिर्जना गर्ने आधार हो जसले हाम्रा प्रयोगकर्ताहरूका लागि राम्रो अनुभवहरू सिर्जना गर्न सक्छ।

यस पाठमा, हामी हेर्नेछौं कि एआई एजेन्टहरूको लागि स्मृति के हो र हामीले यसलाई कसरी व्यवस्थापन गरी हाम्रा अनुप्रयोगहरूको लाभका लागि प्रयोग गर्न सक्छौं।

परिचय

यस पाठले समावेश गर्नेछ:

AI एजेन्ट स्मृति बुझ्ने: स्मृति के हो र एजेन्टहरूको लागि किन आवश्यक छ।

स्मृति कार्यान्वयन र भण्डारण: छोटो-कालीन र दीर्घकालीन स्मृतिमा केन्द्रित गरी तपाइँका एआई एजेन्टहरूमा स्मृति क्षमता थप्ने व्यावहारिक तरिकाहरू।

एआई एजेन्टहरूलाई आत्म-सुधार बनाउने: कसरी स्मृतिले एजेन्टहरूलाई अघिल्ला अन्तरक्रियाहरूबाट सिक्न र समयसँग सुधार गर्न सक्षम बनाउँछ।

उपलब्ध कार्यान्वयनहरू

यस पाठमा दुईवटा व्यापक नोटबुक ट्युटोरियलहरू समावेश छन्:

13-agent-memory.ipynb: Mem0 र Azure AI Search सँग Microsoft Agent Framework प्रयोग गरी स्मृति कार्यान्वयन गर्छ

13-agent-memory-cognee.ipynb: Cognee प्रयोग गरी संरचित स्मृति कार्यान्वयन गर्छ, embeddings द्वारा समर्थित ज्ञान ग्राफ स्वचालित रूपमा निर्माण गर्छ, ग्राफलाई दृश्यगत पार्छ, र बौद्धिक पुन:प्राप्ति प्रदान गर्छ

सिकाइका लक्ष्यहरू

यस पाठ पूरा गरेपछि, तपाइँ जान्ने हुनुभयो:

विभिन्न प्रकारका एआई एजेन्ट स्मृतिहरू बीच फरक छुट्याउन, जस्तै कार्य स्मृति, छोटो-कालीन र दीर्घकालीन स्मृति, साथै persona र episodic जस्ता विशेष प्रकारहरू।

एआई एजेन्टहरूका लागि छोटो-कालीन र दीर्घकालीन स्मृति लागू र व्यवस्थापन गर्ने Microsoft Agent Framework प्रयोग गरी, Mem0, Cognee, Whiteboard memory जस्ता टुलहरू उपयोग गरेर, र Azure AI Search सँग एकीकरण गरेर।

आत्म-सुधार गर्ने एआई एजेन्टहरूको मूल सिद्धान्तहरू बुझ्ने र कसरी बलियो स्मृति व्यवस्थापन प्रणालीहरूले निरन्तर सिकाइ र अनुकूलनमा योगदान पुर्‍याउँछन्।

AI एजेन्ट स्मृति बुझ्नु

मूलतः, एआई एजेन्टहरूको लागि स्मृति भन्नाले तिनीहरूलाई जानकारी राख्न र सम्झन सक्षम बनाउने संयन्त्रहरूलाई जनाउँछ। यो जानकारी वार्तालापका विशिष्ट विवरणहरू, प्रयोगकर्ताको प्राथमिकताहरू, अघिल्ला कार्यहरू, वा सिकिएका ढाँचाहरू हुन सक्छ।

स्मृति बिना, एआई अनुप्रयोगहरू प्रायः राज्यरहित हुन्छन्, जसको अर्थ प्रत्येक अन्तरक्रिया नयाँबाट सुरु हुन्छ। यसले प्रयोगकर्ताका लागि एक दोहोरिने र झर्को अनुभव ल्याउँछ जहाँ एजेन्टले अघिल्लो सन्दर्भ वा प्राथमिकताहरू “विर्सन्छ”।

स्मृति किन महत्वपूर्ण छ?

एउटा एजेन्टको बुद्धिमत्ता गहिरोसँग तेस्रो पक्षमा आधारित हुन्छ कि उसले अघिल्लो जानकारी सम्झन र प्रयोग गर्न कत्ति सक्षम छ। स्मृतिले एजेन्टहरूलाई सक्षम बनाउँछ:

प्रतिबिम्बशील: अघिल्ला कार्यहरू र परिणामहरूबाट सिक्ने।

अन्तरक्रियात्मक: चलिरहेको वार्तालापमा सन्दर्भ कायम राख्ने।

पूर्वानुमान र प्रतिक्रिया दिने: ऐतिहासिक डाटाको आधारमा आवश्यकताहरू अनुमान गर्ने वा उपयुक्त रूपमा प्रतिक्रिया दिने।

स्वायत्त: संग्रहीत ज्ञानको आधारमा अधिक स्वतन्त्र रूपमा सञ्चालन गर्ने।

स्मृति लागू गर्ने लक्ष्य एजेन्टहरूलाई अधिक विश्वसनीय र सक्षम बनाउनु हो।

स्मृतिका प्रकारहरू

कार्य स्मृति

यसलाई एक पाना कागजको टुक्रा सम्झनुहोस् जुन एजेन्टले एकल, चलिरहेको कार्य वा चिन्तन प्रक्रियाको क्रममा प्रयोग गर्छ। यसले अर्को कदम गणना गर्न आवश्यक तत्काल जानकारी राख्छ।

एआई एजेन्टहरूको लागि, कार्य स्मृतिले प्रायः वार्तालापबाट सबैभन्दा सान्दर्भिक जानकारी समात्छ, भले नै पूरै चैट इतिहास लामो वा truncation गरिएको छ। यसले आवश्यकताहरू, प्रस्तावहरू, निर्णयहरू, र कार्यहरू जस्ता प्रमुख तत्वहरू निकाल्नमा केन्द्रित हुन्छ।

कार्य स्मृति उदाहरण

एक यात्रा बुकिङ एजेन्टमा, कार्य स्मृतिले प्रयोगकर्ताको हालको अनुरोध समात्न सक्छ, जस्तै “म पेरिसको यात्रा बुक गर्न चाहन्छु”। यो विशिष्ट आवश्यकताले हालको अन्तरक्रियालाई मार्गदर्शन गर्न एजेन्टको तत्काल सन्दर्भमा राखिन्छ।

छोटो-कालीन स्मृति

यस प्रकारको स्मृतिले एकल वार्तालाप वा सत्रको अवधिका लागि जानकारी राख्छ। यो हालको च्याटको सन्दर्भ हो, जसले एजेन्टलाई संवादका अघिल्ला पालाहरूमा फर्कने अनुमति दिन्छ।

छोटो-कालीन स्मृति उदाहरण

यदि प्रयोगकर्ताले सोध्छन्, “पेरिस जानको लागि उडान कति पर्छ?” र त्यसपछि follow-up गर्छन् “त्यहाँ बसोबासको बारेमा के?” भने, छोटो-कालीन स्मृतिले सुनिश्चित गर्छ कि एजेन्टलाई थाहा छ “त्यहाँ” ले सोही वार्तालाप भित्र “पेरिस” लाई जनाउँछ।

दीर्घकालीन स्मृति

यो त्यस्तो जानकारी हो जुन एकभन्दा बढी वार्तालाप वा सत्रहरूमा कायम रहन्छ। यसले एजेन्टहरूलाई प्रयोगकर्ताका प्राथमिकताहरू, ऐतिहासिक अन्तरक्रियाहरू, वा विस्तारित अवधिमा सामान्य ज्ञान सम्झन अनुमति दिन्छ। यो वैयक्तिकरणका लागि महत्वपूर्ण छ।

दीर्घकालीन स्मृति उदाहरण

दीर्घकालीन स्मृतिले भण्डारण गर्न सक्छ कि “Ben स्कीिङ र बाहिरी गतिविधिहरू मन पराउँछन्, पर्वत दृश्यमा कफी मन पर्छ, र विगतको चोटको कारण उन्नत स्की ढलानहरूबाट जोगिन चाहन्छन्”। अघिल्लो अन्तरक्रियाबाट सिकिएको यो जानकारी भविष्यका यात्रा योजनाका सिफारिसहरूमा प्रभाव पार्छ, जसले ती सिफारिसहरूलाई उच्च व्यक्तिगत बनाउँछ।

पर्सोना स्मृति

यो विशेष स्मृति प्रकारले एजेन्टलाई एक सुसंगत “व्यक्तित्व” वा “पर्सोना” विकास गर्न मद्दत गर्छ। यसले एजेन्टलाई आफूबारे वा यसको इच्छित भूमिकाबारे विवरणहरू सम्झन अनुमति दिन्छ, जसले अन्तरक्रियाहरूलाई बढी सहज र केन्द्रित बनाउँछ।

पर्सोना स्मृति उदाहरण यदि यात्रा एजेन्टलाई “विशेषज्ञ स्की प्लानर” को रूपमा डिजाइन गरिएको छ भने, पर्सोना स्मृतिले यो भूमिकालाई बलियो बनाउन सक्छ, जसले यसको प्रतिक्रियाहरूलाई विशेषज्ञको स्वर र ज्ञान अनुरूप बनाउँछ।

कार्यप्रवाह/एपिसोडिक स्मृति

यस स्मृतिले जटिल कार्य 수행 गर्दा एजेन्टले लिने चरणहरूको क्रम, सफलताहरू र असफलताहरू समावेश गरेर भण्डारण गर्छ। यो विशेष “एपिसोड” वा अघिल्ला अनुभवहरू सम्झन जस्तै हुन्छ ताकि तिनीहरूबाट सिक्न सकियोस्।

एपिसोडिक स्मृति उदाहरण

यदि एजेन्टले कुनै विशेष उडान बुक गर्ने कोशिस गर्‍यो तर उपलब्धताका कारण विफल भयो भने, एपिसोडिक स्मृतिले यो असफलता रेकर्ड गर्न सक्छ, जसले अर्को प्रयासमा वैकल्पिक उडानहरू प्रयास गर्न वा प्रयोगकर्तालाई बढी सूचित तरिकाले समस्या बारे जानकारी दिन मद्दत गर्दछ।

ईन्टिटी स्मृति

यसले वार्तालापबाट विशिष्ट ईन्टिटीहरू (जस्तै मानिस, स्थान, वा वस्तु) र घटनाहरू निकाल्ने र सम्झने समावेश गर्छ। यसले एजेन्टलाई छलफल गरिएका प्रमुख तत्वहरूको संरचित समझ निर्माण गर्न अनुमति दिन्छ।

ईन्टिटी स्मृति उदाहरण

गत यात्राको बारेमा वार्तालापबाट, एजेन्टले “Paris,” “Eiffel Tower,” र “dinner at Le Chat Noir restaurant” जस्ता ईन्टिटीहरू निकाल्न सक्छ। भविष्यको अन्तरक्रियामा, एजेन्टले “Le Chat Noir” सम्झन सक्छ र त्यहाँ नयाँ आरक्षण गर्न प्रस्ताव गर्न सक्छ।

संरचित RAG (Retrieval Augmented Generation)

RAG एउटा व्यापक प्रविधि हो, तर “संरचित RAG” लाई एक शक्तिशाली स्मृति प्रविधिको रूपमा हाइलाइट गरिएको छ। यसले विभिन्न स्रोतहरू (वार्तालापहरू, इमेलहरू, छविहरू) बाट घना, संरचित जानकारी निकाल्छ र जवाफहरूमा सटीकता, पुन:प्राप्ति, र गति बढाउन प्रयोग गर्दछ। क्लासिक RAG जुन केवल semantic similarity मा निर्भर गर्दछ भन्दा फरक, संरचित RAG सुसूत्रित जानकारीको संरचनासँग काम गर्छ।

संरचित RAG उदाहरण

सिर्फ किवर्ड मिलाउने सट्टा, संरचित RAG ले इमेलबाट उडान विवरणहरू (गन्तव्य, मिति, समय, एयरलाइन) पार्स गरेर संरचित तरिकाले भण्डारण गर्न सक्छ। यसले “मले मंगलवारमा पेरिसका लागि कुन उडान बुक गरेको थिएँ?” जस्ता स्पष्ट प्रश्नहरूको जवाफ सजिलै दिन सक्षम बनाउँछ।

स्मृति कार्यान्वयन र भण्डारण

एआई एजेन्टहरूको लागि स्मृति कार्यान्वयन गर्दा त्यहाँ एउटा व्यवस्थित प्रक्रिया हुन्छ जसलाई स्मृति व्यवस्थापन भनिन्छ, जसमा उत्पादन, भण्डारण, पुन:प्राप्ति, एकीकरण, अपडेट, र यहाँसम्म कि “भुल्ने” (वा मेटाउने) समावेश छ। पुन:प्राप्ति विशेष गरी महत्वपूर्ण पक्ष हो।

विशेषज्ञ स्मृति टुलहरू

Mem0

एजेन्ट स्मृति भण्डारण र व्यवस्थापन गर्ने एक तरिका Mem0 जस्ता विशेषज्ञ टुलहरू प्रयोग गर्नु हो। Mem0 एक स्थायी स्मृति तहको रूपमा काम गर्छ, जसले एजेन्टहरूलाई सम्बन्धित अन्तरक्रियाहरू सम्झन, प्रयोगकर्ताका प्राथमिकताहरू र तथ्यगत सन्दर्भहरू भण्डारण गर्न, र समयसँग सफलताहरू र असफलताबाट सिक्न अनुमति दिन्छ। विचार यो हो कि राज्यरहित एजेन्टहरू राज्यवानमा परिणत हुन्छन्।

यसले काम गर्छ एक दुई-चरण स्मृति पाइपलाइन: निकाल्ने र अद्यावधिक गर्ने मार्फत। पहिले, एजेन्टको थ्रेडमा थपिएका सन्देशहरू Mem0 सेवामा पठाइन्छ, जसले ठूलो भाषा मोडेल (LLM) प्रयोग गरी वार्तालाप इतिहास सारांश गर्द्छ र नयाँ स्मृतिहरू निकाल्दछ। त्यसपछि, LLM-चालित अद्यावधिक चरणले निर्धारण गर्छ कि यी स्मृतिहरू थप्ने, संशोधित गर्ने, वा मेटाउने कि छैन, र तिनीहरूलाई भेक्टर, ग्राफ, र की-भ्याल्यू डाटाबेसहरू समावेश गर्न सक्ने हाइब्रिड डाटा स्टोरमा भण्डारण गर्छ। यो प्रणालीले विभिन्न स्मृति प्रकारहरूलाई समर्थन गर्दछ र ईन्टिटीहरू बीच सम्बन्धहरू व्यवस्थापन गर्न ग्राफ स्मृति समावेश गर्न सक्छ।

Cognee

अर्को शक्तिशाली दृष्टिकोण हो Cognee प्रयोग गर्नु, जुन एआई एजेन्टहरूको लागि खुला-स्रोत सेम्यान्टिक स्मृति हो र यसले संरचित र असंरचित डाटालाई embeddings द्वारा समर्थित प्रश्नोत्तरयोग्य ज्ञान ग्राफहरूमा रूपान्तरण गर्छ। Cognee ले डुअल-स्टोर आर्किटेक्चर प्रदान गर्छ जसले भेक्टर समानता खोजसँग ग्राफ सम्बन्धहरू संयोजन गर्दछ, जसले एजेन्टहरूलाई केवल के जानकारी समान छ भनेर मात्र बुझ्न होइन, तर अवधारणाहरू कसरी सम्बन्धित छन् भन्ने पनि बुझ्न सक्षम बनाउँछ।

यो हाइब्रिड पुन:प्राप्तिमा उत्कृष्ट छ जुन भेक्टर समानता, ग्राफ संरचना, र LLM तर्कलाई मिसाउँछ - कच्चा chunk lookup देखि ग्राफ-सचेत प्रश्नोत्तरसम्म। प्रणालीले जीवित स्मृति कायम राख्छ जुन विकास र वृद्धि हुन्छ र एउटै जडित ग्राफको रूपमा प्रश्नयोग्य रहन्छ, दुवै छोटो-कालीन सत्र सन्दर्भ र दीर्घकालीन स्थायी स्मृतिलाई समर्थन गर्दछ।

Cognee नोटबुक ट्युटोरियल (13-agent-memory-cognee.ipynb) ले यस एकीकृत स्मृति तह निर्माण गर्ने प्रदर्शन गर्दछ, विविध डाटा स्रोतहरू इन्जेस्ट गर्ने व्यावहारिक उदाहरणहरू, ज्ञान ग्राफ दृश्यात्मक बनाउने, र विशिष्ट एजेन्ट आवश्यकताहरूमा अनुकूलित विभिन्न खोज रणनीतिहरू प्रयोग गरेर प्रश्न सोध्ने उदाहरणहरू समाहित गर्दछ।

RAG सँग स्मृति भण्डारण

Mem0 जस्ता विशेषज्ञ स्मृति टुलहरूको अतिरिक्त, तपाइँ बलियो खोज सेवाहरू जस्तै Azure AI Search लाई स्मृतिहरू भण्डारण र पुन:प्राप्ति गर्ने ब्याकएन्डको रूपमा प्रयोग गर्न सक्नुहुन्छ, विशेष गरी संरचित RAG का लागि।

यसले तपाइँको एजेन्टका उत्तरहरूलाई तपाइँका आफ्नै डाटाले आधारभूत बनाउन अनुमति दिन्छ, जसले बढी सान्दर्भिक र सही जवाफ सुनिश्चित गर्छ। Azure AI Search लाई प्रयोग गरेर प्रयोगकर्ता-विशिष्ट यात्रा स्मृति, उत्पादन सूची, वा कुनै पनि डोमेन-विशिष्ट ज्ञान भण्डारण गर्न सकिन्छ।

Azure AI Search ले संरचित RAG जस्ता क्षमताहरू समर्थन गर्छ, जुन वार्तालाप इतिहास, इमेलहरू, वा छविहरू जस्ता ठूला डाटासेटहरूबाट घना, संरचित जानकारी निकाल्न र पुन:प्राप्त गर्न उत्कृष्ट छ। यसले पारम्परिक टेक्स्ट chunking र embedding दृष्टिकोणहरूको तुलनामा “मानव भन्दा बढी सटीकता र पुन:प्राप्ति” प्रदान गर्न सक्छ।

एआई एजेन्टहरूलाई आत्म-सुधार गराउने

आत्म-सुधार गर्ने एजेन्टहरूको लागि सामान्य ढाँचा एउटा “ज्ञान एजेन्ट” प्रस्तुत गर्नु हो। यो पृथक एजेन्ट मूल प्रयोगकर्ता र प्रमुख एजेन्ट बीचको मुख्य वार्तालापलाई अवलोकन गर्छ। यसको भूमिका हुन सक्छ:

  1. मूल्यवान जानकारी पहिचान गर्नु: वार्तालापको कुनै भाग सामान्य ज्ञान वा विशिष्ट प्रयोगकर्ता प्राथमिकता रूपमा बचत गर्नयोग्य छ कि छैन निर्धारण गर्नु।

  2. निकाल्ने र संक्षेप गर्ने: वार्तालापबाट आवश्यक सिकाइ वा प्राथमिकता संक्षेपमा डिस्टिल गर्नु।

  3. ज्ञान आधारमा भण्डारण गर्नु: यो निकालेको जानकारी प्रायः भेक्टर डाटाबेसमा स्थायी रूपमा भण्डारण गर्नु ताकि पछि पुन:प्राप्त गर्न सकियोस्।

  4. भविष्यका क्वेरीहरूलाई वृद्धि गर्नु: जब प्रयोगकर्ताले नयाँ क्वेरी सुरु गर्छ, ज्ञान एजेन्टले सम्बन्धित भण्डारित जानकारी पुन:प्राप्त गरी प्रयोगकर्ताको प्रम्प्टमा थप्छ, प्रमुख एजेन्टलाई महत्वपूर्ण सन्दर्भ प्रदान गर्दै (RAG जस्तै)।

स्मृतिका लागि अनुकूलनहरू

लेटेन्सी व्यवस्थापन: प्रयोगकर्ता अन्तरक्रियाहरू ढिलो नहोस् भनी, सुरुमा सस्तो र छिटो मोडल प्रयोग गरी छिटो जाँच गर्न सकिन्छ कि जानकारी भण्डारण गर्न वा पुन:प्राप्त गर्न योग्य छ कि छैन, र मात्र आवश्यक हुँदा बढी जटिल निकासा/प्राप्ति प्रक्रियामा जाने।

ज्ञान आधार मर्मत: बढ्दो ज्ञान आधारको लागि, कम बार प्रयोग हुने जानकारीलाई लागत व्यवस्थापन गर्न “कूल स्टोरेज” मा सार्न सकिन्छ।

एजेन्ट स्मृति सम्बन्धी थप प्रश्नहरू छन्?

Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.


अस्वीकरण: यो दस्तावेज एआई अनुवाद सेवा Co-op Translator (https://github.com/Azure/co-op-translator) प्रयोग गरेर अनुवाद गरिएको हो। हामी शुद्धताका लागि प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादमा त्रुटि वा अशुद्धता हुनसक्छ। मूल भाषामा रहेको यो दस्तावेजलाई आधिकारिक स्रोत मानिनु पर्छ। महत्वपूर्ण जानकारीको लागि व्यावसायिक मानव अनुवाद सिफारिश गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार छैनौं।