ai-agents-for-beginners

एआई एजेंट्स के लिए मेमोरी

जब एआई एजेंट्स बनाने के अनोखे लाभों की बात होती है, तो मुख्य रूप से दो चीजों पर चर्चा होती है: टूल्स का उपयोग करके कार्यों को पूरा करने की क्षमता और समय के साथ सुधार करने की क्षमता। मेमोरी एक ऐसा आधार है जो आत्म-सुधार करने वाले एजेंट्स को बनाने में मदद करता है, जिससे हमारे उपयोगकर्ताओं के लिए बेहतर अनुभव तैयार किए जा सकें।

इस पाठ में, हम देखेंगे कि एआई एजेंट्स के लिए मेमोरी क्या है और इसे कैसे प्रबंधित और उपयोग किया जा सकता है ताकि हमारे एप्लिकेशन को लाभ मिल सके।

परिचय

इस पाठ में शामिल होगा:

एआई एजेंट मेमोरी को समझना: मेमोरी क्या है और एजेंट्स के लिए यह क्यों आवश्यक है।

मेमोरी को लागू करना और संग्रहीत करना: आपके एआई एजेंट्स में मेमोरी क्षमताओं को जोड़ने के व्यावहारिक तरीके, जिसमें शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी पर ध्यान केंद्रित किया जाएगा।

एआई एजेंट्स को आत्म-सुधार करने योग्य बनाना: कैसे मेमोरी एजेंट्स को पिछले इंटरैक्शन से सीखने और समय के साथ सुधार करने में सक्षम बनाती है।

सीखने के लक्ष्य

इस पाठ को पूरा करने के बाद, आप जान पाएंगे:

एआई एजेंट मेमोरी के विभिन्न प्रकारों में अंतर करना, जिसमें वर्किंग, शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी शामिल हैं, साथ ही विशेष प्रकार जैसे पर्सोना और एपिसोडिक मेमोरी।

एआई एजेंट्स के लिए शॉर्ट-टर्म और लॉन्ग-टर्म मेमोरी को लागू और प्रबंधित करना, जिसमें सेमांटिक कर्नेल फ्रेमवर्क का उपयोग, मेम0 और व्हाइटबोर्ड मेमोरी जैसे टूल्स का लाभ उठाना, और Azure AI Search के साथ एकीकरण शामिल है।

आत्म-सुधार करने वाले एआई एजेंट्स के पीछे के सिद्धांतों को समझना और कैसे मजबूत मेमोरी प्रबंधन प्रणाली निरंतर सीखने और अनुकूलन में योगदान देती है।

एआई एजेंट मेमोरी को समझना

मूल रूप से, एआई एजेंट्स के लिए मेमोरी उन तंत्रों को संदर्भित करती है जो उन्हें जानकारी को बनाए रखने और पुनः प्राप्त करने की अनुमति देते हैं। यह जानकारी बातचीत के विशिष्ट विवरण, उपयोगकर्ता की प्राथमिकताएं, पिछले कार्य, या सीखे गए पैटर्न हो सकती है।

मेमोरी के बिना, एआई एप्लिकेशन अक्सर स्टेटलेस होते हैं, जिसका मतलब है कि हर इंटरैक्शन नए सिरे से शुरू होता है। इससे एक दोहरावदार और निराशाजनक उपयोगकर्ता अनुभव होता है, जहां एजेंट पिछले संदर्भ या प्राथमिकताओं को “भूल” जाता है।

मेमोरी क्यों महत्वपूर्ण है?

किसी एजेंट की बुद्धिमत्ता उसकी पिछली जानकारी को याद करने और उपयोग करने की क्षमता से गहराई से जुड़ी होती है। मेमोरी एजेंट्स को निम्नलिखित बनाने में सक्षम बनाती है:

चिंतनशील: पिछले कार्यों और परिणामों से सीखना।

इंटरएक्टिव: चल रही बातचीत में संदर्भ बनाए रखना।

प्रोएक्टिव और रिएक्टिव: ऐतिहासिक डेटा के आधार पर आवश्यकताओं का अनुमान लगाना या उपयुक्त प्रतिक्रिया देना।

स्वायत्त: संग्रहीत ज्ञान का उपयोग करके अधिक स्वतंत्र रूप से कार्य करना।

मेमोरी को लागू करने का उद्देश्य एजेंट्स को अधिक विश्वसनीय और सक्षम बनाना है।

मेमोरी के प्रकार

वर्किंग मेमोरी

इसे एक प्रकार के स्क्रैच पेपर के रूप में सोचें जिसे एजेंट एकल, चल रहे कार्य या विचार प्रक्रिया के दौरान उपयोग करता है। यह तत्काल जानकारी को रखता है जो अगले कदम की गणना के लिए आवश्यक होती है।

एआई एजेंट्स के लिए, वर्किंग मेमोरी अक्सर बातचीत से सबसे प्रासंगिक जानकारी को कैप्चर करती है, भले ही पूरी चैट हिस्ट्री लंबी या संक्षिप्त हो। यह आवश्यक तत्वों जैसे आवश्यकताओं, प्रस्तावों, निर्णयों और कार्यों को निकालने पर केंद्रित होती है।

वर्किंग मेमोरी उदाहरण

एक ट्रैवल बुकिंग एजेंट में, वर्किंग मेमोरी उपयोगकर्ता की वर्तमान अनुरोध को कैप्चर कर सकती है, जैसे “मैं पेरिस की यात्रा बुक करना चाहता हूं”। यह विशिष्ट आवश्यकता एजेंट के तत्काल संदर्भ में रखी जाती है ताकि वर्तमान इंटरैक्शन को निर्देशित किया जा सके।

शॉर्ट टर्म मेमोरी

यह प्रकार की मेमोरी एकल बातचीत या सत्र की अवधि के लिए जानकारी को बनाए रखती है। यह वर्तमान चैट का संदर्भ है, जो एजेंट को संवाद में पिछले टर्न्स का उल्लेख करने की अनुमति देता है।

शॉर्ट टर्म मेमोरी उदाहरण

यदि उपयोगकर्ता पूछता है, “पेरिस के लिए फ्लाइट की कीमत कितनी होगी?” और फिर पूछता है, “वहां रहने की व्यवस्था कैसी होगी?”, तो शॉर्ट टर्म मेमोरी सुनिश्चित करती है कि एजेंट जानता है “वहां” का मतलब “पेरिस” है उसी बातचीत के भीतर।

लॉन्ग टर्म मेमोरी

यह वह जानकारी है जो कई बातचीत या सत्रों के दौरान बनी रहती है। यह एजेंट्स को उपयोगकर्ता की प्राथमिकताओं, ऐतिहासिक इंटरैक्शन, या सामान्य ज्ञान को लंबे समय तक याद रखने की अनुमति देती है। यह व्यक्तिगतकरण के लिए महत्वपूर्ण है।

लॉन्ग टर्म मेमोरी उदाहरण

लॉन्ग टर्म मेमोरी में यह जानकारी संग्रहीत हो सकती है कि “बेन को स्कीइंग और आउटडोर गतिविधियां पसंद हैं, पहाड़ों के दृश्य के साथ कॉफी पसंद है, और पिछले चोट के कारण उन्नत स्की ढलानों से बचना चाहता है”। यह जानकारी, पिछले इंटरैक्शन से सीखी गई, भविष्य की यात्रा योजना सत्रों में सिफारिशों को अत्यधिक व्यक्तिगत बनाती है।

पर्सोना मेमोरी

यह विशेष प्रकार की मेमोरी एजेंट को एक सुसंगत “व्यक्तित्व” या “पर्सोना” विकसित करने में मदद करती है। यह एजेंट को अपने बारे में या अपने इच्छित भूमिका के बारे में विवरण याद रखने की अनुमति देती है, जिससे इंटरैक्शन अधिक तरल और केंद्रित हो जाते हैं।

लॉन्ग टर्म मेमोरी उदाहरण

यदि ट्रैवल एजेंट को “एक्सपर्ट स्की प्लानर” के रूप में डिज़ाइन किया गया है, तो पर्सोना मेमोरी इस भूमिका को सुदृढ़ कर सकती है, जिससे उसकी प्रतिक्रियाएं एक विशेषज्ञ के स्वर और ज्ञान के साथ मेल खाती हैं।

वर्कफ्लो/एपिसोडिक मेमोरी

यह मेमोरी एक जटिल कार्य के दौरान एजेंट द्वारा उठाए गए कदमों की अनुक्रमिकता को संग्रहीत करती है, जिसमें सफलताएं और असफलताएं शामिल हैं। यह “एपिसोड” या पिछले अनुभवों को याद रखने जैसा है ताकि उनसे सीखा जा सके।

एपिसोडिक मेमोरी उदाहरण

यदि एजेंट ने एक विशिष्ट फ्लाइट बुक करने का प्रयास किया लेकिन यह उपलब्धता के कारण विफल हो गया, तो एपिसोडिक मेमोरी इस विफलता को रिकॉर्ड कर सकती है, जिससे एजेंट वैकल्पिक फ्लाइट्स का प्रयास कर सके या अगले प्रयास के दौरान उपयोगकर्ता को अधिक सूचित तरीके से समस्या के बारे में बता सके।

एंटिटी मेमोरी

यह बातचीत से विशिष्ट एंटिटी (जैसे लोग, स्थान, या चीजें) और घटनाओं को निकालने और याद रखने में शामिल होती है। यह एजेंट को चर्चा किए गए प्रमुख तत्वों की संरचित समझ बनाने की अनुमति देती है।

एंटिटी मेमोरी उदाहरण

पिछली यात्रा के बारे में बातचीत से, एजेंट “पेरिस,” “एफिल टॉवर,” और “ले चैट नोयर रेस्तरां में डिनर” जैसी एंटिटी को निकाल सकता है। भविष्य की बातचीत में, एजेंट “ले चैट नोयर” को याद कर सकता है और वहां एक नई बुकिंग की पेशकश कर सकता है।

स्ट्रक्चर्ड RAG (रिट्रीवल ऑगमेंटेड जनरेशन)

हालांकि RAG एक व्यापक तकनीक है, “स्ट्रक्चर्ड RAG” को एक शक्तिशाली मेमोरी तकनीक के रूप में उजागर किया गया है। यह विभिन्न स्रोतों (बातचीत, ईमेल, छवियां) से सघन, संरचित जानकारी निकालता है और इसे प्रतिक्रियाओं में सटीकता, पुनः प्राप्ति, और गति बढ़ाने के लिए उपयोग करता है। क्लासिक RAG जो केवल सेमांटिक समानता पर निर्भर करता है, उसके विपरीत, स्ट्रक्चर्ड RAG जानकारी की अंतर्निहित संरचना के साथ काम करता है।

स्ट्रक्चर्ड RAG उदाहरण

कीवर्ड्स को केवल मिलाने के बजाय, स्ट्रक्चर्ड RAG ईमेल से फ्लाइट विवरण (गंतव्य, तारीख, समय, एयरलाइन) को पार्स कर सकता है और उन्हें संरचित तरीके से संग्रहीत कर सकता है। यह “मैंने मंगलवार को पेरिस के लिए कौन सी फ्लाइट बुक की?” जैसे सटीक प्रश्नों की अनुमति देता है।

मेमोरी को लागू करना और संग्रहीत करना

एआई एजेंट्स के लिए मेमोरी को लागू करना मेमोरी प्रबंधन की एक व्यवस्थित प्रक्रिया शामिल करता है, जिसमें जानकारी को उत्पन्न करना, संग्रहीत करना, पुनः प्राप्त करना, एकीकृत करना, अपडेट करना, और यहां तक कि “भूलना” (या हटाना) शामिल है। पुनः प्राप्ति विशेष रूप से महत्वपूर्ण पहलू है।

विशेष मेमोरी टूल्स

एजेंट मेमोरी को संग्रहीत और प्रबंधित करने का एक तरीका विशेष टूल्स जैसे Mem0 का उपयोग करना है। Mem0 एक स्थायी मेमोरी लेयर के रूप में काम करता है, जिससे एजेंट्स को प्रासंगिक इंटरैक्शन को याद रखने, उपयोगकर्ता प्राथमिकताओं और तथ्यात्मक संदर्भ को संग्रहीत करने, और समय के साथ सफलताओं और विफलताओं से सीखने की अनुमति मिलती है। विचार यह है कि स्टेटलेस एजेंट्स को स्टेटफुल बनाया जाए।

यह दो-चरणीय मेमोरी पाइपलाइन: एक्सट्रैक्शन और अपडेट के माध्यम से काम करता है। पहले, एजेंट के थ्रेड में जोड़े गए संदेशों को Mem0 सेवा में भेजा जाता है, जो एक बड़े भाषा मॉडल (LLM) का उपयोग करके बातचीत के इतिहास को सारांशित करता है और नई मेमोरी को निकालता है। इसके बाद, LLM-चालित अपडेट चरण यह निर्धारित करता है कि इन मेमोरी को जोड़ना, संशोधित करना, या हटाना है, और उन्हें एक हाइब्रिड डेटा स्टोर में संग्रहीत करता है जिसमें वेक्टर, ग्राफ, और की-वैल्यू डेटाबेस शामिल हो सकते हैं। यह प्रणाली विभिन्न प्रकार की मेमोरी का समर्थन करती है और एंटिटी के बीच संबंधों को प्रबंधित करने के लिए ग्राफ मेमोरी को शामिल कर सकती है।

RAG के साथ मेमोरी संग्रहीत करना

विशेष मेमोरी टूल्स जैसे Mem0 के अलावा, आप Azure AI Search जैसे मजबूत सर्च सेवाओं का उपयोग मेमोरी को संग्रहीत और पुनः प्राप्त करने के लिए कर सकते हैं, विशेष रूप से स्ट्रक्चर्ड RAG के लिए।

यह आपके एजेंट की प्रतिक्रियाओं को आपके अपने डेटा के साथ जोड़ने की अनुमति देता है, जिससे अधिक प्रासंगिक और सटीक उत्तर सुनिश्चित होते हैं। Azure AI Search का उपयोग उपयोगकर्ता-विशिष्ट यात्रा मेमोरी, उत्पाद कैटलॉग, या किसी अन्य डोमेन-विशिष्ट ज्ञान को संग्रहीत करने के लिए किया जा सकता है।

Azure AI Search स्ट्रक्चर्ड RAG जैसी क्षमताओं का समर्थन करता है, जो बातचीत के इतिहास, ईमेल, या यहां तक कि छवियों जैसे बड़े डेटा सेट से सघन, संरचित जानकारी निकालने और पुनः प्राप्त करने में उत्कृष्ट है। यह पारंपरिक टेक्स्ट चंकिंग और एम्बेडिंग दृष्टिकोणों की तुलना में “सुपरह्यूमन सटीकता और पुनः प्राप्ति” प्रदान करता है।

एआई एजेंट्स को आत्म-सुधार बनाना

आत्म-सुधार करने वाले एजेंट्स के लिए एक सामान्य पैटर्न में “ज्ञान एजेंट” को शामिल करना होता है। यह अलग एजेंट उपयोगकर्ता और प्राथमिक एजेंट के बीच मुख्य बातचीत का अवलोकन करता है। इसका कार्य है:

  1. मूल्यवान जानकारी की पहचान करना: यह निर्धारित करना कि बातचीत का कोई हिस्सा सामान्य ज्ञान या विशिष्ट उपयोगकर्ता प्राथमिकता के रूप में संग्रहीत करने योग्य है।

  2. निकालना और सारांशित करना: बातचीत से आवश्यक सीख या प्राथमिकता को संक्षेप में प्रस्तुत करना।

  3. ज्ञान आधार में संग्रहीत करना: इस निकाली गई जानकारी को संरक्षित करना, अक्सर एक वेक्टर डेटाबेस में, ताकि इसे बाद में पुनः प्राप्त किया जा सके।

  4. भविष्य की क्वेरी को बढ़ाना: जब उपयोगकर्ता एक नई क्वेरी शुरू करता है, तो ज्ञान एजेंट प्रासंगिक संग्रहीत जानकारी को पुनः प्राप्त करता है और इसे उपयोगकर्ता के प्रॉम्प्ट में जोड़ता है, प्राथमिक एजेंट को महत्वपूर्ण संदर्भ प्रदान करता है (RAG के समान)।

मेमोरी के लिए अनुकूलन

लेटेंसी प्रबंधन: उपयोगकर्ता इंटरैक्शन को धीमा करने से बचाने के लिए, एक सस्ता, तेज़ मॉडल का उपयोग प्रारंभिक रूप से यह जांचने के लिए किया जा सकता है कि जानकारी संग्रहीत या पुनः प्राप्त करने योग्य है या नहीं, केवल आवश्यक होने पर अधिक जटिल एक्सट्रैक्शन/रिट्रीवल प्रक्रिया को लागू करना।

ज्ञान आधार रखरखाव: बढ़ते ज्ञान आधार के लिए, कम बार उपयोग की जाने वाली जानकारी को “कोल्ड स्टोरेज” में स्थानांतरित किया जा सकता है ताकि लागत का प्रबंधन किया जा सके।

संदर्भ इंजीनियरिंग के बारे में और प्रश्न हैं?

Azure AI Foundry Discord से जुड़ें, अन्य शिक्षार्थियों से मिलें, ऑफिस आवर्स में भाग लें, और अपने एआई एजेंट्स से संबंधित प्रश्नों के उत्तर प्राप्त करें।


अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता सुनिश्चित करने का प्रयास करते हैं, कृपया ध्यान दें कि स्वचालित अनुवाद में त्रुटियां या अशुद्धियां हो सकती हैं। मूल भाषा में उपलब्ध मूल दस्तावेज़ को प्रामाणिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सिफारिश की जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम जिम्मेदार नहीं हैं।