ai-agents-for-beginners

AI এজেন্টদের জন্য মেমরি

Agent Memory

AI এজেন্ট তৈরি করার বিশেষ সুবিধাগুলি নিয়ে আলোচনা করার সময় দুটি বিষয় প্রধানত আলোচিত হয়: টাস্ক সম্পন্ন করার জন্য টুল ব্যবহার করার ক্ষমতা এবং সময়ের সাথে উন্নতি করার ক্ষমতা। মেমরি হলো এমন একটি ভিত্তি যা স্ব-উন্নয়নশীল এজেন্ট তৈরি করতে সাহায্য করে, যা আমাদের ব্যবহারকারীদের জন্য আরও ভালো অভিজ্ঞতা তৈরি করতে পারে।

এই পাঠে, আমরা AI এজেন্টদের জন্য মেমরি কী এবং কীভাবে এটি পরিচালনা ও আমাদের অ্যাপ্লিকেশনের জন্য ব্যবহার করা যায় তা দেখব।

পরিচিতি

এই পাঠে আলোচনা করা হবে:

AI এজেন্ট মেমরি বোঝা: মেমরি কী এবং এজেন্টদের জন্য এটি কেন গুরুত্বপূর্ণ।

মেমরি প্রয়োগ ও সংরক্ষণ: AI এজেন্টদের জন্য মেমরি যোগ করার বাস্তব পদ্ধতি, যেখানে স্বল্পমেয়াদি ও দীর্ঘমেয়াদি মেমরির উপর জোর দেওয়া হবে।

AI এজেন্টদের স্ব-উন্নয়নশীল করা: কীভাবে মেমরি এজেন্টদের অতীত ইন্টারঅ্যাকশন থেকে শিখতে এবং সময়ের সাথে উন্নতি করতে সাহায্য করে।

শেখার লক্ষ্য

এই পাঠ শেষ করার পর, আপনি জানতে পারবেন:

AI এজেন্ট মেমরির বিভিন্ন প্রকারের মধ্যে পার্থক্য করতে, যেমন কাজের মেমরি, স্বল্পমেয়াদি ও দীর্ঘমেয়াদি মেমরি, এবং বিশেষায়িত মেমরি যেমন পারসোনা ও এপিসোডিক মেমরি।

AI এজেন্টদের জন্য স্বল্পমেয়াদি ও দীর্ঘমেয়াদি মেমরি প্রয়োগ ও পরিচালনা করতে Semantic Kernel ফ্রেমওয়ার্ক ব্যবহার করে, Mem0 এবং Whiteboard মেমরি টুলের সাহায্যে, এবং Azure AI Search এর সাথে ইন্টিগ্রেশন করে।

স্ব-উন্নয়নশীল AI এজেন্টদের পেছনের নীতিগুলি বুঝতে এবং কীভাবে শক্তিশালী মেমরি ব্যবস্থাপনা সিস্টেম ক্রমাগত শেখা ও অভিযোজনকে সহায়তা করে।

AI এজেন্ট মেমরি বোঝা

মূলত, AI এজেন্টদের জন্য মেমরি হলো এমন প্রক্রিয়া যা তাদের তথ্য সংরক্ষণ ও পুনরায় মনে করার ক্ষমতা প্রদান করে। এই তথ্য হতে পারে কথোপকথনের নির্দিষ্ট বিবরণ, ব্যবহারকারীর পছন্দ, অতীত কার্যক্রম, বা শেখা প্যাটার্ন।

মেমরি ছাড়া, AI অ্যাপ্লিকেশনগুলো সাধারণত স্টেটলেস হয়, অর্থাৎ প্রতিটি ইন্টারঅ্যাকশন নতুন করে শুরু হয়। এর ফলে একটি পুনরাবৃত্তিমূলক এবং হতাশাজনক ব্যবহারকারীর অভিজ্ঞতা তৈরি হয় যেখানে এজেন্ট পূর্বের প্রসঙ্গ বা পছন্দ “ভুলে যায়”।

মেমরি কেন গুরুত্বপূর্ণ?

একটি এজেন্টের বুদ্ধিমত্তা তার অতীত তথ্য মনে রাখা এবং ব্যবহার করার ক্ষমতার সাথে গভীরভাবে সম্পর্কিত। মেমরি এজেন্টদেরকে নিম্নলিখিতভাবে সাহায্য করে:

প্রতিফলিত: অতীত কার্যক্রম ও ফলাফল থেকে শেখা।

ইন্টারঅ্যাকটিভ: চলমান কথোপকথনের প্রসঙ্গ ধরে রাখা।

প্রোঅ্যাকটিভ ও রিঅ্যাকটিভ: পূর্বের তথ্যের ভিত্তিতে প্রয়োজন অনুমান করা বা সঠিকভাবে প্রতিক্রিয়া জানানো।

স্বায়ত্তশাসিত: সংরক্ষিত জ্ঞান ব্যবহার করে আরও স্বাধীনভাবে কাজ করা।

মেমরি প্রয়োগের লক্ষ্য হলো এজেন্টদের আরও বিশ্বস্ত ও সক্ষম করে তোলা।

মেমরির প্রকারভেদ

কাজের মেমরি

এটি একটি স্ক্র্যাচ পেপারের মতো যা এজেন্ট একটি চলমান টাস্ক বা চিন্তাপ্রক্রিয়ার সময় ব্যবহার করে। এটি তাৎক্ষণিক তথ্য ধরে রাখে যা পরবর্তী ধাপ সম্পন্ন করতে প্রয়োজন।

AI এজেন্টদের জন্য, কাজের মেমরি সাধারণত কথোপকথনের সবচেয়ে প্রাসঙ্গিক তথ্য ধরে রাখে, এমনকি পুরো চ্যাট ইতিহাস দীর্ঘ বা সংক্ষিপ্ত হলেও। এটি মূল উপাদান যেমন প্রয়োজনীয়তা, প্রস্তাবনা, সিদ্ধান্ত, এবং কার্যক্রম বের করার উপর জোর দেয়।

কাজের মেমরির উদাহরণ

একটি ট্রাভেল বুকিং এজেন্টে, কাজের মেমরি ব্যবহারকারীর বর্তমান অনুরোধ ধরে রাখতে পারে, যেমন “আমি প্যারিসে একটি ট্রিপ বুক করতে চাই”। এই নির্দিষ্ট প্রয়োজনটি এজেন্টের তাৎক্ষণিক প্রসঙ্গে ধরে রাখা হয় বর্তমান ইন্টারঅ্যাকশন পরিচালনার জন্য।

স্বল্পমেয়াদি মেমরি

এই ধরনের মেমরি একটি কথোপকথন বা সেশনের সময় তথ্য ধরে রাখে। এটি বর্তমান চ্যাটের প্রসঙ্গ, যা এজেন্টকে সংলাপের পূর্ববর্তী অংশগুলোর দিকে ফিরে যেতে সাহায্য করে।

স্বল্পমেয়াদি মেমরির উদাহরণ

যদি ব্যবহারকারী জিজ্ঞাসা করে, “প্যারিসে একটি ফ্লাইটের খরচ কত হবে?” এবং তারপর অনুসরণ করে “সেখানে থাকার ব্যবস্থা কেমন?”, স্বল্পমেয়াদি মেমরি নিশ্চিত করে যে এজেন্ট জানে “সেখানে” মানে “প্যারিস” একই কথোপকথনের মধ্যে।

দীর্ঘমেয়াদি মেমরি

এটি এমন তথ্য যা একাধিক কথোপকথন বা সেশনের মধ্যে টিকে থাকে। এটি এজেন্টকে ব্যবহারকারীর পছন্দ, ঐতিহাসিক ইন্টারঅ্যাকশন, বা সাধারণ জ্ঞান দীর্ঘ সময় ধরে মনে রাখতে সাহায্য করে। এটি ব্যক্তিগতকরণের জন্য গুরুত্বপূর্ণ।

দীর্ঘমেয়াদি মেমরির উদাহরণ

দীর্ঘমেয়াদি মেমরি সংরক্ষণ করতে পারে যে “বেন স্কিইং এবং আউটডোর কার্যক্রম উপভোগ করেন, পাহাড়ের দৃশ্য সহ কফি পছন্দ করেন, এবং অতীত আঘাতের কারণে উন্নত স্কি ঢাল এড়িয়ে চলতে চান”। এই তথ্য, পূর্ববর্তী ইন্টারঅ্যাকশন থেকে শেখা, ভবিষ্যতের ট্রাভেল প্ল্যানিং সেশনে সুপারিশগুলোকে অত্যন্ত ব্যক্তিগতকৃত করে তোলে।

পারসোনা মেমরি

এই বিশেষায়িত মেমরি এজেন্টকে একটি ধারাবাহিক “ব্যক্তিত্ব” বা “পারসোনা” তৈরি করতে সাহায্য করে। এটি এজেন্টকে নিজের সম্পর্কে বা তার নির্ধারিত ভূমিকা সম্পর্কে তথ্য মনে রাখতে সাহায্য করে, যা ইন্টারঅ্যাকশনগুলোকে আরও তরল এবং কেন্দ্রীভূত করে তোলে।

পারসোনা মেমরির উদাহরণ

যদি ট্রাভেল এজেন্টকে “স্কি পরিকল্পনার বিশেষজ্ঞ” হিসেবে ডিজাইন করা হয়, পারসোনা মেমরি এই ভূমিকা শক্তিশালী করতে পারে, যা তার প্রতিক্রিয়াগুলোকে বিশেষজ্ঞের টোন এবং জ্ঞানের সাথে সামঞ্জস্যপূর্ণ করে তোলে।

ওয়ার্কফ্লো/এপিসোডিক মেমরি

এই মেমরি একটি জটিল টাস্কের সময় এজেন্ট যে ধাপগুলো নেয়, সেগুলোর ক্রম সংরক্ষণ করে, যার মধ্যে সফলতা এবং ব্যর্থতা অন্তর্ভুক্ত। এটি অতীত “পর্ব” বা অভিজ্ঞতা মনে রাখার মতো, যা থেকে শেখা যায়।

এপিসোডিক মেমরির উদাহরণ

যদি এজেন্ট একটি নির্দিষ্ট ফ্লাইট বুক করার চেষ্টা করে কিন্তু এটি অনুপলব্ধতার কারণে ব্যর্থ হয়, এপিসোডিক মেমরি এই ব্যর্থতাটি রেকর্ড করতে পারে, যা এজেন্টকে বিকল্প ফ্লাইট চেষ্টা করতে বা পরবর্তী প্রচেষ্টায় ব্যবহারকারীকে সমস্যাটি সম্পর্কে আরও তথ্যপূর্ণভাবে জানাতে সাহায্য করে।

এন্টিটি মেমরি

এটি কথোপকথন থেকে নির্দিষ্ট এন্টিটি (যেমন ব্যক্তি, স্থান, বা বস্তু) এবং ঘটনাগুলো বের করে এবং মনে রাখে। এটি এজেন্টকে আলোচিত মূল উপাদানগুলোর একটি গঠিত ধারণা তৈরি করতে সাহায্য করে।

এন্টিটি মেমরির উদাহরণ

একটি অতীত ট্রিপ সম্পর্কে কথোপকথন থেকে, এজেন্ট “প্যারিস,” “আইফেল টাওয়ার,” এবং “Le Chat Noir রেস্টুরেন্টে ডিনার” এন্টিটি হিসেবে বের করতে পারে। ভবিষ্যতের ইন্টারঅ্যাকশনে, এজেন্ট “Le Chat Noir” মনে রাখতে পারে এবং সেখানে একটি নতুন রিজার্ভেশন করার প্রস্তাব দিতে পারে।

স্ট্রাকচার্ড RAG (রিট্রিভাল অগমেন্টেড জেনারেশন)

যদিও RAG একটি বিস্তৃত কৌশল, “স্ট্রাকচার্ড RAG” একটি শক্তিশালী মেমরি প্রযুক্তি হিসেবে উল্লেখযোগ্য। এটি বিভিন্ন উৎস (কথোপকথন, ইমেইল, ছবি) থেকে ঘন, গঠিত তথ্য বের করে এবং প্রতিক্রিয়ার নির্ভুলতা, পুনরুদ্ধার, এবং গতি উন্নত করতে ব্যবহার করে। ক্লাসিক RAG শুধুমাত্র সেমান্টিক সাদৃশ্যের উপর নির্ভর করে, কিন্তু স্ট্রাকচার্ড RAG তথ্যের অন্তর্নিহিত গঠন নিয়ে কাজ করে।

স্ট্রাকচার্ড RAG এর উদাহরণ

কেবল কীওয়ার্ড মেলানোর পরিবর্তে, স্ট্রাকচার্ড RAG একটি ইমেইল থেকে ফ্লাইটের বিবরণ (গন্তব্য, তারিখ, সময়, এয়ারলাইন) পার্স করতে পারে এবং এটি একটি গঠিতভাবে সংরক্ষণ করতে পারে। এটি “আমি মঙ্গলবার প্যারিসে কোন ফ্লাইট বুক করেছি?” এর মতো সুনির্দিষ্ট প্রশ্নের উত্তর দিতে সক্ষম করে।

মেমরি প্রয়োগ ও সংরক্ষণ

AI এজেন্টদের জন্য মেমরি প্রয়োগ একটি মেমরি ব্যবস্থাপনা প্রক্রিয়ার মাধ্যমে সম্পন্ন হয়, যার মধ্যে তথ্য তৈরি, সংরক্ষণ, পুনরুদ্ধার, ইন্টিগ্রেশন, আপডেট, এবং এমনকি “ভুলে যাওয়া” (বা মুছে ফেলা) অন্তর্ভুক্ত। পুনরুদ্ধার একটি বিশেষভাবে গুরুত্বপূর্ণ দিক।

বিশেষায়িত মেমরি টুল

এজেন্ট মেমরি সংরক্ষণ ও পরিচালনার একটি উপায় হলো Mem0 এর মতো বিশেষায়িত টুল ব্যবহার করা। Mem0 একটি স্থায়ী মেমরি স্তর হিসেবে কাজ করে, যা এজেন্টকে প্রাসঙ্গিক ইন্টারঅ্যাকশন মনে রাখতে, ব্যবহারকারীর পছন্দ এবং বাস্তব প্রসঙ্গ সংরক্ষণ করতে, এবং সময়ের সাথে সফলতা ও ব্যর্থতা থেকে শেখার সুযোগ দেয়। ধারণাটি হলো স্টেটলেস এজেন্টকে স্টেটফুলে রূপান্তর করা।

এটি একটি দুই-পর্যায়ের মেমরি পাইপলাইন: এক্সট্রাকশন এবং আপডেট এর মাধ্যমে কাজ করে। প্রথমে, এজেন্টের থ্রেডে যোগ করা বার্তাগুলো Mem0 সার্ভিসে পাঠানো হয়, যা একটি Large Language Model (LLM) ব্যবহার করে কথোপকথনের ইতিহাস সংক্ষেপ করে এবং নতুন মেমরি বের করে। পরবর্তীতে, একটি LLM-চালিত আপডেট পর্যায় নির্ধারণ করে যে এই মেমরিগুলো যোগ, পরিবর্তন, বা মুছে ফেলা হবে কিনা, এবং এগুলোকে একটি হাইব্রিড ডেটা স্টোরে সংরক্ষণ করে যা ভেক্টর, গ্রাফ, এবং কী-ভ্যালু ডেটাবেস অন্তর্ভুক্ত করতে পারে। এই সিস্টেম বিভিন্ন মেমরি প্রকার সমর্থন করে এবং গ্রাফ মেমরি অন্তর্ভুক্ত করতে পারে যা এন্টিটির মধ্যে সম্পর্ক পরিচালনা করে।

RAG দিয়ে মেমরি সংরক্ষণ

Mem0 এর মতো বিশেষায়িত মেমরি টুল ছাড়াও, আপনি Azure AI Search এর মতো শক্তিশালী সার্চ সার্ভিস ব্যবহার করতে পারেন মেমরি সংরক্ষণ ও পুনরুদ্ধারের ব্যাকএন্ড হিসেবে, বিশেষত স্ট্রাকচার্ড RAG এর জন্য।

এটি আপনার এজেন্টের প্রতিক্রিয়াগুলোকে আপনার নিজস্ব ডেটার সাথে ভিত্তি প্রদান করতে সাহায্য করে, যা আরও প্রাসঙ্গিক এবং সঠিক উত্তর নিশ্চিত করে। Azure AI Search ব্যবহার করে ব্যবহারকারীর নির্দিষ্ট ট্রাভেল মেমরি, প্রোডাক্ট ক্যাটালগ, বা অন্য যেকোনো ডোমেইন-নির্দিষ্ট জ্ঞান সংরক্ষণ করা যায়।

Azure AI Search স্ট্রাকচার্ড RAG এর মতো ক্ষমতা সমর্থন করে, যা কথোপকথনের ইতিহাস, ইমেইল, বা এমনকি ছবি থেকে ঘন, গঠিত তথ্য বের করা এবং পুনরুদ্ধারে দক্ষ। এটি “সুপারহিউম্যান নির্ভুলতা এবং পুনরুদ্ধার” প্রদান করে, যা প্রচলিত টেক্সট চাঙ্কিং এবং এমবেডিং পদ্ধতির তুলনায় উন্নত।

AI এজেন্টদের স্ব-উন্নয়নশীল করা

স্ব-উন্নয়নশীল এজেন্টদের জন্য একটি সাধারণ প্যাটার্ন হলো একটি “জ্ঞান এজেন্ট” পরিচয় করানো। এই পৃথক এজেন্ট ব্যবহারকারী এবং প্রধান এজেন্টের মধ্যে কথোপকথন পর্যবেক্ষণ করে। এর ভূমিকা হলো:

  1. মূল্যবান তথ্য চিহ্নিত করা: কথোপকথনের কোনো অংশ সাধারণ জ্ঞান বা নির্দিষ্ট ব্যবহারকারীর পছন্দ হিসেবে সংরক্ষণ করার যোগ্য কিনা তা নির্ধারণ করা।

  2. তথ্য বের করা এবং সংক্ষেপ করা: কথোপকথন থেকে প্রয়োজনীয় শেখা বা পছন্দ বের করা।

  3. জ্ঞানভাণ্ডারে সংরক্ষণ করা: এই বের করা তথ্য সংরক্ষণ করা, সাধারণত একটি ভেক্টর ডেটাবেসে, যাতে এটি পরে পুনরুদ্ধার করা যায়।

  4. ভবিষ্যতের প্রশ্ন উন্নত করা: যখন ব্যবহারকারী একটি নতুন প্রশ্ন শুরু করেন, জ্ঞান এজেন্ট প্রাসঙ্গিক সংরক্ষিত তথ্য পুনরুদ্ধার করে এবং এটি ব্যবহারকারীর প্রম্পটে যোগ করে, প্রধান এজেন্টকে গুরুত্বপূর্ণ প্রসঙ্গ প্রদান করে (RAG এর মতো)।

মেমরির জন্য অপ্টিমাইজেশন

লেটেন্সি ব্যবস্থাপনা: ব্যবহারকারীর ইন্টারঅ্যাকশন ধীর না করার জন্য, একটি সস্তা, দ্রুত মডেল প্রাথমিকভাবে ব্যবহার করা যেতে পারে দ্রুত চেক করতে যে তথ্য সংরক্ষণ বা পুনরুদ্ধার করার যোগ্য কিনা, শুধুমাত্র প্রয়োজন হলে আরও জটিল এক্সট্রাকশন/রিট্রিভাল প্রক্রিয়া চালু করা।

জ্ঞানভাণ্ডার রক্ষণাবেক্ষণ: একটি ক্রমবর্ধমান জ্ঞানভাণ্ডারের জন্য, কম ব্যবহৃত তথ্য “কোল্ড স্টোরেজ”-এ সরানো যেতে পারে খরচ পরিচালনার জন্য।

এজেন্ট মেমরি সম্পর্কে আরও প্রশ্ন আছে?

Azure AI Foundry Discord এ যোগ দিন, যেখানে আপনি অন্যান্য শিক্ষার্থীদের সাথে দেখা করতে পারেন, অফিস আওয়ারে অংশ নিতে পারেন এবং আপনার AI এজেন্ট সম্পর্কিত প্রশ্নের উত্তর পেতে পারেন।


অস্বীকৃতি:
এই নথিটি AI অনুবাদ পরিষেবা Co-op Translator ব্যবহার করে অনুবাদ করা হয়েছে। আমরা যথাসাধ্য সঠিক অনুবাদের চেষ্টা করি, তবে দয়া করে মনে রাখবেন যে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। নথিটির মূল ভাষায় থাকা সংস্করণটিকে প্রামাণিক উৎস হিসেবে বিবেচনা করা উচিত। গুরুত্বপূর্ণ তথ্যের জন্য, পেশাদার মানব অনুবাদ সুপারিশ করা হয়। এই অনুবাদ ব্যবহারের ফলে সৃষ্ট কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই।