ai-agents-for-beginners

Agentic RAG

(এই পাঠের ভিডিও দেখতে উপরের ছবি ক্লিক করুন)

Agentic RAG

এই পাঠটি Agentic Retrieval-Augmented Generation (Agentic RAG) সম্পর্কে একটি ব্যাপক ওভারভিউ প্রদান করে, যা একটি উদীয়মান AI প্যারাডাইম যেখানে বড় ভাষার মডেলগুলি (LLMs) স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপগুলি পরিকল্পনা করে যখন তারা বাহ্যিক উৎস থেকে তথ্য সংগ্রহ করে। স্থির retrieval-then-read প্যাটার্নের বিপরীতে, Agentic RAG iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনগত আউটপুট সহ। সিস্টেম ফলাফল মূল্যায়ন করে, প্রশ্নগুলি পরিমার্জন করে, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে এবং এই চক্রটি চালিয়ে যায় যতক্ষণ না সন্তুষ্টিজনক সমাধান পাওয়া যায়।

পরিচিতি

এই পাঠে আলোচনা করা হবে

শেখার লক্ষ্য

এই পাঠ সম্পন্ন করার পর, আপনি জানতে পারবেন/বোঝাপড়া পাবেন:

Agentic RAG কী?

Agentic Retrieval-Augmented Generation (Agentic RAG) একটি উদীয়মান AI প্যারাডাইম যেখানে বড় ভাষার মডেলগুলি (LLMs) স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপ পরিকল্পনা করে যখন তারা বাহ্যিক উৎস থেকে তথ্য সংগ্রহ করে। স্থির retrieval-then-read প্যাটার্নের পরিবর্তে, Agentic RAG iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনগত আউটপুট সহ। সিস্টেম ফলাফল মূল্যায়ন করে, প্রশ্ন পরিমার্জন করে, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে এবং এই চক্রটি চালিয়ে যায় যতক্ষণ না সন্তোষজনক সমাধান পাওয়া যায়। এই পুনরাবৃত্তিমূলক “maker-checker” স্টাইল সঠিকতা উন্নত করে, ভুলভাবে গঠিত প্রশ্নগুলি পরিচালনা করে এবং উচ্চ গুণমানের ফলাফল নিশ্চিত করে।

সিস্টেম সক্রিয়ভাবে নিজের যুক্তি প্রক্রিয়া পরিচালনা করে, ব্যর্থ প্রশ্ন পুনঃলিখন করে, ভিন্ন রিট্রিভাল পদ্ধতি নির্বাচন করে এবং একাধিক টুল ইন্টিগ্রেট করে—যেমন Azure AI Search এ ভেক্টর সার্চ, SQL ডেটাবেস, অথবা কাস্টম API—এটি চূড়ান্ত উত্তর দেওয়ার আগে। একটি agentic সিস্টেমের প্রধান বৈশিষ্ট্য হলো এটি নিজের যুক্তি প্রক্রিয়া পরিচালনার ক্ষমতা। প্রচলিত RAG বাস্তবায়নগুলি পূর্বনির্ধারিত পাথের উপর নির্ভর করে, কিন্তু একটি agentic সিস্টেম স্বয়ংক্রিয়ভাবে তথ্যের গুণগত মানের উপর ভিত্তি করে ধাপগুলির ক্রম নির্ধারণ করে।

Agentic Retrieval-Augmented Generation (Agentic RAG) সংজ্ঞায়িতকরণ

Agentic Retrieval-Augmented Generation (Agentic RAG) AI উন্নয়নের একটি উদীয়মান প্যারাডাইম যেখানে LLM গুলি কেবল বাহ্যিক ডেটা উৎস থেকে তথ্য সংগ্রহ করে না, বরং স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপ পরিকল্পনা করে। স্থির retrieval-then-read প্যাটার্ন বা সাবধানে স্ক্রিপ্ট করা প্রম্পট সিকোয়েন্সের পরিবর্তে, Agentic RAG একটি লুপের মতো iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনমূলক আউটপুট সহ। প্রতিটি ধাপে সিস্টেম পেয়েছে ফলাফল মূল্যায়ন করে, প্রশ্ন পরিমার্জিত করা দরকার কিনা তা সিদ্ধান্ত নেয়, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে, এবং এই চক্র চালিয়ে যায় যতক্ষণ না সন্তোষজনক সমাধান পাওয়া যায়।

এই পুনরাবৃত্তিমূলক “maker-checker” অপারেশন স্টাইল সঠিকতা উন্নত করতে, গঠিত ডেটাবেসের ত্রুটিপূর্ণ প্রশ্ন (যেমন NL2SQL) পরিচালনা করতে, এবং সুষম, উচ্চ-মানের ফলাফল নিশ্চিত করতে ডিজাইন করা হয়েছে। শুধুমাত্র সাবধানে পরিকল্পিত প্রম্পট চেইনের উপর নির্ভর না করে, সিস্টেম সক্রিয়ভাবে নিজের যুক্তি প্রক্রিয়া পরিচালনা করে। এটি ব্যর্থ প্রশ্নগুলি পুনঃলিখন করতে পারে, বিভিন্ন রিট্রিভাল পদ্ধতি বেছে নিতে পারে, এবং একাধিক টুল ইন্টিগ্রেট করতে পারে — যেমন Azure AI Search এ ভেক্টর সার্চ, SQL ডাটাবেস, বা কাস্টম API — এর উত্তর চূড়ান্ত করার আগে। এটি অতিরিক্ত জটিল অর্কেস্ট্রেশন ফ্রেমওয়ার্কের প্রয়োজনীয়তা দূর করে। বরং, একটি তুলনামূলক সহজ লুপ “LLM কল → টুল ব্যবহারে → LLM কল → …” উন্নত এবং ভাল ভিত্তিক আউটপুট প্রদান করতে পারে।

Agentic RAG Core Loop

যুক্তির প্রক্রিয়া নিজেদের দখল করা

একটি সিস্টেমকে “agentic” বানায় এমন বৈশিষ্ট্য হল এটি নিজের যুক্তির প্রক্রিয়া নিয়ন্ত্রণ করার ক্ষমতা। প্রচলিত RAG বাস্তবায়নগুলি সাধারণত মানুষের দ্বারা মডেলের জন্য একটি পথ পূর্বনির্ধারণের ওপর নির্ভর করে: একটি chain-of-thought যা উল্লেখ করে কখন কি রিট্রিভ করতে হবে।

কিন্তু যখন একটি সিস্টেম সত্যিকার অর্থে agentic হয়, তখন এটি অভ্যন্তরীণভাবে সিদ্ধান্ত নেয় কীভাবে সমস্যা সমাধান করা হবে। এটি শুধুমাত্র একটি স্ক্রিপ্ট চালাচ্ছে না; এটি তথ্যের গুণমানের উপর ভিত্তি করে ধাপগুলির ক্রম স্বয়ংক্রিয়ভাবে নির্ধারণ করছে।

উদাহরণস্বরূপ, যদি এটি একটি প্রোডাক্ট লঞ্চ কৌশল তৈরি করতে বললে, এটি শুধু একটি প্রম্পটের উপর নির্ভর করবে না যা পুরো গবেষণা এবং সিদ্ধান্ত গ্রহণের কাজকে বর্ণনা করে। বরং, agentic মডেল স্বতন্ত্রভাবে সিদ্ধান্ত নেয়:

  1. Bing Web Grounding ব্যবহার করে বর্তমান বাজার প্রবণতা রিপোর্ট সংগ্রহ করা
  2. Azure AI Search ব্যবহার করে প্রাসঙ্গিক প্রতিদ্বন্দ্বী তথ্য সনাক্ত করা।
  3. Azure SQL Database ব্যবহার করে ঐতিহাসিক অভ্যন্তরীণ বিক্রয় পরিসংখ্যান তুলনা করা।
  4. Azure OpenAI Service এর মাধ্যমে ফলাফলগুলোকে একত্রিত করে একটি সমন্বিত কৌশল তৈরি করা।
  5. কৌশলটি গ্যাপ বা অসঙ্গতি জন্য মূল্যায়ন করা, প্রয়োজনে আরও পুনরায় তথ্য আহরণ করা।

এই সমস্ত ধাপগুলো — প্রশ্ন পরিমার্জন, উৎস নির্বাচন, উত্তর নিয়ে “খুশি” না হওয়া পর্যন্ত পুনঃপ্রক্রিয়া — মডেল নিজেই সিদ্ধান্ত নেয়, কোন মানব পূর্বনির্ধারিত স্ক্রিপ্ট নেই।

Iterative লুপ, টুল ইন্টিগ্রেশন, এবং মেমোরি

Tool Integration Architecture

একটি agentic সিস্টেম একটি লুপযুক্ত ইন্টারঅ্যাকশন প্যাটার্নের উপর নির্ভর করে:

সময়ের সাথে সাথে, এটি যা বোঝা বাড়াচ্ছে তাতে একটি বিকাশমান বোধ তৈরি করে, যার ফলে মডেল জটিল, বহু-ধাপ কাজ দক্ষতার সাথে সম্পন্ন করতে পারে, মানব হস্তক্ষেপ বা প্রম্পট পুনর্গঠন ছাড়াই।

ব্যর্থতা মোড এবং স্ব-সংশোধন পরিচালনা

Agentic RAG এর স্বায়ত্তশাসনে শক্তিশালী স্ব-সংশোধন প্রক্রিয়াও অন্তর্ভুক্ত। যখন সিস্টেম অযোগ্য শেষবিন্দুতে পৌঁছায় — যেমন অপ্রাসঙ্গিক ডকুমেন্ট সংগ্রহ বা ভুল প্রশ্নের সম্মুখীন হয় — তখন এটি করতে পারে:

এই পুনরাবৃত্তিমূলক এবং গতিশীল পদ্ধতি মডেলকে ক্রমাগত উন্নতির সুযোগ দেয়, নিশ্চয়তা দিয়ে যে এটি শুধুমাত্র একবারের সিস্টেম নয় বরং নির্দিষ্ট সেশনে তার ভুল থেকে শিখতে সক্ষম।

Self Correction Mechanism

এজেন্সির সীমাবদ্ধতা

একটি কাজের মধ্যে স্বয়ংক্রিয়তার সত্বেও, Agentic RAG কৃত্রিম সাধারণ বুদ্ধিমত্তার (Artificial General Intelligence) সমতুল্য নয়। এর “agentic” সক্ষমতাগুলি মানুষের ডেভেলপারদের দ্বারা প্রদত্ত টুল, ডেটা উৎস এবং নীতিমালা সীমাবদ্ধ। এটি নিজস্ব টুল উদ্ভাবন করতে বা নির্ধারিত ডোমেন সীমানার বাইরে যেতে পারে না। বরং, এটি হাতের রিসোর্সগুলো গতিশীলভাবে পরিচালনায় সক্ষম।

উন্নত AI রূপ থেকে প্রধান পার্থক্য হলো:

  1. ডোমেন-নির্দিষ্ট স্বায়ত্তশাসন: Agentic RAG সিস্টেমগুলি পরিচিত ডোমেনের মধ্যে ব্যবহারকারী-নির্ধারিত লক্ষ্য অর্জনে কেন্দ্রীভূত, ফলাফল উন্নতির জন্য প্রশ্ন পুনঃলিখন বা টুল নির্বাচন কৌশল ব্যবহার করে।
  2. অবকাঠামো-নির্ভর: সিস্টেমের সক্ষমতা ডেভেলপাররা একত্রিত করা টুল এবং ডেটার ওপর নির্ভরশীল। মানব হস্তক্ষেপ ছাড়া এই সীমা পার করতে পারে না।
  3. গার্ডরেলের সম্মান: নৈতিক নির্দেশিকা, সম্মতি নিয়মাবলী, এবং ব্যবসায়িক নীতিমালা খুবই গুরুত্বপূর্ণ। এজেন্টের স্বাধীনতা সর্বদা সুরক্ষা ব্যবস্থা এবং তদারকি মেকানিজম দ্বারা নিয়ন্ত্রিত থাকে (আশাকরি)।

বাস্তব ব্যবহার ক্ষেত্র ও মূল্য

Agentic RAG নিম্নলিখিত পরিস্থিতিতে বিশেষভাবে কার্যকর যখন পুনরাবৃত্তিমূলক পরিমার্জন এবং সঠিকতা প্রয়োজন:

  1. সঠিকতা-প্রথম পরিবেশ: সম্মতি যাচাই, নিয়ন্ত্রক বিশ্লেষণ বা আইনী গবেষণায়, agentic মডেল বারবার তথ্য যাচাই করতে পারে, একাধিক উৎস পরামর্শ করে এবং প্রশ্ন পুনঃলিখন করে যতক্ষণ না সত্যতা যাচাই করা উত্তর তৈরি হয়।
  2. জটিল ডেটাবেস ইন্টারঅ্যাকশন: গঠিত ডেটার ক্ষেত্রে যেখানে প্রশ্ন প্রায়ই ব্যর্থ হতে পারে বা সামঞ্জস্য প্রয়োজন, সিস্টেম স্বয়ংক্রিয়ভাবে Azure SQL বা Microsoft Fabric OneLake ব্যবহার করে প্রশ্ন পরিমার্জন করতে পারে, নিশ্চিত করে চূড়ান্ত রিট্রিভাল ব্যবহারকারীর উদ্দেশ্যের সঙ্গে সামঞ্জস্যপূর্ণ।
  3. দীর্ঘতর ওয়ার্কফ্লো: দীর্ঘ সময় ধরে চলা সেশনগুলো নতুন তথ্য আসা অনুযায়ী বিকশিত হতে পারে। Agentic RAG ক্রমাগত নতুন ডেটা অন্তর্ভুক্ত করতে পারে এবং সমস্যার ক্ষেত্র সম্পর্কে আরও জানতে যেতে কৌশলগুলো পরিবর্তন করতে পারে।

শাসন, স্বচ্ছতা এবং বিশ্বাস

এই সিস্টেমগুলো যত বেশি স্বায়ত্তশাসিত হবে তত বেশি শাসন এবং স্বচ্ছতা গুরুত্বপূর্ণ হবে:

অ্যাকশনগুলোর একটি পরিষ্কার রেকর্ড প্রদানকারী টুল থাকা গুরুত্বপূর্ণ। এগুলো ছাড়া, বহু-ধাপ প্রক্রিয়া ডিবাগ করা অনেক কঠিন। Literal AI (Chainlit এর পিছনের কোম্পানি) থেকে Agent রান এর উদাহরণ দেখুন:

AgentRunExample

উপসংহার

Agentic RAG AI সিস্টেমগুলি কিভাবে জটিল, ডেটা-নির্ভর কাজ পরিচালনা করে তার একটি প্রাকৃতিক বিকাশ প্রতিনিধিত্ব করে। একটি লুপযুক্ত ইন্টারঅ্যাকশন প্যাটার্ন গ্রহণ করে, স্বতন্ত্রভাবে টুল নির্বাচন করে এবং পুনরাবৃত্তভাবে প্রশ্ন পরিমার্জন করে উচ্চ-মানের ফলাফল নিশ্চিত করে, সিস্টেম স্থির প্রম্পট অনুসরণ থেকে বেরিয়ে আসে, একটি আরও অভিযোজ্য, প্রসঙ্গ-সচেতন সিদ্ধান্ত গ্রহণকারী হয়ে ওঠে। যদিও এটি এখনও মানব-নির্ধারিত অবকাঠামো এবং নৈতিক নির্দেশিকার দ্বারা সীমাবদ্ধ, তবে এই agentic সক্ষমতাগুলো আরও সমৃদ্ধ, গতিশীল এবং সর্বশেষে অধিক কার্যকর AI ইন্টারঅ্যাকশন সক্ষম করে ব্যবস্থাগুলোর জন্য এবং শেষ ব্যবহারকারীদের জন্য।

Agentic RAG সম্পর্কে আরও প্রশ্ন আছে কি?

অন্য শিক্ষার্থীদের সাথে দেখা করতে, অফিস আওয়ার অংশগ্রহণ করতে এবং আপনার AI এজেন্ট সম্পর্কিত প্রশ্নগুলোর উত্তর পেতে Microsoft Foundry Discord এ যোগ দিন।

অতিরিক্ত সম্পদ

একাডেমিক পেপারসমূহ

পূর্ববর্তী পাঠ

টুল ব্যবহার ডিজাইন প্যাটার্ন

পরবর্তী পাঠ

বিশ্বাসযোগ্য AI এজেন্ট তৈরি


বাদ দেওয়া ঘোষণা: এই নথিটি AI অনুবাদ সেবা Co-op Translator ব্যবহার করে অনূদিত হয়েছে। আমরা যথাসাধ্য সঠিকতার চেষ্টা করি, তবে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা ভুল থাকতে পারে। মূল নথি তার স্বাভাবিক ভাষায় সর্বোচ্চ কর্তৃপক্ষ হিসেবে গণ্য হবে। গুরুত্বপূর্ণ তথ্যের জন্য পেশাদার মানব অনুবাদের পরামর্শ দেওয়া হয়। এই অনুবাদের ব্যবহারে যে কোনও ভুল বোঝাবুঝি বা ভ্রান্ত ব্যাখ্যার জন্য আমরা দায়ী নই।