ai-agents-for-beginners

Agentic RAG

(คลิกที่รูปภาพด้านบนเพื่อดูวิดีโอของบทเรียนนี้)

Agentic RAG

บทเรียนนี้ให้ภาพรวมที่ครอบคลุมของ Agentic Retrieval-Augmented Generation (Agentic RAG) ซึ่งเป็นพาราไดม์ AI ที่เกิดขึ้นใหม่ โดยที่โมเดลภาษาขนาดใหญ่ (LLMs) สามารถวางแผนขั้นตอนถัดไปได้ด้วยตนเองในขณะที่ดึงข้อมูลจากแหล่งภายนอก แตกต่างจากรูปแบบการดึงข้อมูลแล้วอ่านแบบคงที่ Agentic RAG เกี่ยวข้องกับการเรียก LLM อย่างเป็นวนซ้ำ สลับกับการเรียกใช้งานเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ระบบจะประเมินผล ละเอียดคำค้น ปรับเรียกเครื่องมือเพิ่มหากจำเป็น และทำซ้ำวงจรนี้จนกว่าจะได้คำตอบที่น่าพอใจ

Introduction

บทเรียนนี้จะครอบคลุม

Learning Goals

หลังจากทำบทเรียนนี้เสร็จ คุณจะรู้วิธี/เข้าใจ:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) เป็นพาราไดม์ AI ที่เกิดขึ้นใหม่ซึ่งโมเดลภาษาขนาดใหญ่ (LLMs) ไม่เพียงแค่ดึงข้อมูลจากแหล่งข้อมูลภายนอก แต่ยังวางแผนขั้นตอนถัดไปได้ด้วยตนเอง แตกต่างจากรูปแบบการดึงข้อมูลแล้วอ่านแบบคงที่หรือชุดคำสั่ง prompt ที่ถูกเขียนอย่างระมัดระวัง Agentic RAG เกี่ยวข้องกับวงจรของการเรียก LLM แบบวนซ้ำ สลับกับการเรียกเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ในแต่ละรอบ ระบบจะประเมินผลลัพธ์ที่ได้ ตัดสินใจว่าจะปรับคำค้นหรือไม่ เรียกเครื่องมือเพิ่มเติมถ้าจำเป็น และทำซ้ำจนกว่าจะได้คำตอบที่น่าพอใจ

รูปแบบการทำงานแบบ “maker-checker” ที่วนซ้ำนี้ออกแบบมาเพื่อเพิ่มความถูกต้อง จัดการกับคำถามที่มีรูปแบบไม่ถูกต้องเมื่อสื่อสารกับฐานข้อมูลที่มีโครงสร้าง (เช่น NL2SQL) และให้ผลลัพธ์ที่สมดุลและมีคุณภาพสูง แทนที่จะพึ่งพาสตริงของ prompt ที่ถูกออกแบบอย่างประณีต ระบบจะเป็นเจ้าของกระบวนการเหตุผลของตนเองอย่างแข็งขัน มันสามารถเขียนคำค้นที่ล้มเหลวใหม่ เลือกวิธีการดึงข้อมูลที่ต่างกัน และผสานรวมหลายเครื่องมือ—เช่น การค้นหาเวกเตอร์ใน Azure AI Search, ฐานข้อมูล SQL, หรือ API แบบกำหนดเอง—ก่อนสรุปคำตอบสุดท้าย นั่นทำให้ไม่จำเป็นต้องมีกรอบการประสานงานที่ซับซ้อนเกินไป แทนที่จะเป็นเช่นนั้น วงจรที่ค่อนข้างเรียบง่ายของ “LLM call → tool use → LLM call → …” ก็สามารถให้ผลลัพธ์ที่ซับซ้อนและมีพื้นฐานดีได้

Agentic RAG Core Loop

Owning the Reasoning Process

คุณสมบัติที่ทำให้ระบบเป็น “agentic” คือความสามารถในการเป็นเจ้าของกระบวนการเหตุผลของตนเอง การใช้งาน RAG แบบดั้งเดิมมักขึ้นอยู่กับการที่มนุษย์กำหนดเส้นทางให้กับโมเดล: chain-of-thought ที่ระบุว่าจะดึงอะไรและเมื่อไร แต่เมื่อระบบเป็น agentic อย่างแท้จริง มันจะตัดสินใจภายในว่าแนวทางแก้ปัญหาควรเป็นอย่างไร มันไม่ได้เพียงแค่รันสคริปต์ แต่กำหนดลำดับขั้นตอนโดยอัตโนมัติตามคุณภาพของข้อมูลที่พบ ตัวอย่างเช่น หากถูกขอให้สร้างกลยุทธ์การเปิดตัวผลิตภัณฑ์ มันจะไม่พึ่งพาเพียง prompt ที่ระบุเวิร์กโฟลว์การวิจัยและการตัดสินใจทั้งหมด แต่โมเดลแบบ agentic จะตัดสินใจด้วยตนเองที่จะ:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. ขั้นตอนทั้งหมดเหล่านี้—การปรับคำค้น การเลือกแหล่งข้อมูล การวนซ้ำจนกว่าจะ “พอใจ” กับคำตอบ—ถูกตัดสินโดยโมเดล ไม่ใช่ถูกเขียนสคริปต์ไว้ล่วงหน้าโดยมนุษย์

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

ระบบแบบ agentic พึ่งพารูปแบบการโต้ตอบแบบวนซ้ำ:

เมื่อเวลาผ่านไป สิ่งนี้สร้างความรู้สึกของความเข้าใจที่พัฒนาไป ทำให้โมเดลสามารถนำทางงานที่ซับซ้อนหลายขั้นตอนได้โดยไม่ต้องให้มนุษย์เข้ามาแทรกแซงหรือปรับ prompt อยู่ตลอด

Handling Failure Modes and Self-Correction

ความเป็นอิสระของ Agentic RAG ยังรวมถึงกลไกการแก้ไขตนเองที่แข็งแกร่ง เมื่อระบบประสบทางตัน—เช่น ดึงเอกสารที่ไม่เกี่ยวข้องหรือพบคำขอที่มีรูปแบบผิดพลาด—มันสามารถ:

แนวทางที่วนซ้ำและไดนามิกนี้ทำให้โมเดลพัฒนาต่อเนื่องได้มั่นใจว่ามันไม่ใช่ระบบแบบครั้งเดียว แต่เป็นระบบที่เรียนรู้จากความผิดพลาดในระหว่างเซสชันที่กำลังดำเนินอยู่

Self Correction Mechanism

Boundaries of Agency

แม้จะมีความเป็นอิสระภายในงาน Agentic RAG ก็ไม่ใช่เทียบเท่ากับ Artificial General Intelligence ความสามารถ “agentic” ของมันจำกัดอยู่ที่เครื่องมือ แหล่งข้อมูล และนโยบายที่มนุษย์นักพัฒนาให้ไว้ มันไม่สามารถประดิษฐ์เครื่องมือของตัวเองหรือก้าวออกนอกขอบเขตโดเมนที่กำหนดไว้ได้ อย่างไรก็ตาม มันโดดเด่นในการประสานทรัพยากรที่มีอยู่แบบไดนามิก ความแตกต่างสำคัญจากรูปแบบ AI ที่ก้าวหน้ากว่ารวมถึง:

  1. Domain-Specific Autonomy: ระบบ Agentic RAG มุ่งเน้นไปที่การบรรลุเป้าหมายที่ผู้ใช้กำหนดภายในโดเมนที่รู้จัก โดยใช้กลยุทธ์อย่างการเขียนคำค้นใหม่หรือการเลือกเครื่องมือเพื่อปรับปรุงผลลัพธ์
  2. Infrastructure-Dependent: ความสามารถของระบบขึ้นอยู่กับเครื่องมือและข้อมูลที่นักพัฒนารวมเข้ามา มันไม่สามารถข้ามขีดจำกัดเหล่านี้ได้โดยปราศจากการแทรกแซงของมนุษย์
  3. Respect for Guardrails: แนวทางจริยธรรม กฎระเบียบ และนโยบายทางธุรกิจยังคงมีความสำคัญอย่างยิ่ง อิสระของเอเยนต์ถูกจำกัดโดยมาตรการความปลอดภัยและกลไกการกำกับดูแลเสมอ (หวังว่าใช่?)

Practical Use Cases and Value

Agentic RAG โดดเด่นในสถานการณ์ที่ต้องการการปรับปรุงแบบวนซ้ำและความแม่นยำ:

  1. Correctness-First Environments: ในการตรวจสอบความสอดคล้อง การวิเคราะห์ระเบียบข้อบังคับ หรือการค้นคว้าทางกฎหมาย โมเดลแบบ agentic สามารถยืนยันข้อเท็จจริงซ้ำ ๆ ปรึกษาหลายแหล่ง และเขียนคำค้นใหม่จนกว่าจะให้คำตอบที่ผ่านการตรวจสอบอย่างละเอียด
  2. Complex Database Interactions: เมื่อทำงานกับข้อมูลมีโครงสร้างที่คำสั่งมักล้มเหลวหรือจำเป็นต้องปรับแก้ ระบบสามารถปรับคำสั่งได้เองโดยอัตโนมัติโดยใช้ Azure SQL หรือ Microsoft Fabric OneLake เพื่อให้การดึงข้อมูลสุดท้ายสอดคล้องกับเจตนาของผู้ใช้
  3. Extended Workflows: เซสชันที่ดำเนินนานอาจพัฒนาไปตามข้อมูลใหม่ที่ปรากฏ Agentic RAG สามารถรวมข้อมูลใหม่อย่างต่อเนื่อง ปรับกลยุทธ์เมื่อเรียนรู้เพิ่มเติมเกี่ยวกับปัญหา

Governance, Transparency, and Trust

เมื่อระบบเหล่านี้มีความเป็นอิสระมากขึ้นในการให้เหตุผล การกำกับดูแลและความโปร่งใสจึงมีความสำคัญ:

การมีเครื่องมือที่ให้บันทึกการดำเนินการที่ชัดเจนเป็นสิ่งจำเป็น หากไม่มีเครื่องมือเหล่านี้ การดีบักกระบวนการหลายขั้นตอนอาจทำได้ยากมาก ดูตัวอย่างต่อไปนี้จาก Literal AI (company behind Chainlit) สำหรับการรัน Agent:

AgentRunExample

Conclusion

Agentic RAG เป็นวิวัฒนาการที่เป็นธรรมชาติของวิธีที่ระบบ AI จัดการงานที่ซับซ้อนและต้องใช้ข้อมูลมาก ด้วยการยอมรับรูปแบบการโต้ตอบแบบวนซ้ำ การเลือกเครื่องมือโดยอัตโนมัติ และการปรับคำค้นจนกว่าจะได้ผลลัพธ์ที่มีคุณภาพสูง ระบบก้าวข้ามการทำตามคำสั่ง prompt แบบคงที่ไปสู่การเป็นผู้ตัดสินใจที่ปรับตัวเข้ากับบริบทได้มากขึ้น ในขณะที่ยังคงถูกจำกัดโดยโครงสร้างพื้นฐานและแนวทางจริยธรรมที่มนุษย์กำหนด ความสามารถแบบ agentic เหล่านี้เปิดใช้งานการโต้ตอบ AI ที่ลึกกว่า มีไดนามิกมากขึ้น และมีประโยชน์ยิ่งขึ้นสำหรับทั้งองค์กรและผู้ใช้ปลายทาง

Got More Questions about Agentic RAG?

Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.

Additional Resources

เอกสารวิชาการ

บทเรียนก่อนหน้า

รูปแบบการออกแบบการใช้เครื่องมือ

บทเรียนถัดไป

การสร้างเอเยนต์ AI ที่น่าเชื่อถือ


ข้อจำกัดความรับผิดชอบ: เอกสารฉบับนี้ได้รับการแปลโดยใช้บริการแปลภาษาอัตโนมัติ (AI) Co-op Translator (https://github.com/Azure/co-op-translator) แม้เราจะพยายามให้การแปลมีความถูกต้อง โปรดทราบว่าการแปลโดยอัตโนมัติอาจมีข้อผิดพลาดหรือความคลาดเคลื่อน เอกสารต้นฉบับในภาษาต้นทางควรถูกยึดถือเป็นแหล่งข้อมูลที่เป็นหลัก สำหรับข้อมูลที่สำคัญ แนะนำให้ใช้บริการแปลโดยผู้เชี่ยวชาญด้านมนุษย์ เราจะไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่ผิดพลาดที่เกิดจากการใช้การแปลนี้