ai-agents-for-beginners

(คลิกที่รูปภาพด้านบนเพื่อดูวิดีโอของบทเรียนนี้)

Agentic RAG

บทเรียนนี้ให้ภาพรวมที่ครอบคลุมของ Agentic Retrieval-Augmented Generation (Agentic RAG) ซึ่งเป็นพาราไดม์ AI ที่เกิดขึ้นใหม่ โดยที่โมเดลภาษาขนาดใหญ่ (LLMs) สามารถวางแผนขั้นตอนถัดไปได้ด้วยตนเองในขณะที่ดึงข้อมูลจากแหล่งภายนอก แตกต่างจากรูปแบบการดึงข้อมูลแล้วอ่านแบบคงที่ Agentic RAG เกี่ยวข้องกับการเรียก LLM อย่างเป็นวนซ้ำ สลับกับการเรียกใช้งานเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ระบบจะประเมินผล ละเอียดคำค้น ปรับเรียกเครื่องมือเพิ่มหากจำเป็น และทำซ้ำวงจรนี้จนกว่าจะได้คำตอบที่น่าพอใจ

Introduction

บทเรียนนี้จะครอบคลุม

Understand Agentic RAG: เรียนรู้เกี่ยวกับพาราไดม์ที่เกิดขึ้นใหม่ใน AI ซึ่งโมเดลภาษาขนาดใหญ่ (LLMs) วางแผนขั้นตอนถัดไปได้ด้วยตนเองในขณะที่ดึงข้อมูลจากแหล่งข้อมูลภายนอก
Grasp Iterative Maker-Checker Style: เข้าใจวงจรการเรียก LLM แบบวนซ้ำ สลับกับการเรียกเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ซึ่งออกแบบมาเพื่อเพิ่มความถูกต้องและจัดการกับคำขอที่เป็นรูปแบบผิดพลาด
Explore Practical Applications: ระบุสถานการณ์ที่ Agentic RAG เหมาะสม เช่น สิ่งแวดล้อมที่ให้ความสำคัญกับความถูกต้อง การโต้ตอบกับฐานข้อมูลที่ซับซ้อน และเวิร์กโฟลว์ที่ยาวขึ้น

Learning Goals

หลังจากทำบทเรียนนี้เสร็จ คุณจะรู้วิธี/เข้าใจ:

Understanding Agentic RAG: เรียนรู้เกี่ยวกับพาราไดม์ที่เกิดขึ้นใหม่ใน AI ซึ่งโมเดลภาษาขนาดใหญ่ (LLMs) วางแผนขั้นตอนถัดไปได้ด้วยตนเองในขณะที่ดึงข้อมูลจากแหล่งข้อมูลภายนอก
Iterative Maker-Checker Style: เข้าใจแนวคิดของวงจรการเรียก LLM แบบวนซ้ำ สลับกับการเรียกเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ซึ่งออกแบบมาเพื่อเพิ่มความถูกต้องและจัดการกับคำขอที่เป็นรูปแบบผิดพลาด
Owning the Reasoning Process: เข้าใจความสามารถของระบบในการเป็นเจ้าของกระบวนการเหตุผลของตนเอง ตัดสินใจวิธีการแก้ปัญหาโดยไม่ต้องอาศัยเส้นทางที่กำหนดไว้ล่วงหน้า
Workflow: เข้าใจว่าระบบแบบ agentic ตัดสินใจอย่างอิสระในการดึงรายงานแนวโน้มตลาด ระบุข้อมูลคู่แข่ง เชื่อมโยงเมตริกการขายภายใน สังเคราะห์ผลการค้นหา และประเมินกลยุทธ์อย่างไร
Iterative Loops, Tool Integration, and Memory: เรียนรู้เกี่ยวกับการพึ่งพารูปแบบการโต้ตอบแบบวนซ้ำของระบบ การรักษาสถานะและหน่วยความจำข้ามขั้นตอนเพื่อหลีกเลี่ยงวงจรซ้ำและตัดสินใจอย่างมีข้อมูลมากขึ้น
Handling Failure Modes and Self-Correction: สำรวจกลไกการแก้ไขตนเองที่แข็งแกร่งของระบบ รวมถึงการวนซ้ำและถามใหม่ การใช้เครื่องมือวินิจฉัย และการยอมรับการควบคุมโดยมนุษย์เมื่อจำเป็น
Boundaries of Agency: เข้าใจข้อจำกัดของ Agentic RAG โดยมุ่งเน้นที่ความเป็นอิสระเฉพาะโดเมน การพึ่งพาโครงสร้างพื้นฐาน และการเคารพกลไกควบคุม
Practical Use Cases and Value: ระบุสถานการณ์ที่ Agentic RAG เหมาะสม เช่น สิ่งแวดล้อมที่ให้ความสำคัญกับความถูกต้อง การโต้ตอบกับฐานข้อมูลที่ซับซ้อน และเวิร์กโฟลว์ที่ยาวขึ้น
Governance, Transparency, and Trust: เรียนรู้ความสำคัญของการกำกับดูแลและความโปร่งใส รวมถึงการให้เหตุผลที่สามารถอธิบายได้ การควบคุมความเอนเอียง และการมีมนุษย์กำกับดูแล

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) เป็นพาราไดม์ AI ที่เกิดขึ้นใหม่ซึ่งโมเดลภาษาขนาดใหญ่ (LLMs) ไม่เพียงแค่ดึงข้อมูลจากแหล่งข้อมูลภายนอก แต่ยังวางแผนขั้นตอนถัดไปได้ด้วยตนเอง แตกต่างจากรูปแบบการดึงข้อมูลแล้วอ่านแบบคงที่หรือชุดคำสั่ง prompt ที่ถูกเขียนอย่างระมัดระวัง Agentic RAG เกี่ยวข้องกับวงจรของการเรียก LLM แบบวนซ้ำ สลับกับการเรียกเครื่องมือหรือฟังก์ชันและผลลัพธ์ที่มีโครงสร้าง ในแต่ละรอบ ระบบจะประเมินผลลัพธ์ที่ได้ ตัดสินใจว่าจะปรับคำค้นหรือไม่ เรียกเครื่องมือเพิ่มเติมถ้าจำเป็น และทำซ้ำจนกว่าจะได้คำตอบที่น่าพอใจ

รูปแบบการทำงานแบบ “maker-checker” ที่วนซ้ำนี้ออกแบบมาเพื่อเพิ่มความถูกต้อง จัดการกับคำถามที่มีรูปแบบไม่ถูกต้องเมื่อสื่อสารกับฐานข้อมูลที่มีโครงสร้าง (เช่น NL2SQL) และให้ผลลัพธ์ที่สมดุลและมีคุณภาพสูง แทนที่จะพึ่งพาสตริงของ prompt ที่ถูกออกแบบอย่างประณีต ระบบจะเป็นเจ้าของกระบวนการเหตุผลของตนเองอย่างแข็งขัน มันสามารถเขียนคำค้นที่ล้มเหลวใหม่ เลือกวิธีการดึงข้อมูลที่ต่างกัน และผสานรวมหลายเครื่องมือ—เช่น การค้นหาเวกเตอร์ใน Azure AI Search, ฐานข้อมูล SQL, หรือ API แบบกำหนดเอง—ก่อนสรุปคำตอบสุดท้าย นั่นทำให้ไม่จำเป็นต้องมีกรอบการประสานงานที่ซับซ้อนเกินไป แทนที่จะเป็นเช่นนั้น วงจรที่ค่อนข้างเรียบง่ายของ “LLM call → tool use → LLM call → …” ก็สามารถให้ผลลัพธ์ที่ซับซ้อนและมีพื้นฐานดีได้

Agentic RAG Core Loop

Owning the Reasoning Process

คุณสมบัติที่ทำให้ระบบเป็น “agentic” คือความสามารถในการเป็นเจ้าของกระบวนการเหตุผลของตนเอง การใช้งาน RAG แบบดั้งเดิมมักขึ้นอยู่กับการที่มนุษย์กำหนดเส้นทางให้กับโมเดล: chain-of-thought ที่ระบุว่าจะดึงอะไรและเมื่อไร แต่เมื่อระบบเป็น agentic อย่างแท้จริง มันจะตัดสินใจภายในว่าแนวทางแก้ปัญหาควรเป็นอย่างไร มันไม่ได้เพียงแค่รันสคริปต์ แต่กำหนดลำดับขั้นตอนโดยอัตโนมัติตามคุณภาพของข้อมูลที่พบ ตัวอย่างเช่น หากถูกขอให้สร้างกลยุทธ์การเปิดตัวผลิตภัณฑ์ มันจะไม่พึ่งพาเพียง prompt ที่ระบุเวิร์กโฟลว์การวิจัยและการตัดสินใจทั้งหมด แต่โมเดลแบบ agentic จะตัดสินใจด้วยตนเองที่จะ:

Retrieve current market trend reports using Bing Web Grounding
Identify relevant competitor data using Azure AI Search.
Correlate historical internal sales metrics using Azure SQL Database.
Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. ขั้นตอนทั้งหมดเหล่านี้—การปรับคำค้น การเลือกแหล่งข้อมูล การวนซ้ำจนกว่าจะ “พอใจ” กับคำตอบ—ถูกตัดสินโดยโมเดล ไม่ใช่ถูกเขียนสคริปต์ไว้ล่วงหน้าโดยมนุษย์

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

ระบบแบบ agentic พึ่งพารูปแบบการโต้ตอบแบบวนซ้ำ:

Initial Call: เป้าหมายของผู้ใช้ (aka. user prompt) ถูกนำเสนอให้กับ LLM
Tool Invocation: หากโมเดลระบุว่ามีข้อมูลขาดหายหรือคำสั่งไม่ชัดเจน มันจะเลือกเครื่องมือหรือวิธีการดึงข้อมูล—เช่น คำสั่งค้นหาในฐานข้อมูลเวกเตอร์ (เช่น Azure AI Search Hybrid search over private data) หรือการเรียก SQL แบบมีโครงสร้าง—เพื่อรวบรวมบริบทเพิ่มเติม
Assessment & Refinement: หลังจากตรวจสอบข้อมูลที่ส่งคืน โมเดลจะตัดสินใจว่าข้อมูลเพียงพอหรือไม่ หากไม่ มันจะปรับคำค้น ลองใช้เครื่องมืออื่น หรือปรับวิธีการ
Repeat Until Satisfied: วงจรนี้ดำเนินต่อไปจนกว่าโมเดลจะตัดสินใจว่ามีความชัดเจนและหลักฐานเพียงพอที่จะให้คำตอบสุดท้ายที่มีเหตุผลดี
Memory & State: เนื่องจากระบบรักษาสถานะและหน่วยความจำข้ามขั้นตอน จึงสามารถเรียกคืนความพยายามก่อนหน้าและผลลัพธ์ของพวกมัน หลีกเลี่ยงวงจรซ้ำซาก และตัดสินใจโดยมีข้อมูลมากขึ้นเมื่อดำเนินการต่อ

เมื่อเวลาผ่านไป สิ่งนี้สร้างความรู้สึกของความเข้าใจที่พัฒนาไป ทำให้โมเดลสามารถนำทางงานที่ซับซ้อนหลายขั้นตอนได้โดยไม่ต้องให้มนุษย์เข้ามาแทรกแซงหรือปรับ prompt อยู่ตลอด

Handling Failure Modes and Self-Correction

ความเป็นอิสระของ Agentic RAG ยังรวมถึงกลไกการแก้ไขตนเองที่แข็งแกร่ง เมื่อระบบประสบทางตัน—เช่น ดึงเอกสารที่ไม่เกี่ยวข้องหรือพบคำขอที่มีรูปแบบผิดพลาด—มันสามารถ:

Iterate and Re-Query: แทนที่จะส่งคืนคำตอบที่มีค่าต่ำ โมเดลจะพยายามกลยุทธ์การค้นหาใหม่ เขียนคำสั่งฐานข้อมูลใหม่ หรือดูชุดข้อมูลทางเลือก
Use Diagnostic Tools: ระบบอาจเรียกใช้ฟังก์ชันเพิ่มเติมที่ออกแบบมาเพื่อช่วยดีบักขั้นตอนการให้เหตุผลหรือยืนยันความถูกต้องของข้อมูลที่ดึงมา เครื่องมือเช่น Azure AI Tracing จะมีความสำคัญในการเปิดใช้งานการสังเกตการณ์และการติดตามที่แข็งแกร่ง
Fallback on Human Oversight: สำหรับสถานการณ์ที่มีความเสี่ยงสูงหรือเกิดความล้มเหลวซ้ำ ๆ โมเดลอาจทำเครื่องหมายความไม่แน่นอนและขอคำแนะนำจากมนุษย์ เมื่อมนุษย์ให้ข้อเสนอแนะการแก้ไข โมเดลสามารถนำบทเรียนนั้นไปรวมใช้ในอนาคต

แนวทางที่วนซ้ำและไดนามิกนี้ทำให้โมเดลพัฒนาต่อเนื่องได้มั่นใจว่ามันไม่ใช่ระบบแบบครั้งเดียว แต่เป็นระบบที่เรียนรู้จากความผิดพลาดในระหว่างเซสชันที่กำลังดำเนินอยู่

Self Correction Mechanism

Boundaries of Agency

แม้จะมีความเป็นอิสระภายในงาน Agentic RAG ก็ไม่ใช่เทียบเท่ากับ Artificial General Intelligence ความสามารถ “agentic” ของมันจำกัดอยู่ที่เครื่องมือ แหล่งข้อมูล และนโยบายที่มนุษย์นักพัฒนาให้ไว้ มันไม่สามารถประดิษฐ์เครื่องมือของตัวเองหรือก้าวออกนอกขอบเขตโดเมนที่กำหนดไว้ได้ อย่างไรก็ตาม มันโดดเด่นในการประสานทรัพยากรที่มีอยู่แบบไดนามิก ความแตกต่างสำคัญจากรูปแบบ AI ที่ก้าวหน้ากว่ารวมถึง:

Domain-Specific Autonomy: ระบบ Agentic RAG มุ่งเน้นไปที่การบรรลุเป้าหมายที่ผู้ใช้กำหนดภายในโดเมนที่รู้จัก โดยใช้กลยุทธ์อย่างการเขียนคำค้นใหม่หรือการเลือกเครื่องมือเพื่อปรับปรุงผลลัพธ์
Infrastructure-Dependent: ความสามารถของระบบขึ้นอยู่กับเครื่องมือและข้อมูลที่นักพัฒนารวมเข้ามา มันไม่สามารถข้ามขีดจำกัดเหล่านี้ได้โดยปราศจากการแทรกแซงของมนุษย์
Respect for Guardrails: แนวทางจริยธรรม กฎระเบียบ และนโยบายทางธุรกิจยังคงมีความสำคัญอย่างยิ่ง อิสระของเอเยนต์ถูกจำกัดโดยมาตรการความปลอดภัยและกลไกการกำกับดูแลเสมอ (หวังว่าใช่?)

Practical Use Cases and Value

Agentic RAG โดดเด่นในสถานการณ์ที่ต้องการการปรับปรุงแบบวนซ้ำและความแม่นยำ:

Correctness-First Environments: ในการตรวจสอบความสอดคล้อง การวิเคราะห์ระเบียบข้อบังคับ หรือการค้นคว้าทางกฎหมาย โมเดลแบบ agentic สามารถยืนยันข้อเท็จจริงซ้ำ ๆ ปรึกษาหลายแหล่ง และเขียนคำค้นใหม่จนกว่าจะให้คำตอบที่ผ่านการตรวจสอบอย่างละเอียด
Complex Database Interactions: เมื่อทำงานกับข้อมูลมีโครงสร้างที่คำสั่งมักล้มเหลวหรือจำเป็นต้องปรับแก้ ระบบสามารถปรับคำสั่งได้เองโดยอัตโนมัติโดยใช้ Azure SQL หรือ Microsoft Fabric OneLake เพื่อให้การดึงข้อมูลสุดท้ายสอดคล้องกับเจตนาของผู้ใช้
Extended Workflows: เซสชันที่ดำเนินนานอาจพัฒนาไปตามข้อมูลใหม่ที่ปรากฏ Agentic RAG สามารถรวมข้อมูลใหม่อย่างต่อเนื่อง ปรับกลยุทธ์เมื่อเรียนรู้เพิ่มเติมเกี่ยวกับปัญหา

Governance, Transparency, and Trust

เมื่อระบบเหล่านี้มีความเป็นอิสระมากขึ้นในการให้เหตุผล การกำกับดูแลและความโปร่งใสจึงมีความสำคัญ:

Explainable Reasoning: โมเดลสามารถให้เส้นทางการตรวจสอบของคำค้นที่มันทำ แหล่งที่มันปรึกษา และขั้นตอนเหตุผลที่มันใช้เพื่อไปสู่ข้อสรุป เครื่องมือต่าง ๆ เช่น Azure AI Content Safety และ Azure AI Tracing / GenAIOps สามารถช่วยรักษาความโปร่งใสและลดความเสี่ยงได้
Bias Control and Balanced Retrieval: นักพัฒนาสามารถปรับแต่งกลยุทธ์การดึงข้อมูลเพื่อให้พิจารณาแหล่งข้อมูลที่สมดุลและเป็นตัวแทน และตรวจสอบผลลัพธ์เป็นประจำเพื่อตรวจจับความเอนเอียงหรือรูปแบบที่เบ้โดยใช้โมเดลที่กำหนดเองสำหรับองค์กรด้านข้อมูลขั้นสูงที่ใช้ Azure Machine Learning
Human Oversight and Compliance: สำหรับงานที่อ่อนไหว การทบทวนโดยมนุษย์ยังคงจำเป็น Agentic RAG ไม่ได้มาแทนที่การตัดสินใจของมนุษย์ในกรณีที่มีความเสี่ยงสูง แต่เสริมการตัดสินใจโดยการนำเสนอทางเลือกที่ผ่านการตรวจสอบอย่างรอบคอบมากขึ้น

การมีเครื่องมือที่ให้บันทึกการดำเนินการที่ชัดเจนเป็นสิ่งจำเป็น หากไม่มีเครื่องมือเหล่านี้ การดีบักกระบวนการหลายขั้นตอนอาจทำได้ยากมาก ดูตัวอย่างต่อไปนี้จาก Literal AI (company behind Chainlit) สำหรับการรัน Agent:

AgentRunExample

Conclusion

Agentic RAG เป็นวิวัฒนาการที่เป็นธรรมชาติของวิธีที่ระบบ AI จัดการงานที่ซับซ้อนและต้องใช้ข้อมูลมาก ด้วยการยอมรับรูปแบบการโต้ตอบแบบวนซ้ำ การเลือกเครื่องมือโดยอัตโนมัติ และการปรับคำค้นจนกว่าจะได้ผลลัพธ์ที่มีคุณภาพสูง ระบบก้าวข้ามการทำตามคำสั่ง prompt แบบคงที่ไปสู่การเป็นผู้ตัดสินใจที่ปรับตัวเข้ากับบริบทได้มากขึ้น ในขณะที่ยังคงถูกจำกัดโดยโครงสร้างพื้นฐานและแนวทางจริยธรรมที่มนุษย์กำหนด ความสามารถแบบ agentic เหล่านี้เปิดใช้งานการโต้ตอบ AI ที่ลึกกว่า มีไดนามิกมากขึ้น และมีประโยชน์ยิ่งขึ้นสำหรับทั้งองค์กรและผู้ใช้ปลายทาง

Got More Questions about Agentic RAG?

Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.

Additional Resources

เอกสารวิชาการ

บทเรียนก่อนหน้า

รูปแบบการออกแบบการใช้เครื่องมือ

บทเรียนถัดไป

การสร้างเอเยนต์ AI ที่น่าเชื่อถือ

ข้อจำกัดความรับผิดชอบ: เอกสารฉบับนี้ได้รับการแปลโดยใช้บริการแปลภาษาอัตโนมัติ (AI) Co-op Translator (https://github.com/Azure/co-op-translator) แม้เราจะพยายามให้การแปลมีความถูกต้อง โปรดทราบว่าการแปลโดยอัตโนมัติอาจมีข้อผิดพลาดหรือความคลาดเคลื่อน เอกสารต้นฉบับในภาษาต้นทางควรถูกยึดถือเป็นแหล่งข้อมูลที่เป็นหลัก สำหรับข้อมูลที่สำคัญ แนะนำให้ใช้บริการแปลโดยผู้เชี่ยวชาญด้านมนุษย์ เราจะไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่ผิดพลาดที่เกิดจากการใช้การแปลนี้

This site is open source. Improve this page.