ai-agents-for-beginners

Agentic RAG

(คลิกที่ภาพด้านบนเพื่อดูวิดีโอของบทเรียนนี้)

Agentic RAG

บทเรียนนี้ให้ภาพรวมที่ครอบคลุมเกี่ยวกับ Agentic Retrieval-Augmented Generation (Agentic RAG) ซึ่งเป็นแนวทางใหม่ใน AI ที่โมเดลภาษาขนาดใหญ่ (LLMs) สามารถวางแผนขั้นตอนต่อไปได้เองในขณะที่ดึงข้อมูลจากแหล่งภายนอก แตกต่างจากรูปแบบการดึงข้อมูลแบบคงที่ Agentic RAG ใช้การเรียก LLM แบบวนซ้ำ สลับกับการเรียกใช้เครื่องมือหรือฟังก์ชัน และสร้างผลลัพธ์ที่มีโครงสร้าง ระบบจะประเมินผลลัพธ์ ปรับปรุงคำค้นหา เรียกใช้เครื่องมือเพิ่มเติมหากจำเป็น และดำเนินการวนซ้ำนี้จนกว่าจะได้คำตอบที่น่าพอใจ

บทนำ

บทเรียนนี้จะครอบคลุม

เป้าหมายการเรียนรู้

หลังจากจบบทเรียนนี้ คุณจะสามารถ:

Agentic RAG คืออะไร?

Agentic Retrieval-Augmented Generation (Agentic RAG) เป็นแนวทางใหม่ใน AI ที่โมเดลภาษาขนาดใหญ่ (LLMs) สามารถวางแผนขั้นตอนต่อไปได้เองในขณะที่ดึงข้อมูลจากแหล่งภายนอก แตกต่างจากรูปแบบการดึงข้อมูลแบบคงที่ Agentic RAG ใช้การเรียก LLM แบบวนซ้ำ สลับกับการเรียกใช้เครื่องมือหรือฟังก์ชัน และสร้างผลลัพธ์ที่มีโครงสร้าง ระบบจะประเมินผลลัพธ์ ปรับปรุงคำค้นหา เรียกใช้เครื่องมือเพิ่มเติมหากจำเป็น และดำเนินการวนซ้ำนี้จนกว่าจะได้คำตอบที่น่าพอใจ รูปแบบการทำงานแบบ “maker-checker” นี้ช่วยปรับปรุงความถูกต้อง จัดการกับคำค้นหาที่ผิดพลาด และรับรองผลลัพธ์ที่มีคุณภาพสูง

ระบบสามารถควบคุมกระบวนการให้เหตุผลของตัวเองได้อย่างแข็งขัน โดยการเขียนคำค้นหาที่ล้มเหลวใหม่ เลือกวิธีการดึงข้อมูลที่แตกต่าง และรวมเครื่องมือหลายอย่าง เช่น การค้นหาเวกเตอร์ใน Azure AI Search ฐานข้อมูล SQL หรือ API ที่กำหนดเอง ก่อนที่จะสรุปคำตอบ คุณสมบัติที่โดดเด่นของระบบ agentic คือความสามารถในการควบคุมกระบวนการให้เหตุผลของตัวเอง การใช้งาน RAG แบบดั้งเดิมพึ่งพาเส้นทางที่กำหนดไว้ล่วงหน้า แต่ระบบ agentic สามารถกำหนดลำดับขั้นตอนเองได้โดยอิงจากคุณภาพของข้อมูลที่พบ

การนิยาม Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) เป็นแนวทางใหม่ในพัฒนา AI ที่ LLMs ไม่เพียงแต่ดึงข้อมูลจากแหล่งข้อมูลภายนอก แต่ยังสามารถวางแผนขั้นตอนต่อไปได้เอง แตกต่างจากรูปแบบการดึงข้อมูลแบบคงที่หรือการจัดลำดับคำสั่งที่กำหนดไว้อย่างละเอียด Agentic RAG ใช้วงจรการเรียก LLM แบบวนซ้ำ สลับกับการเรียกใช้เครื่องมือหรือฟังก์ชัน และสร้างผลลัพธ์ที่มีโครงสร้าง ในทุกขั้นตอน ระบบจะประเมินผลลัพธ์ที่ได้รับ ตัดสินใจว่าจะปรับปรุงคำค้นหา เรียกใช้เครื่องมือเพิ่มเติมหากจำเป็น และดำเนินการวนซ้ำนี้จนกว่าจะได้คำตอบที่น่าพอใจ

รูปแบบการทำงานแบบ “maker-checker” นี้ออกแบบมาเพื่อปรับปรุงความถูกต้อง จัดการกับคำค้นหาที่ผิดพลาดในฐานข้อมูลที่มีโครงสร้าง (เช่น NL2SQL) และรับรองผลลัพธ์ที่สมดุลและมีคุณภาพสูง แทนที่จะพึ่งพาเพียงการจัดลำดับคำสั่งที่ออกแบบมาอย่างละเอียด ระบบสามารถควบคุมกระบวนการให้เหตุผลของตัวเองได้อย่างแข็งขัน มันสามารถเขียนคำค้นหาที่ล้มเหลวใหม่ เลือกวิธีการดึงข้อมูลที่แตกต่าง และรวมเครื่องมือหลายอย่าง เช่น การค้นหาเวกเตอร์ใน Azure AI Search ฐานข้อมูล SQL หรือ API ที่กำหนดเอง ก่อนที่จะสรุปคำตอบ สิ่งนี้ช่วยลดความจำเป็นในการใช้กรอบการจัดลำดับที่ซับซ้อน แทนที่จะใช้วงจรที่เรียบง่ายของ “การเรียก LLM → การใช้เครื่องมือ → การเรียก LLM → …” เพื่อสร้างผลลัพธ์ที่ซับซ้อนและมีพื้นฐานที่ดี

Agentic RAG Core Loop

การควบคุมกระบวนการให้เหตุผล

คุณสมบัติที่โดดเด่นที่ทำให้ระบบเป็น “agentic” คือความสามารถในการควบคุมกระบวนการให้เหตุผลของตัวเอง การใช้งาน RAG แบบดั้งเดิมมักพึ่งพามนุษย์ในการกำหนดเส้นทางสำหรับโมเดล: เช่น การคิดแบบลำดับขั้นตอนที่ระบุว่าจะดึงข้อมูลอะไรและเมื่อไหร่ แต่เมื่อระบบเป็น agentic จริงๆ มันจะตัดสินใจภายในว่าจะจัดการกับปัญหาอย่างไร มันไม่ได้แค่ทำตามคำสั่ง แต่กำลังตัดสินใจลำดับขั้นตอนเองโดยอิงจากคุณภาพของข้อมูลที่พบ

ตัวอย่างเช่น หากได้รับคำถามเกี่ยวกับการสร้างกลยุทธ์การเปิดตัวผลิตภัณฑ์ มันจะไม่พึ่งพาเพียงคำสั่งที่ระบุขั้นตอนการวิจัยและการตัดสินใจทั้งหมด แต่โมเดล agentic จะตัดสินใจเองว่า:

  1. ดึงรายงานแนวโน้มตลาดปัจจุบันโดยใช้ Bing Web Grounding
  2. ระบุข้อมูลคู่แข่งที่เกี่ยวข้องโดยใช้ Azure AI Search
  3. เชื่อมโยงเมตริกการขายภายในในอดีตโดยใช้ Azure SQL Database
  4. สังเคราะห์ผลลัพธ์เป็นกลยุทธ์ที่สอดคล้องกันผ่าน Azure OpenAI Service
  5. ประเมินกลยุทธ์เพื่อหาช่องว่างหรือความไม่สอดคล้องกัน และเริ่มรอบการดึงข้อมูลใหม่หากจำเป็น

ทุกขั้นตอนเหล่านี้—การปรับปรุงคำค้นหา การเลือกแหล่งข้อมูล การวนซ้ำจนกว่าจะ “พอใจ” กับคำตอบ—ถูกตัดสินใจโดยโมเดล ไม่ใช่ถูกกำหนดไว้ล่วงหน้าโดยมนุษย์

วงจรวนซ้ำ การรวมเครื่องมือ และหน่วยความจำ

Tool Integration Architecture

ระบบ agentic พึ่งพารูปแบบการโต้ตอบแบบวนซ้ำ:

เมื่อเวลาผ่านไป สิ่งนี้สร้างความรู้สึกของความเข้าใจที่พัฒนา ทำให้โมเดลสามารถจัดการกับงานที่ซับซ้อนและหลายขั้นตอนได้โดยไม่ต้องให้มนุษย์แทรกแซงหรือปรับเปลี่ยนคำสั่งอย่างต่อเนื่อง

การจัดการโหมดความล้มเหลวและการแก้ไขตัวเอง

ความเป็นอิสระของ Agentic RAG ยังรวมถึงกลไกการแก้ไขตัวเองที่แข็งแกร่ง เมื่อระบบพบทางตัน เช่น การดึงเอกสารที่ไม่เกี่ยวข้องหรือคำค้นหาที่ผิดพลาด มันสามารถ:

แนวทางที่วนซ้ำและมีพลวัตนี้ช่วยให้โมเดลปรับปรุงอย่างต่อเนื่อง รับรองว่ามันไม่ใช่ระบบที่ทำงานครั้งเดียว แต่เป็นระบบที่เรียนรู้จากข้อผิดพลาดในระหว่างเซสชันที่กำหนด

Self Correction Mechanism

ขอบเขตของความสามารถ

แม้จะมีความเป็นอิสระในงานที่ได้รับมอบหมาย Agentic RAG ไม่ได้เทียบเท่ากับปัญญาประดิษฐ์ทั่วไป ความสามารถ “agentic” ของมันถูกจำกัดอยู่ในเครื่องมือ แหล่งข้อมูล และนโยบายที่นักพัฒนามนุษย์จัดเตรียมไว้ มันไม่สามารถสร้างเครื่องมือของตัวเองหรือก้าวออกนอกขอบเขตโดเมนที่กำหนดไว้ได้ แต่จะมีความโดดเด่นในด้านการจัดการทรัพยากรที่มีอยู่แบบไดนามิก

ความแตกต่างสำคัญจากรูปแบบ AI ที่ก้าวหน้ากว่ารวมถึง:

  1. ความเป็นอิสระเฉพาะโดเมน: ระบบ Agentic RAG มุ่งเน้นไปที่การบรรลุเป้าหมายที่ผู้ใช้กำหนดภายในโดเมนที่รู้จัก โดยใช้กลยุทธ์เช่นการเขียนคำค้นหาใหม่หรือการเลือกเครื่องมือเพื่อปรับปรุงผลลัพธ์
  2. การพึ่งพาโครงสร้างพื้นฐาน: ความสามารถของระบบขึ้นอยู่กับเครื่องมือและข้อมูลที่นักพัฒนารวมไว้ มันไม่สามารถก้าวข้ามขอบเขตเหล่านี้ได้โดยไม่มีการแทรกแซงจากมนุษย์
  3. การเคารพข้อจำกัด: แนวทางจริยธรรม กฎระเบียบการปฏิบัติตาม และนโยบายทางธุรกิจยังคงมีความสำคัญมาก อิสระของระบบจะถูกจำกัดโดยมาตรการความปลอดภัยและกลไกการดูแล (หวังว่า?)

กรณีการใช้งานจริงและคุณค่า

Agentic RAG มีประสิทธิภาพในสถานการณ์ที่ต้องการการปรับปรุงและความแม่นยำแบบวนซ้ำ:

  1. สภาพแวดล้อมที่เน้นความถูกต้อง: ในการตรวจสอบการปฏิบัติตามกฎระเบียบ การวิเคราะห์กฎระเบียบ หรือการวิจัยทางกฎหมาย โมเดล agentic สามารถตรวจสอบข้อเท็จจริงซ้ำๆ ปรึกษาแหล่งข้อมูลหลายแห่ง และเขียนคำค้นหาใหม่จนกว่าจะได้คำตอบที่ผ่านการตรวจสอบอย่างละเอียด
  2. การโต้ตอบกับฐานข้อมูลที่ซับซ้อน: เมื่อจัดการกับข้อมูลที่มีโครงสร้างซึ่งคำค้นหาอาจล้มเหลวบ่อยครั้งหรือจำเป็นต้องปรับปรุง ระบบสามารถปรับปรุงคำค้นหาได้เองโดยใช้ Azure SQL หรือ Microsoft Fabric OneLake เพื่อให้การดึงข้อมูลสุดท้ายสอดคล้องกับเจตนาของผู้ใช้
  3. กระบวนการทำงานที่ยาวนาน: เซสชันที่ดำเนินการนานขึ้นอาจพัฒนาไปตามข้อมูลใหม่ที่ปรากฏขึ้น Agentic RAG สามารถรวมข้อมูลใหม่อย่างต่อเนื่อง ปรับเปลี่ยนกลยุทธ์เมื่อเรียนรู้เพิ่มเติมเกี่ยวกับพื้นที่ปัญหา

การกำกับดูแล ความโปร่งใส และความไว้วางใจ

เมื่อระบบเหล่านี้มีความเป็นอิสระมากขึ้นในกระบวนการให้เหตุผล การกำกับดูแลและความโปร่งใสจึงมีความสำคัญ:

เรียนรู้การใช้งาน Retrieval Augmented Generation (RAG) กับ Azure OpenAI Service: เรียนรู้วิธีการใช้ข้อมูลของคุณเองร่วมกับ Azure OpenAI Service โมดูล Microsoft Learn นี้ให้คำแนะนำที่ครอบคลุมเกี่ยวกับการใช้งาน RAG

งานวิจัยทางวิชาการ

บทเรียนก่อนหน้า

รูปแบบการออกแบบการใช้เครื่องมือ

บทเรียนถัดไป

การสร้าง AI Agents ที่น่าเชื่อถือ


ข้อจำกัดความรับผิดชอบ:
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI Co-op Translator แม้ว่าเราจะพยายามอย่างเต็มที่เพื่อให้การแปลมีความถูกต้อง โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่แม่นยำ เอกสารต้นฉบับในภาษาต้นทางควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลภาษามนุษย์ที่เป็นมืออาชีพ เราจะไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่ผิดพลาดซึ่งเกิดจากการใช้การแปลนี้