ai-agents-for-beginners

Agentic RAG

(Kliknij obraz powyżej, aby obejrzeć wideo z tej lekcji)

Agentic RAG

Ta lekcja przedstawia kompleksowy przegląd Agentic Retrieval-Augmented Generation (Agentic RAG), pojawiającego się paradygmatu AI, w którym duże modele językowe (LLM) samodzielnie planują kolejne kroki, jednocześnie pozyskując informacje z zewnętrznych źródeł. W przeciwieństwie do statycznych wzorców „wyszukaj, a potem odczytaj”, Agentic RAG obejmuje iteracyjne wywołania LLM, przeplatane wywołaniami narzędzi lub funkcji oraz strukturyzowanymi wynikami. System ocenia wyniki, dopracowuje zapytania, wywołuje dodatkowe narzędzia w razie potrzeby i kontynuuje ten cykl, aż osiągnie satysfakcjonujące rozwiązanie.

Wprowadzenie

Ta lekcja obejmie

Cele nauki

Po ukończeniu tej lekcji będziesz wiedzieć/jak rozumieć:

Czym jest Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) to pojawiający się paradygmat w AI, w którym duże modele językowe (LLM) samodzielnie planują kolejne kroki, jednocześnie pobierając informacje z zewnętrznych źródeł. W przeciwieństwie do statycznych wzorców „wyszukaj, a potem odczytaj”, Agentic RAG obejmuje iteracyjne wywołania LLM, przeplatane wywołaniami narzędzi lub funkcji oraz strukturyzowanymi wynikami. System ocenia uzyskane rezultaty, dopracowuje zapytania, w razie potrzeby wywołuje dodatkowe narzędzia i kontynuuje ten cykl, aż osiągnie satysfakcjonujące rozwiązanie. Ten iteracyjny styl „maker-checker” poprawia poprawność, radzi sobie z błędnie sformułowanymi zapytaniami i zapewnia wysoką jakość wyników.

System aktywnie przejmuje odpowiedzialność za swój proces rozumowania, przepisując nieudane zapytania, wybierając inne metody wyszukiwania i integrując wiele narzędzi — takich jak wyszukiwanie wektorowe w Azure AI Search, bazy danych SQL czy niestandardowe API — zanim sfinalizuje swoją odpowiedź. Cechą wyróżniającą systemu agentycznego jest jego zdolność do przejmowania procesu rozumowania. Tradycyjne implementacje RAG opierają się na uprzednio zdefiniowanych ścieżkach, podczas gdy system agentyczny autonomicznie określa sekwencję kroków na podstawie jakości znalezionych informacji.

Definicja Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) to pojawiający się paradygmat w rozwoju AI, w którym LLM nie tylko pobierają informacje z zewnętrznych źródeł danych, ale także autonomicznie planują swoje kolejne kroki. W przeciwieństwie do statycznych wzorców „wyszukaj, a potem odczytaj” lub starannie zaprogramowanych sekwencji poleceń, Agentic RAG obejmuje pętlę iteracyjnych wywołań LLM, przeplataną wywołaniami narzędzi lub funkcji oraz strukturyzowanymi wynikami. Przy każdym kroku system ocenia uzyskane rezultaty, decyduje, czy dopracować zapytania, w razie potrzeby wywołuje dodatkowe narzędzia i kontynuuje ten cykl, aż osiągnie zadowalające rozwiązanie.

Ten iteracyjny styl działania „maker-checker” został zaprojektowany, aby poprawić poprawność, radzić sobie z błędnie sformułowanymi zapytaniami do zorganizowanych baz danych (np. NL2SQL) i zapewnić zrównoważone, wysokiej jakości wyniki. Zamiast polegać wyłącznie na starannie zaprojektowanych łańcuchach promptów, system aktywnie przejmuje proces rozumowania. Może przepisać zapytania, które zawiodły, wybrać inne metody wyszukiwania i zintegrować wiele narzędzi — takich jak wyszukiwanie wektorowe w Azure AI Search, bazy danych SQL czy niestandardowe API — zanim sfinalizuje odpowiedź. To eliminuje potrzebę nadmiernie skomplikowanych ram orkiestracji. Zamiast tego stosunkowo prosta pętla „wywołanie LLM → użycie narzędzia → wywołanie LLM → …” może generować złożone i dobrze ugruntowane wyniki.

Agentic RAG Core Loop

Przejmowanie procesu rozumowania

Cechą wyróżniającą system jako „agentyczny” jest jego zdolność do przejmowania procesu rozumowania. Tradycyjne implementacje RAG często zależą od ludzi, którzy wcześniej definiują ścieżkę dla modelu: łańcuch myślenia, który określa, co i kiedy pobrać. Gdy jednak system jest naprawdę agentyczny, wewnętrznie decyduje, jak podejść do problemu. Nie wykonuje tylko skryptu; autonomicznie określa sekwencję kroków na podstawie jakości znalezionych informacji. Na przykład, jeśli poprosi się go o stworzenie strategii wprowadzenia produktu na rynek, nie będzie polegać wyłącznie na poleceniu, które opisuje cały proces badawczy i podejmowania decyzji. Zamiast tego model agentyczny samodzielnie zdecyduje, by:

  1. Pobierać bieżące raporty o trendach rynkowych przy użyciu Bing Web Grounding
  2. Identyfikować istotne dane o konkurencji przy użyciu Azure AI Search.
  3. Korelować historyczne wewnętrzne metryki sprzedaży przy użyciu Azure SQL Database.
  4. Syntetyzować ustalenia w spójną strategię orkiestrującą za pomocą Azure OpenAI Service.
  5. Oceniać strategię pod kątem luk lub niespójności, wywołując kolejną rundę pobierania informacji w razie potrzeby. Wszystkie te kroki — dopracowywanie zapytań, wybór źródeł, iterowanie aż do „zadowolenia” z odpowiedzi — są decydowane przez model, a nie wstępnie zaprogramowane przez człowieka.

Iteracyjne pętle, integracja narzędzi i pamięć

Tool Integration Architecture

System agentyczny opiera się na wzorcu interakcji w pętli:

Z biegiem czasu tworzy to poczucie ewoluującego zrozumienia, umożliwiając modelowi poruszanie się po złożonych, wieloetapowych zadaniach bez konieczności stałej interwencji człowieka lub przekształcania polecenia.

Obsługa trybów awaryjnych i samokorekta

Autonomia Agentic RAG obejmuje również solidne mechanizmy samokorekty. Gdy system napotyka ślepe uliczki — na przykład pobiera nieistotne dokumenty lub napotyka błędnie sformułowane zapytania — może:

To iteracyjne i dynamiczne podejście pozwala modelowi na ciągłe doskonalenie, zapewniając, że nie jest to system jednorazowy, lecz taki, który uczy się na podstawie popełnionych błędów w trakcie danej sesji.

Self Correction Mechanism

Granice agencji

Pomimo autonomii w obrębie zadania, Agentic RAG nie jest równoważny z Ogólną Sztuczną Inteligencją. Jego zdolności „agentyczne” są ograniczone do narzędzi, źródeł danych i polityk dostarczonych przez ludzi. Nie może wymyślać własnych narzędzi ani wychodzić poza ustalone granice domeny. Zamiast tego świetnie sprawdza się w dynamicznej orkiestracji dostępnych zasobów. Kluczowe różnice w porównaniu z bardziej zaawansowanymi formami AI obejmują:

  1. Autonomia specyficzna dla domeny: Systemy Agentic RAG koncentrują się na osiąganiu celów zdefiniowanych przez użytkownika w znanej domenie, stosując strategie takie jak przepisywanie zapytań czy wybór narzędzi, aby poprawić wyniki.
  2. Zależność od infrastruktury: Możliwości systemu zależą od narzędzi i danych zintegrowanych przez programistów. Nie może przekroczyć tych granic bez interwencji człowieka.
  3. Poszanowanie ograniczeń: Wytyczne etyczne, zasady zgodności i polityki biznesowe pozostają bardzo ważne. Wolność agenta jest zawsze ograniczona przez środki bezpieczeństwa i mechanizmy nadzoru (miejmy nadzieję).

Praktyczne przypadki użycia i wartość

Agentic RAG wyróżnia się w scenariuszach wymagających iteracyjnego dopracowywania i precyzji:

  1. Środowiska stawiające na poprawność: W kontrolach zgodności, analizie regulacyjnej czy badaniach prawnych model agentyczny może wielokrotnie weryfikować fakty, konsultować wiele źródeł i przepisywać zapytania, aż wygeneruje gruntownie sprawdzoną odpowiedź.
  2. Złożone interakcje z bazami danych: W przypadku pracy z danymi strukturyzowanymi, gdzie zapytania często mogą zawodzić lub wymagać dostosowania, system może autonomicznie dopracowywać zapytania przy użyciu Azure SQL lub Microsoft Fabric OneLake, zapewniając, że ostateczne pobranie danych odpowiada intencji użytkownika.
  3. Rozbudowane przepływy pracy: Sesje trwające dłużej mogą ewoluować w miarę pojawiania się nowych informacji. Agentic RAG może ciągle integrować nowe dane, zmieniając strategie w miarę zdobywania wiedzy o przestrzeni problemowej.

Zarządzanie, przejrzystość i zaufanie

W miarę jak systemy te stają się bardziej autonomiczne w swoim rozumowaniu, zarządzanie i przejrzystość są kluczowe:

Posiadanie narzędzi, które dostarczają jasny zapis działań, jest niezbędne. Bez nich debugowanie procesu wieloetapowego może być bardzo trudne. Zobacz następujący przykład od Literal AI (firma stojąca za Chainlit) dla uruchomienia agenta:

AgentRunExample

Zakończenie

Agentic RAG reprezentuje naturalną ewolucję w sposobie, w jaki systemy AI radzą sobie ze złożonymi, intensywnymi danych zadaniami. Dzięki przyjęciu wzorca interakcji w pętli, autonomicznemu wybieraniu narzędzi i dopracowywaniu zapytań aż do osiągnięcia wysokiej jakości wyniku, system wykracza poza statyczne wykonywanie poleceń w kierunku bardziej adaptacyjnego, świadomego kontekstu decydenta. Choć nadal ograniczony przez infrastrukturę zdefiniowaną przez ludzi i wytyczne etyczne, te agentyczne możliwości umożliwiają bogatsze, bardziej dynamiczne i ostatecznie bardziej użyteczne interakcje AI zarówno dla przedsiębiorstw, jak i użytkowników końcowych.

Masz więcej pytań o Agentic RAG?

Dołącz do Microsoft Foundry Discord, aby spotkać innych uczących się, uczestniczyć w godzinach konsultacji i uzyskać odpowiedzi na swoje pytania dotyczące AI Agents.

Dodatkowe zasoby

Academic Papers

Previous Lesson

Wzorzec projektowy użycia narzędzi

Next Lesson

Budowanie godnych zaufania agentów AI


Zastrzeżenie: Ten dokument został przetłumaczony przy użyciu usługi tłumaczenia AI Co-op Translator. Chociaż dokładamy starań, aby zapewnić dokładność, proszę pamiętać, że tłumaczenia automatyczne mogą zawierać błędy lub nieścisłości. Oryginalny dokument w języku źródłowym należy uznać za źródło wiążące. W przypadku informacji o istotnym znaczeniu zaleca się skorzystanie z profesjonalnego tłumaczenia wykonanego przez człowieka. Nie ponosimy odpowiedzialności za jakiekolwiek nieporozumienia lub błędne interpretacje wynikające z korzystania z tego tłumaczenia.