ai-agents-for-beginners

Memoria para Agentes de IA

Al hablar de los beneficios únicos de crear Agentes de IA, se discuten principalmente dos cosas: la capacidad de llamar a herramientas para completar tareas y la capacidad de mejorar con el tiempo. La memoria es la base para crear agentes auto-mejorables que pueden crear mejores experiencias para nuestros usuarios.

En esta lección, veremos qué es la memoria para los Agentes de IA y cómo podemos gestionarla y usarla en beneficio de nuestras aplicaciones.

Introducción

Esta lección cubrirá:

• Comprender la Memoria de los Agentes de IA: Qué es la memoria y por qué es esencial para los agentes.

• Implementación y Almacenamiento de Memoria: Métodos prácticos para agregar capacidades de memoria a tus agentes de IA, enfocándose en la memoria a corto y largo plazo.

• Hacer que los Agentes de IA Sean Auto-Mejorables: Cómo la memoria permite a los agentes aprender de interacciones pasadas y mejorar con el tiempo.

Implementaciones Disponibles

Esta lección incluye dos tutoriales completos en cuadernos:

• 13-agent-memory.ipynb: Implementa memoria usando Mem0 y Azure AI Search con Microsoft Agent Framework

• 13-agent-memory-cognee.ipynb: Implementa memoria estructurada usando Cognee, construyendo automáticamente gráficos de conocimiento respaldados por incrustaciones, visualizando el gráfico y recuperación inteligente

Objetivos de Aprendizaje

Al completar esta lección, sabrás cómo:

• Diferenciar entre varios tipos de memoria de agentes de IA, incluyendo memoria de trabajo, a corto plazo y a largo plazo, así como formas especializadas como memoria de persona y episódica.

• Implementar y gestionar memoria a corto y largo plazo para agentes de IA usando Microsoft Agent Framework, aprovechando herramientas como Mem0, Cognee, memoria de pizarra y la integración con Azure AI Search.

• Comprender los principios detrás de los agentes de IA auto-mejorables y cómo los sistemas robustos de gestión de memoria contribuyen al aprendizaje continuo y la adaptación.

Entendiendo la Memoria de los Agentes de IA

En esencia, la memoria para agentes de IA se refiere a los mecanismos que les permiten retener y recordar información. Esta información puede ser detalles específicos sobre una conversación, preferencias del usuario, acciones pasadas o incluso patrones aprendidos.

Sin memoria, las aplicaciones de IA suelen ser sin estado, lo que significa que cada interacción comienza desde cero. Esto conduce a una experiencia de usuario repetitiva y frustrante donde el agente “olvida” el contexto o las preferencias anteriores.

¿Por qué es Importante la Memoria?

La inteligencia de un agente está profundamente vinculada a su capacidad para recordar y utilizar información pasada. La memoria permite que los agentes sean:

• Reflexivos: Aprendiendo de acciones y resultados pasados.

• Interactivos: Manteniendo el contexto durante una conversación continua.

• Proactivos y Reactivos: Anticipando necesidades o respondiendo apropiadamente basándose en datos históricos.

• Autónomos: Operando de manera más independiente al aprovechar el conocimiento almacenado.

El objetivo de implementar memoria es hacer que los agentes sean más confiables y capaces.

Tipos de Memoria

Memoria de Trabajo

Piensa en esto como un trozo de papel para hacer bocetos que un agente usa durante una tarea o proceso de pensamiento único y en curso. Retiene la información inmediata necesaria para calcular el siguiente paso.

Para los agentes de IA, la memoria de trabajo a menudo captura la información más relevante de una conversación, incluso si el historial completo del chat es largo o truncado. Se enfoca en extraer elementos clave como requisitos, propuestas, decisiones y acciones.

Ejemplo de Memoria de Trabajo

En un agente de reserva de viajes, la memoria de trabajo podría capturar la solicitud actual del usuario, como “Quiero reservar un viaje a París”. Este requisito específico se mantiene en el contexto inmediato del agente para guiar la interacción actual.

Memoria a Corto Plazo

Este tipo de memoria retiene información durante la duración de una sola conversación o sesión. Es el contexto del chat actual, que permite al agente referirse a turnos anteriores en el diálogo.

En los ejemplos del SDK Python del Microsoft Agent Framework, esto se asigna a AgentSession, creada con agent.create_session(). La sesión es la memoria a corto plazo incorporada del framework: mantiene el contexto de la conversación disponible mientras se reutiliza esa misma sesión, pero ese contexto no se persiste cuando la sesión termina o la aplicación se reinicia. Usa memoria a largo plazo para hechos y preferencias que necesitan sobrevivir entre sesiones, típicamente a través de una base de datos, índice vectorial u otro almacenamiento persistente.

Ejemplo de Memoria a Corto Plazo

Si un usuario pregunta, “¿Cuánto costaría un vuelo a París?” y luego sigue con “¿Qué hay del alojamiento allí?”, la memoria a corto plazo asegura que el agente sepa que “allí” se refiere a “París” dentro de la misma conversación.

Memoria a Largo Plazo

Esta es información que persiste a través de múltiples conversaciones o sesiones. Permite a los agentes recordar preferencias de usuario, interacciones históricas o conocimiento general durante períodos extendidos. Esto es importante para la personalización.

Ejemplo de Memoria a Largo Plazo

Una memoria a largo plazo podría almacenar que “Ben disfruta del esquí y actividades al aire libre, le gusta el café con vista a la montaña y quiere evitar pistas de esquí avanzadas debido a una lesión pasada”. Esta información, aprendida de interacciones previas, influye en las recomendaciones en futuras sesiones de planificación de viajes, haciéndolas altamente personalizadas.

Memoria de Persona

Este tipo de memoria especializada ayuda a un agente a desarrollar una “personalidad” o “persona” consistente. Permite que el agente recuerde detalles sobre sí mismo o su rol previsto, haciendo las interacciones más fluidas y enfocadas.

Ejemplo de Memoria de Persona Si el agente de viajes está diseñado para ser un “planificador experto en esquí”, la memoria de persona podría reforzar este rol, influyendo en sus respuestas para alinearlas con el tono y conocimiento de un experto.

Memoria de Flujo de Trabajo/Episódica

Esta memoria almacena la secuencia de pasos que un agente realiza durante una tarea compleja, incluyendo éxitos y fracasos. Es como recordar “episodios” o experiencias pasadas para aprender de ellos.

Ejemplo de Memoria Episódica

Si el agente intentó reservar un vuelo específico pero falló debido a la falta de disponibilidad, la memoria episódica podría registrar este fallo, permitiendo al agente intentar vuelos alternativos o informar al usuario sobre el problema de manera más informada en un intento posterior.

Memoria de Entidad

Esto implica extraer y recordar entidades específicas (como personas, lugares o cosas) y eventos de las conversaciones. Permite al agente construir un entendimiento estructurado de los elementos clave discutidos.

Ejemplo de Memoria de Entidad

De una conversación sobre un viaje pasado, el agente podría extraer “París”, “Torre Eiffel” y “cena en el restaurante Le Chat Noir” como entidades. En una interacción futura, el agente podría recordar “Le Chat Noir” y ofrecer hacer una nueva reserva ahí.

RAG Estructurado (Generación Aumentada por Recuperación)

Aunque RAG es una técnica más amplia, “RAG Estructurado” se destaca como una tecnología de memoria poderosa. Extrae información densa y estructurada de varias fuentes (conversaciones, correos electrónicos, imágenes) y la usa para mejorar la precisión, recuperación y velocidad en las respuestas. A diferencia del RAG clásico que se basa solo en similitud semántica, el RAG Estructurado trabaja con la estructura inherente de la información.

Ejemplo de RAG Estructurado

En lugar de solo emparejar palabras clave, el RAG Estructurado podría analizar detalles de vuelo (destino, fecha, hora, aerolínea) de un correo electrónico y almacenarlos de manera estructurada. Esto permite consultas precisas como “¿Qué vuelo reservé a París el martes?”

Implementación y Almacenamiento de Memoria

Implementar memoria para agentes de IA implica un proceso sistemático de gestión de memoria, que incluye generar, almacenar, recuperar, integrar, actualizar e incluso “olvidar” (o eliminar) información. La recuperación es un aspecto particularmente crucial.

Herramientas Especializadas de Memoria

Mem0

Una forma de almacenar y gestionar la memoria del agente es usando herramientas especializadas como Mem0. Mem0 funciona como una capa de memoria persistente, permitiendo que los agentes recuerden interacciones relevantes, almacenen preferencias de usuario y contexto factual, y aprendan de éxitos y fracasos con el tiempo. La idea aquí es que los agentes sin estado se conviertan en agentes con estado.

Funciona a través de una tubería de memoria en dos fases: extracción y actualización. Primero, los mensajes añadidos al hilo de un agente son enviados al servicio Mem0, que usa un Modelo de Lenguaje Grande (LLM) para resumir el historial de conversación y extraer nuevas memorias. Posteriormente, una fase de actualización impulsada por LLM determina si añadir, modificar o eliminar estas memorias, almacenándolas en un almacén de datos híbrido que puede incluir bases de datos vectoriales, gráficas y de clave-valor. Este sistema también soporta varios tipos de memoria y puede incorporar memoria gráfica para gestionar relaciones entre entidades.

Cognee

Otro enfoque poderoso es usar Cognee, una memoria semántica de código abierto para agentes de IA que transforma datos estructurados y no estructurados en gráficos de conocimiento consultables respaldados por incrustaciones. Cognee proporciona una arquitectura de doble almacenamiento combinando búsqueda de similitud vectorial con relaciones gráficas, permitiendo a los agentes entender no solo qué información es similar, sino cómo se relacionan los conceptos entre sí.

Sobresale en recuperación híbrida que mezcla similitud vectorial, estructura gráfica y razonamiento LLM — desde búsqueda de fragmentos brutos hasta preguntas conscientes del gráfico. El sistema mantiene una memoria viva que evoluciona y crece mientras permanece consultable como un gráfico conectado, soportando tanto contexto de sesión a corto plazo como memoria persistente a largo plazo.

El tutorial del cuaderno de Cognee (13-agent-memory-cognee.ipynb) demuestra cómo construir esta capa unificada de memoria, con ejemplos prácticos de ingesta de diversas fuentes de datos, visualización del gráfico de conocimiento y consultas con diferentes estrategias de búsqueda adaptadas a necesidades específicas del agente.

Almacenamiento de Memoria con RAG

Más allá de las herramientas especializadas de memoria como Mem0, puedes aprovechar servicios robustos de búsqueda como Azure AI Search como backend para almacenar y recuperar memorias, especialmente para RAG estructurado.

Esto te permite fundamentar las respuestas de tu agente con tus propios datos, asegurando respuestas más relevantes y precisas. Azure AI Search puede usarse para almacenar memorias de viaje específicas del usuario, catálogos de productos o cualquier otro conocimiento específico del dominio.

Azure AI Search soporta capacidades como RAG Estructurado, que sobresale en extraer y recuperar información densa y estructurada de grandes conjuntos de datos como historiales de conversación, correos electrónicos o incluso imágenes. Esto proporciona “precisión y retrievabilidad sobrehumana” comparado con enfoques tradicionales de fragmentación de texto e incrustaciones.

Cómo Hacer que los Agentes de IA se Auto-Mejoren

Un patrón común para agentes auto-mejorables involucra introducir un “agente de conocimiento”. Este agente separado observa la conversación principal entre el usuario y el agente principal. Su rol es:

Identificar información valiosa: Determinar si alguna parte de la conversación vale la pena guardar como conocimiento general o preferencia específica del usuario.
Extraer y resumir: Destilar el aprendizaje o preferencia esencial de la conversación.
Almacenar en una base de conocimiento: Persistir esta información extraída, a menudo en una base de datos vectorial, para que pueda recuperarse luego.
Aumentar consultas futuras: Cuando el usuario inicia una nueva consulta, el agente de conocimiento recupera información almacenada relevante y la añade al aviso del usuario, proporcionando contexto crucial al agente principal (similar a RAG).

Optimizaciones para la Memoria

• Gestión de Latencia: Para evitar ralentizar las interacciones del usuario, se puede usar inicialmente un modelo más barato y rápido para verificar rápidamente si la información es valiosa de almacenar o recuperar, solo invocando el proceso más complejo de extracción/recuperación cuando sea necesario.

• Mantenimiento de la Base de Conocimiento: Para una base de conocimiento en crecimiento, la información menos utilizada con frecuencia puede moverse a un “almacenamiento frío” para gestionar costos.

¿Tienes Más Preguntas Sobre la Memoria de Agentes?

Únete al Discord de Microsoft Foundry para reunirte con otros aprendices, asistir a horas de oficina y obtener respuestas a tus preguntas sobre Agentes de IA.

Lección Anterior

Ingeniería de Contexto para Agentes de IA

Próxima Lección

Explorando Microsoft Agent Framework

Descargo de responsabilidad: Este documento ha sido traducido utilizando el servicio de traducción automática Co-op Translator. Aunque nos esforzamos por la precisión, tenga en cuenta que las traducciones automatizadas pueden contener errores o inexactitudes. El documento original en su idioma nativo debe considerarse la fuente autorizada. Para información crítica, se recomienda una traducción profesional humana. No somos responsables de cualquier malentendido o interpretación errónea que surja del uso de esta traducción.

This site is open source. Improve this page.