# Construindo Agentes de IA com Mem√≥ria Persistente usando Cognee

Este notebook demonstra como construir agentes de IA inteligentes com capacidades sofisticadas de mem√≥ria usando [**cognee**](https://www.cognee.ai/) - uma mem√≥ria de IA de c√≥digo aberto que combina grafos de conhecimento, busca sem√¢ntica e gerenciamento de sess√µes para criar sistemas de IA conscientes de contexto.

## üéØ Objetivos de Aprendizado

Ao final deste tutorial, voc√™ entender√° como:
- **Construir Grafos de Conhecimento Baseados em Embeddings**: Transformar texto n√£o estruturado em conhecimento estruturado e consult√°vel
- **Implementar Mem√≥ria de Sess√£o**: Criar conversas de m√∫ltiplas intera√ß√µes com reten√ß√£o autom√°tica de contexto
- **Persistir Conversas**: Opcionalmente armazenar intera√ß√µes importantes em mem√≥ria de longo prazo para refer√™ncia futura
- **Consultar Usando Linguagem Natural**: Acessar e aproveitar o contexto hist√≥rico em novas conversas
- **Visualizar Mem√≥ria**: Explorar os relacionamentos no grafo de conhecimento do seu agente


## üèóÔ∏è O que voc√™ vai construir

Neste tutorial, vamos criar um **Assistente de Codifica√ß√£o** com mem√≥ria persistente que:

### 1. **Constru√ß√£o de Base de Conhecimento**
   - Ingere informa√ß√µes sobre o perfil e a expertise do desenvolvedor
   - Processa princ√≠pios e boas pr√°ticas de programa√ß√£o em Python
   - Armazena conversas hist√≥ricas entre desenvolvedores e assistentes de IA

### 2. **Conversas com Contexto de Sess√£o**
   - Mant√©m o contexto ao longo de v√°rias perguntas na mesma sess√£o
   - Armazena automaticamente cada par de pergunta/resposta para recupera√ß√£o eficiente
   - Fornece respostas coerentes e contextuais com base no hist√≥rico da conversa

### 3. **Mem√≥ria de Longo Prazo**
   - Persiste conversas importantes em uma mem√≥ria de longo prazo
   - Recupera mem√≥rias relevantes da base de conhecimento e sess√µes anteriores para informar novas intera√ß√µes
   - Constr√≥i uma base de conhecimento crescente que melhora com o tempo

### 4. **Recupera√ß√£o Inteligente de Mem√≥ria**
   - Utiliza busca sem√¢ntica baseada em grafos para encontrar informa√ß√µes relevantes em todo o conhecimento armazenado
   - Filtra buscas por subgrupos de dados (informa√ß√µes do desenvolvedor vs. princ√≠pios)
   - Combina m√∫ltiplas fontes de dados para fornecer respostas abrangentes


## üìã Pr√©-requisitos e Configura√ß√£o

### Requisitos do Sistema

Antes de come√ßar, certifique-se de ter:

1. **Ambiente Python**
   - Python 3.9 ou superior
   - Ambiente virtual (recomendado)
   
2. **Cache Redis** (Necess√°rio para Gerenciamento de Sess√£o)
   - Redis local: `docker run -d -p 6379:6379 redis`
   - Ou use um servi√ßo Redis gerenciado
   
3. **Acesso √† API LLM**
   - Chave de API OpenAI ou outros provedores (veja [documenta√ß√£o](https://docs.cognee.ai/setup-configuration/llm-providers))

4. **Configura√ß√£o de Banco de Dados**
   - Nenhuma configura√ß√£o necess√°ria por padr√£o. Cognee utiliza bancos de dados baseados em arquivos (LanceDB e Kuzu)
   - Opcionalmente, voc√™ pode configurar o Azure AI Search como um armazenamento vetorial (veja [documenta√ß√£o](https://github.com/topoteretes/cognee-community/tree/main/packages/vector/azureaisearch))

### Configura√ß√£o do Ambiente

Crie um arquivo `.env` no diret√≥rio do seu projeto com as seguintes vari√°veis:

```ini
# LLM Configuration (Required)
LLM_API_KEY=your-openai-api-key-here

# Cache Configuration (Required for Sessions)
CACHING=true  # Must be enabled for session history

```


## üèõÔ∏è Entendendo a Arquitetura de Mem√≥ria do Cognee

### Como o Cognee Funciona

O Cognee oferece um sistema de mem√≥ria sofisticado que vai al√©m do simples armazenamento de chave-valor:

```
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ      30+ data sources    ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
            ‚îÇ
            ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ  Dynamically evolving memory layers      ‚îÇ
‚îÇ                                          ‚îÇ
‚îÇ  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê  ‚îÇ
‚îÇ  ‚îÇ Knowledge Graph in Graph Database  ‚îÇ  ‚îÇ
‚îÇ  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò  ‚îÇ
‚îÇ  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê  ‚îÇ
‚îÇ  ‚îÇ Embeddings in Vector Store         ‚îÇ  ‚îÇ
‚îÇ  ‚îÇ   (e.g., Azure AI Search)          ‚îÇ  ‚îÇ
‚îÇ  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò  ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
            ‚îÇ                      ‚ñ≤   
            ‚ñº                      ‚îÇ(optional)
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê           ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ     cognee     ‚îÇ(optional) ‚îÇ Cognee Session ‚îÇ
‚îÇ    retrievers  ‚îÇ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñ∂‚îÇ     Cache      ‚îÇ
‚îÇ                ‚îÇ           ‚îÇ    (Redis)     ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò           ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
        ‚ñ≤
        ‚îÇ
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ          Agents          ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

```

### Componentes Principais:

1. **Knowledge Graph (Grafo de Conhecimento)**: Armazena entidades, relacionamentos e conex√µes sem√¢nticas
2. **Vector Embeddings (Vetores de Embedding)**: Permite busca sem√¢ntica em todas as informa√ß√µes armazenadas
3. **Session Cache (Cache de Sess√£o)**: Mant√©m o contexto da conversa dentro e entre sess√µes
4. **NodeSets**: Organiza os dados em categorias l√≥gicas para recupera√ß√£o direcionada

### Tipos de Mem√≥ria Neste Tutorial:

- **Mem√≥ria Persistente**: Armazenamento de longo prazo no grafo de conhecimento
- **Mem√≥ria de Sess√£o**: Contexto tempor√°rio da conversa no cache Redis
- **Mem√≥ria Sem√¢ntica**: Busca baseada em similaridade vetorial em todos os dados


## üì¶ Instalar Pacotes Necess√°rios

Instale o Cognee com suporte ao Redis para gerenciamento de sess√µes:


In [None]:
!pip install --quiet "cognee[redis]==0.4.0"

## üîß Inicializar Ambiente e Carregar Bibliotecas

Certifique-se de que:
1. O Redis est√° em execu√ß√£o (por exemplo, via Docker: `docker run -d -p 6379:6379 redis`)
2. As vari√°veis de ambiente est√£o configuradas antes de importar os m√≥dulos de cache
3. Se necess√°rio, reinicie o kernel e execute as c√©lulas na ordem

A c√©lula a seguir ir√°:
1. Carregar vari√°veis de ambiente do arquivo `.env`
2. Configurar o Cognee com suas configura√ß√µes de LLM
3. Habilitar o cache para gerenciamento de sess√£o
4. Validar se todos os componentes est√£o devidamente conectados


In [None]:
import os
from pathlib import Path

from dotenv import load_dotenv

# Load environment variables
load_dotenv()

# cognee Configuration
os.environ["LLM_API_KEY"] = os.getenv("LLM_API_KEY", None)
os.environ["CACHING"] = os.getenv("CACHING", "true")


import cognee

print(f"Cognee version: {cognee.__version__}")
print(f"CACHING: {os.environ.get('CACHING')}")
print(f"LLM_API_KEY: {os.environ.get('LLM_API_KEY')}")

## üìÅ Configurar Diret√≥rios de Armazenamento

O Cognee utiliza dois diret√≥rios separados para suas opera√ß√µes:
- **Raiz de Dados**: Armazena documentos ingeridos e dados processados
- **Raiz do Sistema**: Cont√©m o banco de dados do grafo de conhecimento e os metadados do sistema

Vamos criar diret√≥rios isolados para este tutorial da seguinte forma:


In [None]:
DATA_ROOT = Path('.data_storage').resolve()
SYSTEM_ROOT = Path('.cognee_system').resolve()

DATA_ROOT.mkdir(parents=True, exist_ok=True)
SYSTEM_ROOT.mkdir(parents=True, exist_ok=True)

cognee.config.data_root_directory(str(DATA_ROOT))
cognee.config.system_root_directory(str(SYSTEM_ROOT))

print(f"Data root: {DATA_ROOT}")
print(f"System root: {SYSTEM_ROOT}")

## üßπ Redefinir Estado de Mem√≥ria

Antes de come√ßarmos a construir nosso sistema de mem√≥ria, vamos garantir que estamos come√ßando do zero.

> üí° **Dica**: Voc√™ pode pular esta etapa se quiser preservar as mem√≥rias existentes de execu√ß√µes anteriores ao usar este notebook novamente.


In [None]:
await cognee.prune.prune_data()
await cognee.prune.prune_system(metadata=True)
print('Cleared previous Cognee state.')

## üìö Parte 1: Construindo a Base de Conhecimento

### Fontes de Dados para Nosso Assistente de Desenvolvedor

Vamos utilizar tr√™s tipos de dados para criar uma base de conhecimento abrangente:

1. **Perfil do Desenvolvedor**: Experi√™ncia pessoal e hist√≥rico t√©cnico
2. **Melhores Pr√°ticas em Python**: O Zen do Python com diretrizes pr√°ticas
3. **Conversas Hist√≥ricas**: Sess√µes de perguntas e respostas anteriores entre desenvolvedores e assistentes de IA

Esses dados diversificados permitem que nosso agente:
- Compreenda o contexto t√©cnico do usu√°rio
- Aplique as melhores pr√°ticas nas recomenda√ß√µes
- Aprenda com intera√ß√µes bem-sucedidas anteriores


In [None]:
developer_intro = (
  "Hi, I'm an AI/Backend engineer. "
  "I build FastAPI services with Pydantic, heavy asyncio/aiohttp pipelines, "
  "and production testing via pytest-asyncio. "
  "I've shipped low-latency APIs on AWS, Azure, and GoogleCloud."
)

python_zen_principles = (
  """
    # The Zen of Python: Practical Guide

    ## Overview
    Use these principles as a checklist during design, coding, and reviews.

    ## Key Principles With Guidance

    ### 1. Beautiful is better than ugly
    Prefer descriptive names, clear structure, and consistent formatting.

    ### 2. Explicit is better than implicit
    Be clear about behavior, imports, and types.
    ```python
    from datetime import datetime, timedelta

    def get_future_date(days_ahead: int) -> datetime:
        return datetime.now() + timedelta(days=days_ahead)
    ```

    ### 3. Simple is better than complex
    Choose straightforward solutions first.

    ### 4. Complex is better than complicated
    When complexity is needed, organize it with clear abstractions.

    ### 5. Flat is better than nested
    Use early returns to reduce indentation.

    ## Modern Python Tie-ins
    - Type hints reinforce explicitness
    - Context managers enforce safe resource handling
    - Dataclasses improve readability for data containers

    ## Quick Review Checklist
    - Is it readable and explicit?
    - Is this the simplest working solution?
    - Are errors explicit and logged?
    - Are modules/namespaces used appropriately?
  """
)

human_agent_conversations = (
  """
  "conversations": [
      {
        "id": "conv_001",
        "timestamp": "2024-01-15T10:30:00Z",
        "topic": "async/await patterns",
        "user_query": "I'm building a web scraper that needs to handle thousands of URLs concurrently. What's the best way to structure this with asyncio?",
        "assistant_response": "Use asyncio with aiohttp, a semaphore to cap concurrency, TCPConnector for connection pooling, context managers for session lifecycle, and robust exception handling for failed requests.",
        "code_context": {
          "file": "scraper.py",
          "language": "python",
          "patterns_discussed": ["async/await", "context_managers", "semaphores", "aiohttp", "error_handling"]
        },
        "follow_up_questions": [
          "How do I add retry logic for failed requests?",
          "What's the best way to parse the scraped HTML content?"
        ]
      },
      {
        "id": "conv_002",
        "timestamp": "2024-01-16T14:20:00Z",
        "topic": "dataclass vs pydantic",
        "user_query": "When should I use dataclasses vs Pydantic models? I'm building an API and need to handle user input validation.",
        "assistant_response": "For API input/output, prefer Pydantic: it provides runtime validation, type coercion, JSON serialization, enums for roles, field constraints, and custom validators; integrates cleanly with FastAPI for automatic request validation and error reporting.",
        "code_context": {
          "file": "models.py",
          "language": "python",
          "patterns_discussed": ["pydantic", "dataclasses", "validation", "fastapi", "type_hints", "enums"]
        },
        "follow_up_questions": [
          "How do I handle nested validation with Pydantic?",
          "Can I use Pydantic with SQLAlchemy models?"
        ]
      },
      {
        "id": "conv_003",
        "timestamp": "2024-01-17T09:15:00Z",
        "topic": "testing patterns",
        "user_query": "I'm struggling with testing async code and database interactions. What's the best approach for pytest with async functions?",
        "assistant_response": "Recommended using pytest-asyncio, async fixtures, and an isolated test database or mocks to reliably test async functions and database interactions in FastAPI.",
        "code_context": {
          "file": "test_users.py",
          "language": "python",
          "patterns_discussed": ["pytest", "async_testing", "fixtures", "mocking", "database_testing", "fastapi_testing"]
        },
        "follow_up_questions": [
          "How do I test WebSocket connections?",
          "What's the best way to test database migrations?"
        ]
      },
      {
        "id": "conv_004",
        "timestamp": "2024-01-18T16:45:00Z",
        "topic": "performance optimization",
        "user_query": "My FastAPI app is getting slow with large datasets. How can I optimize database queries and response times?",
        "assistant_response": "Suggested optimizing database queries (indexes, pagination, selecting only needed columns), adding caching, streaming or chunked responses for large datasets, background tasks for heavy work, and monitoring to find bottlenecks.",
        "code_context": {
          "file": "optimizations.py",
          "language": "python",
          "patterns_discussed": ["performance_optimization", "caching", "database_optimization", "async_patterns", "monitoring"]
        },
        "follow_up_questions": [
          "How do I implement database connection pooling properly?",
          "What's the best way to handle memory usage with large datasets?"
        ]
      },
      {
        "id": "conv_005",
        "timestamp": "2024-01-19T11:30:00Z",
        "topic": "error handling and logging",
        "user_query": "I need to implement proper error handling and logging across my Python application. What's the best approach for production-ready error management?",
        "assistant_response": "Proposed centralized error handling with custom exceptions, structured logging, FastAPI middleware or decorators, and integration points for external monitoring/alerting tools.",
        "code_context": {
          "file": "error_handling.py",
          "language": "python",
          "patterns_discussed": ["error_handling", "logging", "exceptions", "middleware", "decorators", "fastapi"]
        },
        "follow_up_questions": [
          "How do I integrate this with external monitoring tools like Sentry?",
          "What's the best way to handle errors in background tasks?"
        ]
      }
    ],
    "metadata": {
      "total_conversations": 5,
      "date_range": "2024-01-15 to 2024-01-19",
      "topics_covered": [
        "async/await patterns",
        "dataclass vs pydantic",
        "testing patterns",
        "performance optimization",
        "error handling and logging"
      ],
      "code_patterns_discussed": [
        "asyncio", "aiohttp", "semaphores", "context_managers",
        "pydantic", "fastapi", "type_hints", "validation",
        "pytest", "async_testing", "fixtures", "mocking",
        "performance_optimization", "caching", "database_optimization",
        "error_handling", "logging", "exceptions", "middleware"
      ],
      "difficulty_levels": {
        "beginner": 1,
        "intermediate": 2,
        "advanced": 2
      }
    }
  """
)

## üîÑ Processar Dados em um Grafo de Conhecimento

Agora vamos transformar nosso texto bruto em uma mem√≥ria estruturada. Este processo:

1. **Adiciona dados aos NodeSets**: Organiza informa√ß√µes em categorias l√≥gicas
   - `developer_data`: Perfil do desenvolvedor e conversas
   - `principles_data`: Melhores pr√°ticas e diretrizes de Python

2. **Executa o Pipeline Cognify**: Extrai entidades, relacionamentos e cria embeddings
   - Identifica conceitos-chave
   - Cria conex√µes sem√¢nticas entre informa√ß√µes relacionadas
   - Gera embeddings vetoriais

Isso pode levar alguns momentos enquanto o LLM processa o texto e constr√≥i a estrutura do grafo:


In [None]:
await cognee.add(developer_intro, node_set=["developer_data"])
await cognee.add(human_agent_conversations, node_set=["developer_data"])
await cognee.add(python_zen_principles, node_set=["principles_data"])

await cognee.cognify()

## üìä Visualizar o Grafo de Conhecimento

Vamos explorar a estrutura do nosso grafo de conhecimento. A visualiza√ß√£o mostra:
- **N√≥s**: Entidades extra√≠das do texto (conceitos, tecnologias, pessoas)
- **Arestas**: Rela√ß√µes e conex√µes entre as entidades
- **Agrupamentos**: Conceitos relacionados agrupados por similaridade sem√¢ntica

Abra o arquivo HTML gerado no seu navegador para explorar o grafo de forma interativa:


In [None]:
from cognee import visualize_graph
await visualize_graph('./visualization_1.html')

## üß† Enriquecer a Mem√≥ria com Memify

A fun√ß√£o `memify()` analisa o grafo de conhecimento e gera regras inteligentes sobre os dados. Este processo:
- Identifica padr√µes e melhores pr√°ticas
- Cria diretrizes acion√°veis com base no conte√∫do
- Estabelece rela√ß√µes entre diferentes √°reas de conhecimento

Essas regras ajudam o agente a tomar decis√µes mais informadas ao responder perguntas. Capturar uma segunda visualiza√ß√£o ajuda a comparar como o grafo se torna mais denso ap√≥s ser enriquecido.


In [None]:
await cognee.memify()

await visualize_graph('./visualization_2.html')

## üîç Parte 2: Recupera√ß√£o Inteligente de Mem√≥ria

### Demonstra√ß√£o 1: Integra√ß√£o de Conhecimento entre Documentos

Agora que nosso grafo de conhecimento est√° constru√≠do, vamos testar como o Cognee combina informa√ß√µes de v√°rias fontes para responder a perguntas complexas.

A primeira consulta demonstra:
- **Compreens√£o sem√¢ntica**: Encontrar conceitos relevantes mesmo quando n√£o mencionados explicitamente
- **Referenciamento cruzado**: Combinar o perfil do desenvolvedor com os princ√≠pios do Python
- **Racioc√≠nio contextual**: Aplicar melhores pr√°ticas a implementa√ß√µes espec√≠ficas

### Demonstra√ß√£o 2: Pesquisa Filtrada com NodeSets

A segunda consulta mostra como direcionar subconjuntos espec√≠ficos do grafo de conhecimento:
- Usa o par√¢metro `node_name` para pesquisar apenas dentro de `principles_data`
- Fornece respostas focadas de um dom√≠nio de conhecimento espec√≠fico
- √ötil quando voc√™ precisa de informa√ß√µes espec√≠ficas de um dom√≠nio


In [None]:
# demonstrate cross-document knowledge retrieval from multiple data sources
from cognee.modules.search.types import SearchType

results = await cognee.search(
    query_text="How does my AsyncWebScraper implementation align with Python's design principles?",
    query_type=SearchType.GRAPH_COMPLETION,
)
print("Python Pattern Analysis:", results)

# demonstrate filtered search using NodeSet to query only specific subsets of memory
from cognee.modules.engine.models.node_set import NodeSet
results = await cognee.search(
    query_text="How should variables be named?",
    query_type=SearchType.GRAPH_COMPLETION,
    node_type=NodeSet,
    node_name=["principles_data"],
)
print("Filtered search result:", results)

## üîê Parte 3: Configura√ß√£o de Gerenciamento de Sess√£o

### Habilitando Mem√≥ria de Conversa√ß√£o

O gerenciamento de sess√£o √© essencial para manter o contexto em v√°rias intera√ß√µes. Aqui, vamos:

1. **Inicializar o Contexto do Usu√°rio**: Criar ou recuperar um perfil de usu√°rio para rastreamento de sess√£o
2. **Configurar o Motor de Cache**: Conectar ao Redis para armazenar o hist√≥rico de conversas
3. **Habilitar Vari√°veis de Sess√£o**: Configurar vari√°veis de contexto que persistem entre consultas

> ‚ö†Ô∏è **Importante**: Isso requer que o Redis esteja em execu√ß√£o e `CACHING=true` no seu ambiente


In [None]:
from cognee.modules.users.methods import get_default_user
from cognee.context_global_variables import set_session_user_context_variable 
from cognee.infrastructure.databases.cache import get_cache_engine

user = await get_default_user()
await set_session_user_context_variable(user)
print(f"Using user id: {getattr(user, 'id', 'unknown')}")

cache_engine = get_cache_engine()
if cache_engine is None:
    raise RuntimeError('Cache engine is not available. Double-check your cache configuration.')
print('Session cache is ready.')


## üõ†Ô∏è Fun√ß√£o Auxiliar: Visualizar Hist√≥rico de Sess√£o

Esta fun√ß√£o utilit√°ria permite inspecionar o hist√≥rico de conversas armazenado no Redis. √â √∫til para:
- Depurar o gerenciamento de sess√µes
- Verificar se as conversas est√£o sendo armazenadas em cache
- Entender qual contexto est√° dispon√≠vel para o agente


In [None]:
async def show_history(session_id: str) -> None:
    # Let's check the cache directly
    cache_engine = get_cache_engine()
    if cache_engine:
        # Try to get history directly from cache
        user_id = str(user.id) if hasattr(user, 'id') else None
        if user_id:
            history_entries = await cache_engine.get_latest_qa(user_id, session_id, last_n=10)
            print(f"\nDirect cache query for user_id={user_id}, session_id={session_id}:")
            print(f"Found {len(history_entries)} entries")
            if history_entries:
                for i, entry in enumerate(history_entries, 1):
                    print(f"\nEntry {i}:")
                    print(f"  Question: {entry.get('question', 'N/A')[:100]}...")
                    print(f"  Answer: {entry.get('answer', 'N/A')[:100]}...")
        else:
            print("No user_id available")


## Sess√£o 1: Laborat√≥rio de Suporte Ass√≠ncrono ‚Äî Primeira Pergunta

Inicie a sess√£o `async-support-lab` perguntando sobre padr√µes de asyncio que sejam compat√≠veis com telemetria para um web scraper em larga escala. O gr√°fico j√° conhece asyncio, aiohttp e pr√°ticas de monitoramento, ent√£o a resposta deve refletir conversas anteriores enquanto adapta a resposta √† nova consulta.


In [None]:
session_1 = "async-support-lab"

result = await cognee.search(
    query_type=SearchType.GRAPH_COMPLETION,
    query_text="I'm building a web scraper that hits thousands of URLs concurrently. What's a reliable asyncio pattern with telemetry?",
    session_id=session_1
)

## Inspecionar a Mem√≥ria da Sess√£o 1 Ap√≥s a Primeira Troca

Executar `show_history(session_1)` imediatamente ap√≥s a pergunta inicial confirma que o Cognee gravou tanto o prompt quanto a resposta no Redis. Voc√™ deve ver uma entrada com a orienta√ß√£o de concorr√™ncia.


In [None]:
await show_history(session_1)

## Sess√£o 1: Acompanhamento sobre Modelos de Dados

A seguir, perguntamos: "Quando devo escolher dataclasses em vez de Pydantic?" usando o mesmo ID de sess√£o. Cognee deve reunir os princ√≠pios do Python junto com conversas anteriores sobre FastAPI para fornecer conselhos detalhados‚Äîdemonstrando que o contexto √© mantido dentro de uma sess√£o nomeada.


In [None]:
result = await cognee.search(
    query_type=SearchType.GRAPH_COMPLETION,
    query_text="When should I pick dataclasses versus Pydantic for this work?",
    session_id=session_1
)

## Confirmar que o Hist√≥rico da Sess√£o 1 Cont√©m Ambos os Turnos

Outra chamada para `show_history(session_1)` deve revelar duas entradas de perguntas e respostas. Isso corresponde √† etapa de "replay de mem√≥ria" do laborat√≥rio Mem0 e prova que turnos adicionais estendem a mesma transcri√ß√£o.


In [None]:
await show_history(session_1)

## Sess√£o 2: Discuss√£o de Revis√£o de Design ‚Äî Nova Sess√£o

Para mostrar isolamento entre as discuss√µes, iniciamos `design-review-session` e solicitamos orienta√ß√µes de registro para revis√µes de incidentes. Embora a base de conhecimento subjacente seja a mesma, o novo ID de sess√£o mant√©m as transcri√ß√µes separadas.


In [None]:
session_2 = "design-review-session"

result = await cognee.search(
    query_type=SearchType.GRAPH_COMPLETION,
    query_text="We're drafting logging guidance for incident reviews. Capture the key principles please.",
    session_id=session_2
)

## Revis√£o da Sess√£o 2 de Hist√≥ria

`show_history(session_2)` deve listar apenas o par de prompt/resposta da revis√£o de design. Compare isso com a Sess√£o 1 para destacar como o Cognee mant√©m transcri√ß√µes independentes enquanto reutiliza o grafo de conhecimento compartilhado.


In [None]:
await show_history(session_2)

## Resumo

Parab√©ns! Voc√™ acabou de dar ao seu assistente de codifica√ß√£o uma camada de mem√≥ria de longo prazo alimentada pelo Cognee.

Neste tutorial, voc√™ pegou conte√∫do bruto de desenvolvedores (c√≥digo, documentos, conversas) e o transformou em um gr√°fico + mem√≥ria vetorial que seu agente pode pesquisar, raciocinar e melhorar continuamente.

O que Voc√™ Aprendeu

1. **De texto bruto para mem√≥ria de IA**: Como o Cognee processa dados n√£o estruturados e os transforma em uma mem√≥ria inteligente e pesquis√°vel usando uma arquitetura combinada de vetor + grafo de conhecimento.

2. **Enriquecimento de grafo com memify**: Como ir al√©m da cria√ß√£o b√°sica de grafos e usar o memify para adicionar fatos derivados e relacionamentos mais ricos ao seu grafo existente.

3. **M√∫ltiplas estrat√©gias de busca**: Como consultar a mem√≥ria com diferentes tipos de busca (Q&A com consci√™ncia de grafo, conclus√£o no estilo RAG, insights, fragmentos brutos, busca de c√≥digo, etc.) dependendo do que seu agente precisa.

4. **Explora√ß√£o visual**: Como inspecionar e depurar o que o Cognee construiu usando visualiza√ß√µes de grafo e a interface do Cognee, para que voc√™ possa realmente ver como o conhecimento est√° estruturado.

5. **Mem√≥ria sens√≠vel √† sess√£o**: Como combinar o contexto de cada sess√£o com uma mem√≥ria sem√¢ntica persistente para que os agentes possam lembrar entre execu√ß√µes sem vazar informa√ß√µes entre usu√°rios.


## Principais Pontos
1. Mem√≥ria como um Grafo de Conhecimento apoiado por Embeddings

    - **Compreens√£o estruturada**: Cognee combina um armazenamento vetorial e um armazenamento de grafo, permitindo que seus dados sejam pesquis√°veis por significado e conectados por rela√ß√µes. Por padr√£o, Cognee utiliza bancos de dados baseados em arquivos (LanceDB para vetores, Kuzu para banco de dados de grafos).

    - **Recupera√ß√£o consciente de rela√ß√µes**: As respostas podem ser fundamentadas n√£o apenas em "texto semelhante", mas tamb√©m em como as entidades se relacionam.

    - **Mem√≥ria viva**: A camada de mem√≥ria evolui, cresce e permanece consult√°vel como um grafo conectado.

2. Modos de Busca e Racioc√≠nio
    - **Recupera√ß√£o h√≠brida**: A busca combina similaridade vetorial, estrutura de grafo e racioc√≠nio de LLM, desde a busca de fragmentos brutos at√© respostas a perguntas conscientes do grafo.

    - **Ajuste o modo ao trabalho**: Use modos de estilo de conclus√£o quando quiser respostas em linguagem natural, e modos de fragmento/resumo/grafo quando seu agente precisar de contexto bruto ou conduzir seu pr√≥prio racioc√≠nio.

3. Agentes Personalizados e Conscientes de Sess√£o
    - **Contexto de sess√£o + mem√≥ria de longo prazo**: Cognee mant√©m o contexto de "thread" de curto prazo separado da mem√≥ria de longo prazo, seja no n√≠vel do usu√°rio ou da organiza√ß√£o.

## Aplica√ß√µes no Mundo Real

1. **Agentes de IA Verticais**

    Use o padr√£o deste notebook para criar copilotos inteligentes em dom√≠nios espec√≠ficos que utilizam Cognee como n√∫cleo de recupera√ß√£o e racioc√≠nio:

- **Copilotos para desenvolvedores**: Assistentes de revis√£o de c√≥digo, an√°lise de incidentes e arquitetura que percorrem c√≥digo, APIs, documentos de design e tickets como um √∫nico grafo de mem√≥ria.

- **Copilotos voltados para clientes**: Agentes de suporte ou sucesso que acessam documentos de produtos, FAQs, notas de CRM e tickets anteriores com recupera√ß√£o consciente de grafo e respostas citadas.

- **Copilotos especialistas internos**: Assistentes de pol√≠tica, jur√≠dico ou seguran√ßa que raciocinam sobre regras interconectadas, diretrizes e decis√µes hist√≥ricas, em vez de PDFs isolados.

    Cognee √© explicitamente posicionado como mem√≥ria persistente e precisa para agentes de IA, fornecendo um grafo de conhecimento vivo que se integra ao seu agente e substitui combina√ß√µes ad hoc de armazenamentos vetoriais e c√≥digo de grafo personalizado.

2. **Unificando Silos de Dados em Uma Mem√≥ria**

    A mesma abordagem tamb√©m ajuda a construir uma camada de mem√≥ria unificada a partir de fontes dispersas:

- **De silos para um grafo √∫nico**: Ingest√£o de dados estruturados (por exemplo, bancos de dados) e n√£o estruturados (por exemplo, documentos, chats) em um √∫nico grafo apoiado por embeddings, em vez de √≠ndices separados para cada sistema.

- **Racioc√≠nio entre fontes com cita√ß√µes**: Execute racioc√≠nio em v√°rias etapas sobre tudo‚Äî"una" logs, m√©tricas e documentos via o grafo‚Äîe ainda assim retorne respostas fundamentadas com proveni√™ncia.

- **Hubs de conhecimento**: Para dom√≠nios como bancos ou educa√ß√£o, Cognee j√° √© usado para unificar PDFs, sistemas internos e dados de aplicativos em um grafo de conhecimento com vetores, permitindo que agentes respondam perguntas com contexto preciso e citado.

## Pr√≥ximos Passos

Voc√™ implementou o n√∫cleo do loop de mem√≥ria. Aqui est√£o extens√µes naturais que voc√™ pode experimentar por conta pr√≥pria (veja [documenta√ß√£o do Cognee](https://docs.cognee.ai/) para detalhes):

1. **Experimente a consci√™ncia temporal**: Ative o "temporal cognify" para extrair eventos e marcas de tempo do texto.

2. **Introduza racioc√≠nio baseado em ontologia**: Defina uma ontologia OWL para seu dom√≠nio. Use o suporte de ontologia do Cognee para que entidades e rela√ß√µes extra√≠das sejam fundamentadas nesse esquema, melhorando a qualidade do grafo e respostas espec√≠ficas do dom√≠nio.

3. **Adicione um loop de feedback**: Permita que o Cognee ajuste os pesos das arestas do grafo com base no feedback real dos usu√°rios, para que a recupera√ß√£o melhore ao longo do tempo em vez de permanecer est√°tica.

4. **Ajuste para personaliza√ß√£o e comportamento de sess√£o**: Use IDs de usu√°rios, locat√°rios e conjuntos de dados para oferecer a cada pessoa ou equipe sua pr√≥pria vis√£o sobre o motor de mem√≥ria compartilhado.

5. **Expanda para agentes mais complexos**: Conecte o Cognee a frameworks de agentes para construir sistemas multiagentes que compartilhem a mesma camada de mem√≥ria. *Microsoft Agent Framework x Cognee plugin est√° chegando em breve.*


---

<!-- CO-OP TRANSLATOR DISCLAIMER START -->
**Aviso Legal**:  
Este documento foi traduzido utilizando o servi√ßo de tradu√ß√£o por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precis√£o, esteja ciente de que tradu√ß√µes autom√°ticas podem conter erros ou imprecis√µes. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informa√ß√µes cr√≠ticas, recomenda-se a tradu√ß√£o profissional humana. N√£o nos responsabilizamos por quaisquer mal-entendidos ou interpreta√ß√µes incorretas decorrentes do uso desta tradu√ß√£o.
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
