ai-agents-for-beginners

Assista ao vídeo da aula: Protegendo Agentes de IA com Recibos Criptográficos

(Vídeo da aula e miniatura a serem adicionados pela equipe de conteúdo da Microsoft após a mesclagem, seguindo o padrão da aula 14 / 15.)

Protegendo Agentes de IA com Recibos Criptográficos

Introdução

Esta aula abordará:

Por que trilhas de auditoria para agentes de IA são importantes para conformidade, depuração e confiança.
O que é um recibo criptográfico e como ele difere de uma linha de log não assinada.
Como produzir um recibo assinado para uma chamada de ferramenta de um agente em Python simples.
Como verificar um recibo offline e detectar adulterações.
Como encadear recibos para que remover ou reordenar um quebre a cadeia.
O que os recibos provam e o que eles explicitamente não provam.

Objetivos de Aprendizagem

Após concluir esta aula, você saberá como:

Identificar os modos de falha que motivam a proveniência criptográfica para ações de agentes.
Produzir um recibo assinado Ed25519 sobre uma carga útil JSON canônica.
Verificar um recibo de forma independente usando apenas a chave pública do assinante.
Detectar adulterações reexecutando a verificação em um recibo modificado.
Construir uma sequência encadeada por hash de recibos e explicar por que a cadeia importa.
Reconhecer o limite entre o que os recibos provam (atribuição, integridade, ordenação) e o que eles não provam (correção da ação, solidez da política).

O Problema: A Trilha de Auditoria do Seu Agente

Imagine que você implantou um agente de IA para a Contoso Travel. O agente lê solicitações de clientes, chama uma API de voos para buscar opções e reserva assentos em nome do cliente. No último trimestre, o agente processou 50.000 reservas.

Hoje, um auditor chega. Ele faz uma pergunta simples: “Mostre-me o que seu agente fez.”

Você entrega seus arquivos de log. O auditor os examina e faz a pergunta mais difícil: “Como sei que esses logs não foram editados?”

Este é o problema da trilha de auditoria. A maioria das implantações de agentes hoje depende de:

Logs de aplicação: escritos pelo próprio agente, editáveis por qualquer pessoa com acesso ao sistema de arquivos.
Serviços de logging na nuvem: evidenciam adulteração no nível da plataforma, mas somente se o auditor confiar no operador da plataforma.
Logs de transação de banco de dados: adequados para mudanças no banco de dados, mas não para chamadas arbitrárias de ferramentas.

Nenhum deles pode responder à pergunta do auditor sem que ele precise confiar em alguém (você, seu provedor de nuvem, seu fornecedor de banco de dados). Para uso interno, essa confiança é geralmente aceitável. Para cargas reguladas (finanças, saúde, qualquer coisa sujeita à Lei de IA da UE), não é.

Recibos criptográficos resolvem isso ao tornar cada ação do agente independentemente verificável. O auditor não precisa confiar em você. Precisa apenas da sua chave pública e do próprio recibo.

O que é um Recibo Criptográfico?

Um recibo é um objeto JSON que registra o que um agente fez, assinado com uma assinatura digital.

flowchart LR
    A[Agente invoca uma ferramenta] --> B[Construir carga útil do recibo]
    B --> C[Canonicalizar JSON RFC 8785]
    C --> D[Hash SHA-256]
    D --> E[Assinar Ed25519]
    E --> F[Recibo com assinatura]
    F --> G[Auditor verifica offline]
    G --> H{Assinatura válida?}
    H -- sim --> I[Prova à prova de adulteração]
    H -- não --> J[Recibo rejeitado]

Um recibo mínimo se parece com isto:

{
  "type": "agent.tool_call.v1",
  "agent_id": "contoso-travel-bot",
  "tool_name": "lookup_flights",
  "tool_args_hash": "sha256:a3f9c1...",
  "result_hash": "sha256:7b2e1d...",
  "policy_id": "contoso-travel-policy-v3",
  "timestamp": "2026-04-25T14:30:00Z",
  "sequence": 47,
  "previous_receipt_hash": "sha256:9d4e6a...",
  "signature": {
    "alg": "EdDSA",
    "sig": "c5af83...",
    "public_key": "8f3b2c..."
  }
}

Três propriedades fazem o trabalho:

A assinatura. O recibo é assinado pelo gateway do agente usando uma chave privada Ed25519. Qualquer um com a chave pública correspondente pode verificar a assinatura offline. Alterar qualquer campo invalida a assinatura.
Codificação canônica. Antes de assinar, o recibo é serializado usando o JSON Canonicalization Scheme (JCS, RFC 8785). Isso garante que duas implementações produzindo o mesmo recibo lógico produzam uma saída byte-idêntica. Sem canonicalização, diferentes serializadores JSON produziriam assinaturas diferentes para o mesmo conteúdo.
Encadeamento por hash. O campo previous_receipt_hash vincula cada recibo ao anterior. Remover ou reordenar um recibo quebra todos os recibos que vieram depois. A adulteração fica visível no nível da cadeia mesmo se as assinaturas individuais forem contornadas.

Juntas, essas propriedades garantem três coisas:

Atribuição: essa chave assinou este conteúdo.
Integridade: o conteúdo não mudou desde a assinatura.
Ordenação: este recibo veio depois daquele recibo na cadeia.

Produzindo um Recibo em Python

Você não precisa de uma biblioteca especial para produzir um recibo. As primitivas criptográficas estão amplamente disponíveis e a lógica são poucas dezenas de linhas em Python.

Os exercícios práticos em code_samples/18-signed-receipts.ipynb percorrem todo o fluxo. A versão resumida:

import json
import hashlib
import base64
from nacl import signing
from jcs import canonicalize  # JSON canônico RFC 8785

def b64url_nopad(data: bytes) -> str:
    return base64.urlsafe_b64encode(data).decode("ascii").rstrip("=")

def sha256_canonical(obj) -> str:
    """SHA-256 of a Python object's JCS-canonical JSON form."""
    return f"sha256:{hashlib.sha256(canonicalize(obj)).hexdigest()}"

# Gerar ou carregar uma chave de assinatura (em produção, armazenar em um cofre de chaves)
signing_key = signing.SigningKey.generate()
verify_key = signing_key.verify_key

# Construir o payload do recibo (ainda sem assinatura)
tool_args = {"origin": "SYD", "destination": "LAX"}
tool_result = [{"flight": "QF11", "price": 1850, "stops": 0}]

payload = {
    "type": "agent.tool_call.v1",
    "agent_id": "contoso-travel-bot",
    "tool_name": "lookup_flights",
    "tool_args_hash": sha256_canonical(tool_args),
    "result_hash": sha256_canonical(tool_result),
    "policy_id": "contoso-travel-policy-v3",
    "timestamp": "2026-04-25T14:30:00Z",
    "sequence": 0,
    "previous_receipt_hash": None,
}

# Canonicalizar, gerar hash, assinar.
canonical_bytes = canonicalize(payload)
message_hash = hashlib.sha256(canonical_bytes).digest()
signature_bytes = signing_key.sign(message_hash).signature

# Anexar um objeto de assinatura estruturado.
receipt = {
    **payload,
    "signature": {
        "alg": "EdDSA",
        "sig": b64url_nopad(signature_bytes),
        "public_key": b64url_nopad(bytes(verify_key)),
    },
}

Esse é todo o pipeline de assinatura. Os exercícios no notebook explicam cada etapa.

Verificando um Recibo e Detectando Adulteração

A verificação é a operação inversa:

import base64
import hashlib
from nacl import signing
from nacl.exceptions import BadSignatureError
from jcs import canonicalize

def b64url_decode(s: str) -> bytes:
    padding = "=" * ((4 - len(s) % 4) % 4)
    return base64.urlsafe_b64decode(s + padding)

def verify_receipt(receipt: dict) -> bool:
    # A assinatura é um objeto estruturado: {"alg", "sig", "public_key"}.
    sig_obj = receipt.get("signature")
    if not sig_obj or sig_obj.get("alg") != "EdDSA":
        return False

    # Reconstrua a carga útil que foi realmente assinada (tudo, exceto a assinatura).
    payload = {k: v for k, v in receipt.items() if k != "signature"}

    canonical_bytes = canonicalize(payload)
    message_hash = hashlib.sha256(canonical_bytes).digest()

    try:
        verify_key = signing.VerifyKey(b64url_decode(sig_obj["public_key"]))
        verify_key.verify(message_hash, b64url_decode(sig_obj["sig"]))
        return True
    except BadSignatureError:
        return False

Esta função recebe um recibo e retorna True se a assinatura for válida, False caso contrário. Sem chamada de rede, sem dependência de serviço, sem necessidade de confiar em terceiros.

Para ver a detecção de adulteração em ação, o notebook mostra:

Produção de um recibo válido e confirmação de que verifica.
Modificação de um byte no campo tool_args_hash.
Reexecução da verificação e falha.

Esta é a demonstração prática de que recibos evidenciam adulteração: qualquer modificação, por menor que seja, invalida a assinatura.

Encadeando Recibos para Agentes de Múltiplas Etapas

Um único recibo assinado protege uma ação. Uma cadeia de recibos protege uma sequência.

flowchart LR
    R0[Recibo 0<br/>gênese] --> R1[Recibo 1]
    R1 --> R2[Recibo 2]
    R2 --> R3[Recibo 3]
    R1 -. previous_receipt_hash .-> R0
    R2 -. previous_receipt_hash .-> R1
    R3 -. previous_receipt_hash .-> R2

Cada recibo registra o hash do recibo anterior. Para remover silenciosamente o recibo 2, um atacante precisaria:

Modificar o campo previous_receipt_hash do recibo 3 (quebraria a assinatura do recibo 3), OU
Forjar uma nova assinatura em um recibo 3 modificado (exige a chave privada do agente).

Se a chave privada estiver em um cofre de hardware e você publicar a chave pública com cada recibo, nenhum dos ataques é viável sem detecção.

O notebook mostra:

Construção de uma cadeia de três recibos.
Verificação de que o campo previous_receipt_hash de cada recibo corresponde ao hash real do recibo anterior.
Adulteração de um recibo no meio e observação da quebra da cadeia exatamente nesse ponto.

É assim que você produz uma trilha de auditoria que um auditor externo pode verificar sem confiar em você.

O Que os Recibos Provam (e o Que Eles Não Provam)

Esta é a seção mais importante da aula. Recibos são poderosos, mas seu poder é limitado.

Recibos provam três coisas:

Atribuição: uma chave específica assinou uma carga útil específica.
Integridade: a carga útil não mudou desde a assinatura.
Ordenação: este recibo veio depois daquele na cadeia de hashes.

Recibos NÃO provam:

Correção: que a ação do agente foi a ação correta. Um recibo pode ser assinado para uma resposta errada tão facilmente quanto para uma correta.
Conformidade com a política: que a política referenciada em policy_id foi realmente avaliada, ou que teria permitido essa ação se verificada. O recibo registra o que foi alegado, não o que foi aplicado.
Identidade além da chave: o recibo diz “esta chave assinou este conteúdo.” Não diz “este humano autorizou isto.” Conectar uma chave a uma pessoa ou organização requer infraestrutura de identidade separada (um diretório, um registro de chave pública etc.).
Verdade dos inputs: se o agente recebe um prompt manipulado e age com base nele, o recibo registra a ação fielmente. Recibos são subsequentes à validação de entrada, não um substituto dela.

Esse limite importa por duas razões:

Diz para que os recibos são úteis: tornar o comportamento dos agentes auditável e evidente de adulteração, mesmo entre fronteiras organizacionais.
Diz quais camadas adicionais você ainda precisa: validação de entrada (Aula 6), aplicação da política (coberta brevemente abaixo) e infraestrutura de identidade (fora do escopo desta aula).

Um erro comum é assumir que “temos recibos” significa “estamos governados.” Não é. Recibos são a base. Governança é o sistema que você constrói sobre ela.

Referências para Produção

O código Python nesta aula é intencionalmente mínimo para que você tenha clareza de cada linha e compreenda exatamente o que ocorre. Em produção, você tem duas opções:

Construir diretamente sobre as primitivas criptográficas. As 50 linhas que você viu acima são suficientes para muitos casos. PyNaCl (Ed25519) e o pacote jcs (JSON canônico) são bibliotecas mantidas e auditadas.
Usar uma biblioteca de recibos para produção. Vários projetos open-source implementam o mesmo padrão com recursos adicionais (rotação de chaves, verificação em lote, distribuição de JWK Set, integração com motores de políticas):
- O formato de recibo usado nesta aula segue um rascunho IETF Internet-Draft (draft-farley-acta-signed-receipts) atualmente em processo de padronização.
- O Microsoft Agent Governance Toolkit compõe recibos com decisões políticas baseadas em Cedar; veja o Tutorial 33 nesse repositório para um exemplo completo.
- Os pacotes protect-mcp (npm) e @veritasacta/verify (npm) fornecem uma implementação Node de assinatura de recibos e verificação offline, destinados a envolver qualquer servidor MCP com uma trilha de auditoria evidente para adulteração.
- O SDK Python nobulex (pip install nobulex) fornece o mesmo padrão Ed25519 + JCS para assinatura em Python com integrações LangChain e CrewAI, incluindo vetores de teste de validação cruzada publicados e um mapeamento de conformidade contribuído via OWASP PR #2210.

A decisão entre criar seu próprio código ou usar uma biblioteca é similar à decisão entre escrever sua própria biblioteca JWT e usar uma testada: ambas razoáveis; a biblioteca economiza tempo e reduz a superfície de auditoria; o caminho do zero força você a entender cada primitiva. Esta aula ensina o caminho do zero para que você tenha a base para ambas as escolhas.

Verificação do Conhecimento

Teste seu entendimento antes de avançar para o exercício prático.

1. Um recibo é assinado com a chave privada Ed25519 do agente. O auditor tem apenas a chave pública. O auditor pode verificar o recibo offline?

Resposta

Sim. A verificação Ed25519 requer apenas a chave pública e os bytes assinados. Sem chamada de rede, sem dependência de serviço. Essa é a propriedade que torna os recibos úteis em ambientes isolados (air-gapped), multi-organizações ou de baixa confiança para auditoria.

2. Um atacante modifica o campo policy_id de um recibo para alegar que ele foi regido por uma política mais permissiva. A assinatura estava sobre a carga original. O que acontece durante a verificação?

Resposta

A verificação falha. A assinatura foi calculada sobre os bytes canônicos da carga original; modificar qualquer campo altera os bytes canônicos, que alteram o hash SHA-256, tornando a assinatura inválida. O atacante precisaria da chave privada para produzir uma nova assinatura válida, que não possui.

3. Por que o recibo inclui tool_args_hash e result_hash em vez dos argumentos e resultados brutos?

Resposta

Por duas razões. Primeiro, o recibo pode precisar ser arquivado ou transmitido em ambientes onde vazar o conteúdo bruto (PII, dados comerciais) é um problema. O hashing mantém o recibo pequeno e o conteúdo privado; o auditor verifica que o hash corresponde a uma cópia armazenada separadamente do conteúdo real. Segundo, os hashes têm tamanho fixo; um recibo com hashes é limitado em tamanho independentemente do tamanho das entradas e saídas.

4. O campo previous_receipt_hash vincula cada recibo ao seu predecessor. Se um atacante exclui silenciosamente um recibo no meio de uma cadeia, o que se torna inválido?

Resposta

Todos os recibos que vieram depois do excluído. Seus campos `previous_receipt_hash` não correspondem mais à cadeia real (porque o recibo referenciado não existe mais, ou a cadeia agora aponta para outro predecessor). Para esconder a exclusão, o atacante teria que re-assinar cada recibo posterior, o que exige a chave privada.

5. Um recibo verifica limpo. Isso prova que a ação do agente foi correta, sólida ou conforme à política?

Resposta

Não. Um recibo válido prova três coisas: atribuição (esta chave assinou este conteúdo), integridade (o conteúdo não mudou) e ordenação (este recibo veio depois daquele). Ele NÃO prova que a ação foi correta, que a política nomeada em `policy_id` foi realmente avaliada ou que o agente seguiu todas as regras. Recibos tornam o comportamento do agente auditável, não necessariamente correto. Este é o limite mais importante da aula.

Exercício Prático

Abra code_samples/18-signed-receipts.ipynb e complete as quatro seções:

Seção 1: Assine seu primeiro recibo e o verifique.
Seção 2: Adulterar o recibo e observar a falha na verificação.
Seção 3: Construa uma cadeia de três recibos e verifique a integridade da cadeia.
Seção 4: Aplique o padrão a um agente construído com o Microsoft Agent Framework: envolva uma chamada de ferramenta na assinatura do recibo, depois verifique o recibo independentemente. Desafio estendido 1: estenda o esquema do recibo com um campo adicional de sua escolha (por exemplo, um ID de requisição para rastreamento), atualize a lógica canônica de assinatura para incluí-lo e confirme que o recibo ainda passa pela verificação de ida e volta. Em seguida, modifique o campo após a assinatura e confirme que a verificação falha. Isso o obriga a entender como cada byte da codificação canônica contribui para a assinatura.

Desafio estendido 2: faça o hash SHA-256 de dois dos seus recibos juntos (concatene seus bytes canônicos em uma ordem determinística) e incorpore o resumo resultante como um novo campo em um terceiro recibo antes de assiná-lo. Verifique se os três recibos ainda passam pela verificação de ida e volta. Você acabou de construir uma prova de inclusão em uma etapa: qualquer pessoa que possua o terceiro recibo pode provar que os dois primeiros existiam no momento em que ele foi assinado, sem precisar revelar seus conteúdos. Este é o padrão que recibos de divulgação seletiva usam em escala (compromissos Merkle, RFC 6962).

Conclusão

Recibos criptográficos fornecem aos agentes de IA uma trilha de auditoria que é:

Independentemente verificável: qualquer parte com a chave pública pode verificar, sem depender de serviço.
À prova de adulteração: qualquer modificação invalida a assinatura.
Portátil: um recibo é um pequeno arquivo JSON; pode ser arquivado, transmitido e verificado em qualquer lugar.
Alinhado aos padrões: construído sobre Ed25519 (RFC 8032), JCS (RFC 8785) e SHA-256, todos primitivos amplamente usados.

Eles não substituem a validação de entrada, aplicação de políticas ou infraestrutura de identidade. São a base para essas camadas. Ao implantar agentes em cargas de trabalho reguladas, fluxos de trabalho multi-organizações, ou qualquer cenário onde um auditor futuro não pode presumir confiança em você, os recibos são como você torna a trilha de auditoria honesta.

A lição mais importante: os recibos provam quem disse o quê, quando. Eles não provam que o que foi dito é verdadeiro ou correto. Mantenha essa distinção clara. É a diferença entre um sistema de procedência honesto e um enganoso.

Lista de Verificação para Produção

Quando estiver pronto para avançar desta lição para implantar agentes assinados com recibos em um ambiente real:

Mova a chave de assinatura para fora do laptop do desenvolvedor. Use Azure Key Vault, AWS KMS ou um módulo de segurança de hardware. A chave privada que assina seus recibos nunca deve ficar em controle de versão ou em texto simples nas máquinas de aplicação.
Publique a chave pública de verificação. Auditores precisam dela para verificar offline. O padrão é um JWK Set em uma URL conhecida (RFC 7517), por exemplo, https://your-org.example.com/.well-known/agent-keys.json.
Ancore a cadeia externamente. Periodicamente, grave o hash da cabeça da cadeia mais recente em um log de transparência (Sigstore Rekor, autoridade de timestamp RFC 3161, ou um segundo sistema interno) para que uma parte externa possa confirmar “esta cadeia existia neste momento.”
Armazene os recibos de forma imutável. Armazenamento blob somente com anexação (Azure Storage com políticas de imutabilidade, AWS S3 Object Lock) evita que um insider reescreva o histórico na camada de armazenamento.
Decida sobre a retenção. Muitas normas requerem retenção por vários anos. Planeje o crescimento dos recibos (cada recibo tem ~500 bytes; um agente fazendo 10 mil chamadas por dia produz ~1,8 GB por ano).
Documente o que os recibos não cobrem. Recibos provam atribuição, integridade e ordenação. Seu runbook deve listar explicitamente quais controles adicionais (validação de entrada, aplicação de políticas, limitação de taxa, infraestrutura de identidade) coexistem com os recibos na sua postura de governança.

Tem mais dúvidas sobre Segurança de Agentes de IA?

Junte-se ao Microsoft Foundry Discord para encontrar outros aprendizes, participar de office hours e tirar suas dúvidas sobre Agentes de IA.

Além Desta Lição

Esta lição cobre assinatura de recibos únicos e sequências encadeadas por hash. Os mesmos primitvos se combinam em vários padrões avançados que você pode encontrar à medida que sua postura de governança amadurece:

Divulgação seletiva. Quando os campos de um recibo são comprometidos independentemente (árvore Merkle estilo RFC 6962), você pode revelar campos específicos para auditores específicos e provar que o restante está intacto sem expô-los. Útil quando o mesmo recibo deve satisfazer uma auditoria completa (que quer completude) e regulamentos de minimização de dados como GDPR (que querem que o auditor veja o mínimo necessário).
Revogação de recibo. Se uma chave de assinatura for comprometida, você precisa marcar todos os recibos assinados por essa chave como não confiáveis a partir de um ponto no tempo. Padrões comuns: chaves de assinatura curtas com lista de revogação publicada, ou log de transparência com entradas de revogação.
Recibos bilaterais / com assinatura dividida. Algumas implementações dividem a carga assinada em metade pré-execução (authorization_*) e metade pós-execução (result_*) com assinaturas independentes, útil quando a decisão de autorização e o resultado observado são produzidos por atores diferentes ou em momentos diferentes. Isso se combina additivamente ao formato de recibo ensinado nesta lição.
Composição de carga. Um recibo sela os bytes que você coloca em result_hash. Cargas do mundo real geralmente são mais ricas que o resultado de uma única chamada de ferramenta: raciocínio pré-decisão (previsão do modelo, opções consideradas, evidência e sua completude, postura de risco, cadeia de responsabilidade, resultado do gate) podem conviver na carga, selados por um único recibo. Isso mantém o formato de recibo minimalista enquanto permite que esquemas de carga evoluam por domínio.
Conformidade entre implementações. Múltiplas implementações independentes do mesmo formato de recibo (Python, TypeScript, Rust, Go) fazem verificações cruzadas com vetores de teste compartilhados. Se você construir sua própria implementação, validar contra vetores publicados confirma compatibilidade de protocolo.
Migração pós-quântica. Ed25519 está amplamente usado hoje, mas não é resistente a computação quântica. O formato de recibo é ágil a algoritmos: o campo signature.alg pode carregar ML-DSA-65 (padrão NIST de assinatura pós-quântica) quando precisar migrar. Planeje um período de transição com recibos assinados duplamente.

Recursos Adicionais

IETF Internet-Draft: Recibos de Decisão Assinados para Controle de Acesso Máquina a Máquina
Visão geral de IA responsável (Azure AI)
RFC 8032: Algoritmo de Assinatura Digital Curve Edwards (EdDSA)
RFC 8785: Esquema de Canonicalização JSON (JCS)
RFC 6962: Transparência de Certificados (construção de árvore Merkle usada por recibos de divulgação seletiva)
Microsoft Agent Governance Toolkit, Tutorial 33: Recibos de Decisão Verificáveis Offline
Vetores de teste de conformidade entre implementações para o formato de recibo usado nesta lição (Apache-2.0)
Documentação PyNaCl (Ed25519 em Python)

Lição Anterior

Construindo Agentes de Uso de Computador (CUA)

Próxima Lição

(A ser determinada pelos mantenedores do currículo)

Aviso Legal: Este documento foi traduzido usando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos pela precisão, por favor, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.

This site is open source. Improve this page.