Aller au contenu

Résumer plusieurs documents

AI generated translation.

Supposons que j’ai un répertoire contenant plusieurs fichiers .pdf (ou autres) et que je veux exécuter un GenAIScript sur tous. Dans cet exemple, je génère un tweet accrocheur pour chaque document et je veux enregistrer le tweet dans un autre fichier.

  1. Utilisez la commande > GenAIScript : Créer un nouveau script... dans la palette de commandes pour créer un nouveau script.

  2. C’est un script simple. En supposant que le script prenne le fichier en argument, vous pouvez référencer cet argument dans env.files et indiquer au LLM ce qu’il doit en faire :

    gen-tweet.genai.mjs
    script({ title: "gen-tweet" })
    def("FILE", env.files)
    $`Given the paper in FILE, write a 140 character summary of the paper
    that makes the paper sound exciting and encourages readers to look at it.`
  3. Faites un clic droit sur le document dans l’explorateur VS Code (cela peut être un fichier .pdf, .docx ou .md car def sait lire et analyser tous ces formats). Sélectionnez Exécuter GenAIScript. Sélectionnez le script gen-tweet que vous venez d’écrire.

  4. Si l’on donne au GenAIScript un article décrivant GenAIScript, la sortie s’affichera dans un nouvel onglet de document.

    Discover GenAIScript: a revolutionary scripting language integrating AI to automate complex tasks, making coding accessible to all! #AI #CodingFuture

    Comme nous n’avons pas demandé au LLM d’écrire la sortie dans un fichier, elle sera par défaut envoyée vers la sortie standard.

  1. Nous pouvons exécuter le script depuis la ligne de commande :

    Fenêtre de terminal
    npx genaiscript run gen-tweet example1.pdf
  2. La sortie sera affichée dans le terminal.

  3. Maintenant que le script fonctionne pour un fichier unique, nous pouvons utiliser la ligne de commande pour l’appliquer à une liste de fichiers. Supposons que vous commenciez avec un fichier ex1.pdf et que vous souhaitiez la sortie dans un nouveau fichier ex1.tweet.md. La façon de procéder dépend du shell ou du script que vous préférez.

    for file in *.pdf; do
    newfile="${file%.pdf}.tweet.md"; # foo.pdf -> foo.tweet.md
    if [ ! -f "$newfile" ]; then # skip if already exists
    npx genaiscript run gen-tweet $file > $newfile
    fi
    done