실습 ①: PDF 업로드 + 정보 추출 프롬프트

시간 소요 수강생 역할
10:50 20분 🟢 직접 실습

목차

  1. 이 실습의 목표
  2. Step 1 — 프롬프트 만들기
  3. Step 2 — 입력 변수 추가
  4. Step 3 — 추출 포맷 설계
    1. 프롬프트 본문
  5. Step 4 — 출력 변수 정의
  6. Step 5 — 단독 테스트
    1. 기대 출력 예시
  7. 자주 나오는 문제
  8. 체크리스트
  9. 다음 단계

이 실습의 목표

  • AI 빌더 텍스트 프롬프트의 파일 입력을 사용한다
  • 입력: PDF 파일 / 출력: 정해진 포맷의 정형 텍스트
  • 단독 테스트로 추출 품질을 먼저 검증한다

Step 1 — 프롬프트 만들기

Power Apps → AI 허브 → 프롬프트 → + 새 프롬프트

항목
이름 DocExtractor
설명 PDF에서 제목·요약·항목·특이사항 추출
모델 GPT-4o (긴 문서 권장)

Step 2 — 입력 변수 추가

입력 추가 → 파일 을 선택합니다.

변수명 형식 비고
sourceDoc 파일 PDF/DOCX/PPTX/TXT

입력 형식을 파일로 두면 프롬프트 본문에 {sourceDoc} 자리표시자가 만들어지고, 흐름에서 파일을 그대로 전달할 수 있습니다. (이미지가 아니라 텍스트가 풍부한 문서일 때 사용합니다)


Step 3 — 추출 포맷 설계

추출의 품질은 포맷의 명확성에서 결정됩니다. 모호하면 결과도 들쭉날쭉입니다.

프롬프트 본문

당신은 사내 문서 정리 도우미입니다.

[문서]
{sourceDoc}

[추출 항목]
1. 문서 제목
2. 작성자 (없으면 "미상")
3. 작성일 (없으면 "미상")
4. 핵심 요약 (3문장 이내)
5. 주요 항목 (항목명 + 설명, 최대 5개)
6. 특이사항 또는 주의점 (있는 경우만)

[출력 규칙]
- 각 항목을 "■ 항목명" 머리표 + 줄바꿈으로 구분
- 주요 항목 5개는 "- 항목명: 설명" 형식
- 본문에 없는 내용을 만들어내지 마세요. 없으면 "미상" 또는 "해당 없음".

Step 4 — 출력 변수 정의

추출 결과를 그대로 Word 아웃풋에 매핑할 수 있도록, 구조화된 출력 변수를 만듭니다.

변수명 형식 비고
title 텍스트 문서 제목
author 텍스트 작성자
writtenDate 텍스트 작성일
summary 텍스트 (긴 텍스트) 핵심 요약
items 텍스트 (긴 텍스트) 주요 항목 5개 (마크다운/HTML 표 가능)
notes 텍스트 특이사항

출력 변수를 잘 쪼개두면 다음 실습 ②의 Word 템플릿 매핑이 단순해집니다. 한 덩어리 텍스트로 받으면 분할 작업이 추가됩니다.


Step 5 — 단독 테스트

테스트 탭에서:

  1. sourceDoc 자리에 강의용 PDF 1개 업로드
    • 권장: 3~5쪽짜리 사내 문서 형태 (사규, 안내문, 제안서 일부)
  2. 테스트 실행
  3. 출력의 6가지 항목이 모두 채워졌는지 확인

기대 출력 예시

■ 문서 제목
2026년 상반기 사내 복지 개선안

■ 작성자
총무팀 김지원

■ 작성일
2026-03-15

■ 핵심 요약
- 건강검진 항목을 확대하고 가족 동반 옵션을 추가합니다.
- 원격 근무 지원금을 월 10만원에서 15만원으로 인상합니다.
- 사내 동호회 지원 예산을 연 200만원으로 통일합니다.

■ 주요 항목
- 건강검진 확대: 기존 기본검진 → 종합검진 + 가족 옵션
- 원격 근무 지원금: 10만원 → 15만원/월
- 동호회 지원: 팀별 차등 → 연 200만원 통일
- 교육 포인트: 신규 도입, 연 50만 포인트
- 휴게공간 리모델링: 3층 라운지 확대

■ 특이사항
건강검진 확대는 4월부터, 나머지는 7월부터 적용

자주 나오는 문제

증상 원인 대응
항목이 비어 있음 문서에 정말 없거나, 모호하게 적힘 “없으면 미상” 폴백 명시
AI가 본문에 없는 내용을 만듦 추출 규칙 누락 “본문에 없는 내용을 만들지 마세요” 추가
items가 너무 짧음 “최대 5개” 만 명시 “5개 — 항목당 최소 한 줄 설명”
출력 변수가 매번 위치가 다름 헤더 형식 불일치 “■ 항목명” 처럼 고정된 머리표

체크리스트

  • DocExtractor 프롬프트 생성
  • 입력 변수 sourceDoc (파일 형식)
  • 출력 변수 6개 (title~notes)
  • 강의용 PDF 1개로 단독 테스트 통과

다음 단계

실습 ② — Word 아웃풋 + 흐름 연결에서 이 추출 결과를 Word 템플릿에 채워 .docx로 출력합니다.


문과생을 위한 Copilot Studio — 개발자 없이 만드는 우리 팀 전용 AI

This site uses Just the Docs, a documentation theme for Jekyll.