실습 ①: PDF 업로드 + 정보 추출 프롬프트
| 시간 | 소요 | 수강생 역할 |
|---|---|---|
| 10:50 | 20분 | 🟢 직접 실습 |
목차
- 이 실습의 목표
- Step 1 — 프롬프트 만들기
- Step 2 — 입력 변수 추가
- Step 3 — 추출 포맷 설계
- Step 4 — 출력 변수 정의
- Step 5 — 단독 테스트
- 자주 나오는 문제
- 체크리스트
- 다음 단계
이 실습의 목표
- AI 빌더 텍스트 프롬프트의 파일 입력을 사용한다
- 입력: PDF 파일 / 출력: 정해진 포맷의 정형 텍스트
- 단독 테스트로 추출 품질을 먼저 검증한다
Step 1 — 프롬프트 만들기
Power Apps → AI 허브 → 프롬프트 → + 새 프롬프트
| 항목 | 값 |
|---|---|
| 이름 | DocExtractor |
| 설명 | PDF에서 제목·요약·항목·특이사항 추출 |
| 모델 | GPT-4o (긴 문서 권장) |
Step 2 — 입력 변수 추가
입력 추가 → 파일 을 선택합니다.
| 변수명 | 형식 | 비고 |
|---|---|---|
sourceDoc |
파일 | PDF/DOCX/PPTX/TXT |
입력 형식을 파일로 두면 프롬프트 본문에
{sourceDoc}자리표시자가 만들어지고, 흐름에서 파일을 그대로 전달할 수 있습니다. (이미지가 아니라 텍스트가 풍부한 문서일 때 사용합니다)
Step 3 — 추출 포맷 설계
추출의 품질은 포맷의 명확성에서 결정됩니다. 모호하면 결과도 들쭉날쭉입니다.
프롬프트 본문
당신은 사내 문서 정리 도우미입니다.
[문서]
{sourceDoc}
[추출 항목]
1. 문서 제목
2. 작성자 (없으면 "미상")
3. 작성일 (없으면 "미상")
4. 핵심 요약 (3문장 이내)
5. 주요 항목 (항목명 + 설명, 최대 5개)
6. 특이사항 또는 주의점 (있는 경우만)
[출력 규칙]
- 각 항목을 "■ 항목명" 머리표 + 줄바꿈으로 구분
- 주요 항목 5개는 "- 항목명: 설명" 형식
- 본문에 없는 내용을 만들어내지 마세요. 없으면 "미상" 또는 "해당 없음".
Step 4 — 출력 변수 정의
추출 결과를 그대로 Word 아웃풋에 매핑할 수 있도록, 구조화된 출력 변수를 만듭니다.
| 변수명 | 형식 | 비고 |
|---|---|---|
title |
텍스트 | 문서 제목 |
author |
텍스트 | 작성자 |
writtenDate |
텍스트 | 작성일 |
summary |
텍스트 (긴 텍스트) | 핵심 요약 |
items |
텍스트 (긴 텍스트) | 주요 항목 5개 (마크다운/HTML 표 가능) |
notes |
텍스트 | 특이사항 |
출력 변수를 잘 쪼개두면 다음 실습 ②의 Word 템플릿 매핑이 단순해집니다. 한 덩어리 텍스트로 받으면 분할 작업이 추가됩니다.
Step 5 — 단독 테스트
테스트 탭에서:
sourceDoc자리에 강의용 PDF 1개 업로드- 권장: 3~5쪽짜리 사내 문서 형태 (사규, 안내문, 제안서 일부)
- 테스트 실행
- 출력의 6가지 항목이 모두 채워졌는지 확인
기대 출력 예시
■ 문서 제목
2026년 상반기 사내 복지 개선안
■ 작성자
총무팀 김지원
■ 작성일
2026-03-15
■ 핵심 요약
- 건강검진 항목을 확대하고 가족 동반 옵션을 추가합니다.
- 원격 근무 지원금을 월 10만원에서 15만원으로 인상합니다.
- 사내 동호회 지원 예산을 연 200만원으로 통일합니다.
■ 주요 항목
- 건강검진 확대: 기존 기본검진 → 종합검진 + 가족 옵션
- 원격 근무 지원금: 10만원 → 15만원/월
- 동호회 지원: 팀별 차등 → 연 200만원 통일
- 교육 포인트: 신규 도입, 연 50만 포인트
- 휴게공간 리모델링: 3층 라운지 확대
■ 특이사항
건강검진 확대는 4월부터, 나머지는 7월부터 적용
자주 나오는 문제
| 증상 | 원인 | 대응 |
|---|---|---|
| 항목이 비어 있음 | 문서에 정말 없거나, 모호하게 적힘 | “없으면 미상” 폴백 명시 |
| AI가 본문에 없는 내용을 만듦 | 추출 규칙 누락 | “본문에 없는 내용을 만들지 마세요” 추가 |
items가 너무 짧음 |
“최대 5개” 만 명시 | “5개 — 항목당 최소 한 줄 설명” |
| 출력 변수가 매번 위치가 다름 | 헤더 형식 불일치 | “■ 항목명” 처럼 고정된 머리표로 |
체크리스트
DocExtractor프롬프트 생성- 입력 변수
sourceDoc(파일 형식) - 출력 변수 6개 (
title~notes) - 강의용 PDF 1개로 단독 테스트 통과
다음 단계
실습 ② — Word 아웃풋 + 흐름 연결에서 이 추출 결과를 Word 템플릿에 채워 .docx로 출력합니다.