Skip to content

glowElephant/PDF_TO_VIDEO

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PDF-to-Video Generator 🎬📄

AI를 활용하여 PDF 문서를 자동으로 요약하고, 요약된 내용에 맞는 이미지를 생성하고, 음성을 합성하여 최종적으로 하나의 영상으로 제작하는 프로그램입니다.


🛠 사용 기술 (Tech Stack)

  • Python: 전체 프로그램 구성 및 자동화 스크립트 작성
  • OpenAI GPT: PDF 내용을 요약하는 데 사용
  • Midjourney: 요약된 텍스트 기반 이미지 생성
  • D-ID: AI 음성 합성 및 캐릭터 애니메이션 생성

📚 주요 기능 (Features)

  • PDF 파일 읽기 및 텍스트 추출
  • GPT를 이용한 내용 요약
  • 요약 내용에 기반한 이미지 생성 (Midjourney 사용)
  • 요약 내용을 음성으로 변환 및 생성 (D-ID 사용)
  • 생성된 이미지와 음성을 결합하여 영상 파일로 저장

🧩 프로그램 흐름 (Workflow)

  1. 사용자가 PDF 파일을 업로드합니다.
  2. 프로그램이 PDF에서 텍스트를 추출하고 GPT를 통해 요약합니다.
  3. 요약된 텍스트를 기반으로 Midjourney를 이용해 이미지를 생성합니다.
  4. D-ID를 활용하여 요약 내용을 음성으로 합성합니다.
  5. 생성된 이미지 + 음성을 사용해 하나의 영상 파일을 완성합니다.

About

PDF → summary → matching images → narrated video automation pipeline. GPT + Midjourney + D-ID.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages