AI를 활용하여 PDF 문서를 자동으로 요약하고, 요약된 내용에 맞는 이미지를 생성하고, 음성을 합성하여 최종적으로 하나의 영상으로 제작하는 프로그램입니다.
- Python: 전체 프로그램 구성 및 자동화 스크립트 작성
- OpenAI GPT: PDF 내용을 요약하는 데 사용
- Midjourney: 요약된 텍스트 기반 이미지 생성
- D-ID: AI 음성 합성 및 캐릭터 애니메이션 생성
- PDF 파일 읽기 및 텍스트 추출
- GPT를 이용한 내용 요약
- 요약 내용에 기반한 이미지 생성 (Midjourney 사용)
- 요약 내용을 음성으로 변환 및 생성 (D-ID 사용)
- 생성된 이미지와 음성을 결합하여 영상 파일로 저장
- 사용자가 PDF 파일을 업로드합니다.
- 프로그램이 PDF에서 텍스트를 추출하고 GPT를 통해 요약합니다.
- 요약된 텍스트를 기반으로 Midjourney를 이용해 이미지를 생성합니다.
- D-ID를 활용하여 요약 내용을 음성으로 합성합니다.
- 생성된 이미지 + 음성을 사용해 하나의 영상 파일을 완성합니다.