#!/bin/bash # GitHub Codespaces에서 실행하는 스크립트 # PDF를 클라우드 스토리지에서 다운로드 후 인덱싱 echo "클라우드 환경에서 인덱싱" # 1. PDF 다운로드 (예: Google Drive, Dropbox 등) # rclone이나 gdown 등을 사용 # Google Drive 예시: # pip install gdown # gdown --folder YOUR_GOOGLE_DRIVE_FOLDER_ID -O data/pdfs/ # Dropbox 예시: # wget "YOUR_DROPBOX_SHARE_LINK&dl=1" -O pdfs.zip # unzip pdfs.zip -d data/pdfs/ # 2. 인덱싱 실행 python scripts/index_pdfs.py # 3. GitHub에 자동 푸시 git add data/chroma_db/ git commit -m "Add vector database" git push echo "완료!"