Spaces:
Sleeping
Sleeping
metadata
title: CertWeb Reranker API
sdk: docker
app_port: 7860
Reranker API (무료 · Colab 불필요)
CertWeb RAG용 Cross-Encoder 리랭커를 Hugging Face Spaces 무료로 서빙합니다.
Colab을 켜 둘 필요 없이, 한 번 배포해 두면 요청 시 자동으로 깨웁니다.
1. 모델을 HF Hub에 올리기
- Hugging Face 로그인 후 New model 생성.
- Colab에서 만든
fine_tuned_reranker폴더 내용을 업로드:config.json,model.safetensors,tokenizer.json,tokenizer_config.json등
- 모델 repo 이름 확인 (예:
your-username/certweb-reranker).
2. 이 Space 만들기
- New Space → 이름 예:
certweb-reranker, SDK: Docker 선택. - 이 폴더 파일들을 Space repo에 넣기:
app.py,requirements.txt,Dockerfile,README.md
- Space Settings → Repository secrets 또는 Variables:
- 이름:
HF_MODEL_ID - 값:
your-username/certweb-reranker(위 1번 모델 repo)
- 이름:
- Space가 빌드·실행되면 App URL이 생깁니다.
예:https://your-username-certweb-reranker.hf.space
3. CertWeb 백엔드에 연결
로컬 또는 Render .env:
RAG_USE_CROSS_ENCODER_RERANKER=true
RAG_CROSS_ENCODER_MODEL=https://your-username-certweb-reranker.hf.space
끝에 슬래시 없이 URL만 넣으면 됩니다.
API 규약
- POST /
Body:{"query": "질문", "passages": ["문단1", "문단2", ...]}
Response:{"scores": [0.9, 0.2, ...]}
참고
- 무료 CPU Basic: 16GB RAM. MiniLM 기반 파인튜닝 모델 권장 (2GB급 대형 모델은 OOM 가능).
- 슬립 후 첫 요청은 콜드스타트 30초~1분 걸릴 수 있음. 백엔드 타임아웃 60초 이상 권장.