persona / README.md
haepada's picture
Update README.md
3769562 verified

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: AI 사물 성격 생성기
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.29.0
app_file: app.py
pinned: false
license: mit

🤖 AI 사물 성격 생성기

Powered by Gemini 2.0 Flash

일상 속 사물의 사진을 업로드하면 AI가 사물을 인식하고, 사용자와의 관계를 분석하여 개성 있는 캐릭터를 만들어주는 서비스입니다. 생성된 페르소나는 QR 코드나 JSON 파일로 저장하고 공유할 수 있습니다.

✨ 주요 기능

1. 🔍 AI 사물 인식

  • Gemini 2.0 Flash Vision: 업로드된 사진에서 사물을 자동 인식
  • 다양한 카테고리 지원: laptop, phone, book, furniture, kitchen, clothing 등
  • 높은 정확도: 구체적인 설명과 상태 분석 제공
  • 수동 입력 지원: AI 인식이 어려운 경우 직접 입력 가능

2. 📝 관계 분석 기반 성격 생성

  • 8가지 관계 질문: 사물별 맞춤 질문으로 깊이 있는 관계 탐구
  • 사용 패턴 분석: 빈도, 기간, 위치, 감정적 유대감 고려
  • AI 자동 추천: 관계 정보를 바탕으로 긍정(4개) + 부정(6개) 특성 추천
  • 커스터마이징: 사용자가 직접 성격 특성 선택 및 조정 가능

3. 🎭 다차원적 성격 모델링

  • 기본 성향: 내향/외향, 감각/직관, 논리/감정, 계획/즉흥 등
  • 소통 스타일: 격식 정도, 직설성, 자발성 조절
  • 성격 특성: 100+ 긍정적/부정적 특성 풀에서 선택
  • 자주 쓰는 말투: AI가 자동 생성하고 수동 수정 가능
  • Big 5 성격 특성: 개방성, 성실성, 친화성, 신경성 등

4. 💬 개성 있는 AI 대화

  • Gemini 2.0 Flash: 생성된 성격에 맞는 자연스러운 대화
  • 말투 반영: 존댓말/반말, 특정 말버릇 및 표현 방식 적용
  • 감정 표현: 긍정/부정 특성이 자연스럽게 드러나는 대화
  • 지속적 기억: 대화 맥락을 기억하며 일관성 있는 응답

5. 📱 페르소나 저장 및 공유

QR 코드 방식

  • 모바일 친화적: QR 이미지를 갤러리에 저장
  • 간편한 공유: 다른 기기에서 QR 이미지 업로드로 페르소나 즉시 복원
  • 데이터 압축: zlib + Base64 인코딩으로 최적화
  • 한글 호환: ASCII 인코딩으로 한글 데이터 안전하게 처리

JSON 파일 방식

  • 완전한 백업: 모든 페르소나 정보를 상세하게 저장
  • 파일 관리: 타임스탬프가 포함된 파일명으로 체계적 관리
  • 크로스 플랫폼: 어떤 기기에서든 JSON 파일로 복원 가능
  • 데이터 무결성: 원본 데이터의 100% 보존

🚀 사용 방법

1단계: 사물 인식

  1. 사진 업로드: 원하는 사물의 사진을 업로드
  2. AI 인식: 'AI로 인식하기' 버튼으로 자동 분류
  3. 수동 입력: 필요시 사물명과 카테고리 직접 입력

2단계: 관계 정보 입력

  1. 기본 관계 정보: 사용 빈도, 함께한 기간, 감정적 유대감 설정
  2. 관계 질문 생성: 사물에 맞는 8가지 맞춤 질문 자동 생성
  3. 질문 응답: 가로 접기 영역에서 각 질문에 자세히 답변

3단계: AI 캐릭터 생성

  1. AI 캐릭터 생성: 관계 정보를 바탕으로 AI가 성격 자동 생성
  2. 성격 조정: 슬라이더로 세부 성향 미세 조정
  3. 특성 선택: 추가 긍정/부정 특성 선택 및 변경
  4. 말투 설정: AI 생성 말투 확인 및 수정

4단계: 대화 및 저장

  1. 실시간 대화: 완성된 캐릭터와 자연스러운 대화
  2. QR 코드 생성: 모바일 공유용 QR 이미지 생성
  3. JSON 저장: 완전한 백업용 파일 다운로드
  4. 페르소나 복원: QR 이미지 또는 JSON 파일로 언제든 불러오기

🛠️ 기술 스택

  • Frontend: Gradio 4.16.0
  • AI Model: Google Gemini 2.0 Flash (Vision + Text)
  • QR Processing: pyzbar (QR 코드 읽기)
  • Language: Python 3.9+
  • Deployment: Hugging Face Spaces

📦 로컬 실행

# 저장소 복제
git clone https://huggingface.co/spaces/haepada/personatest2
cd personatest2

# 의존성 설치
pip install -r requirements.txt

# 환경 변수 설정
export GEMINI_API_KEY="your_api_key_here"

# 실행
python app.py

⚙️ 환경 설정

필수 환경 변수

  • GEMINI_API_KEY: Google Gemini API 키

Hugging Face Secrets 설정

  1. Space Settings → Repository secrets
  2. GEMINI_API_KEY 추가
  3. API 키 값 입력

📱 모바일 활용 팁

  1. QR 코드 저장: 생성된 QR 이미지를 갤러리에 저장
  2. 크로스 디바이스: 다른 기기에서 QR 이미지 업로드로 즉시 복원
  3. 오프라인 공유: 인터넷 없이도 QR 이미지로 페르소나 전달
  4. 백업 관리: 중요한 페르소나는 JSON 파일로도 백업

🎯 특별한 특징

  • 관계 중심 설계: 단순한 성격 테스트가 아닌 사물과의 실제 관계 반영
  • 긍정/부정 균형: 4:6 비율로 현실적이고 입체적인 캐릭터 생성
  • 말투 개성화: 성격에 맞는 고유한 말버릇과 표현 방식
  • 데이터 호환성: QR 코드의 한글 데이터 안전한 인코딩/디코딩
  • 확장 가능성: 다양한 사물 카테고리 지원 및 지속적 업데이트

📄 라이선스

MIT License

👨‍💻 개발자

Made with ❤️ using Gemini 2.0 Flash AI


🔗 서비스 링크: https://huggingface.co/spaces/haepada/personatest2