Spaces:

jeongsoo
/

RAG5_SearchStrategy_FastSTT

Sleeping

App Files Files Community

RAG5_SearchStrategy_FastSTT / utils /llm_client.py

jeongsoo

Initial commit

1555e87 10 months ago

raw

history blame contribute delete

6.87 kB

	"""
	DeepSeek LLM API 클라이언트 모듈
	"""

	import os
	import json
	import logging
	import requests
	from typing import List, Dict, Any, Optional, Union
	from dotenv import load_dotenv

	# 환경 변수 로드
	load_dotenv()

	# 로거 설정
	logger = logging.getLogger("DeepSeekLLM")
	if not logger.hasHandlers():
	handler = logging.StreamHandler()
	formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
	handler.setFormatter(formatter)
	logger.addHandler(handler)
	logger.setLevel(logging.INFO)

	class DeepSeekLLM:
	"""DeepSeek LLM API 래퍼 클래스"""

	def __init__(self):
	"""DeepSeek LLM 클래스 초기화"""
	self.api_key = os.getenv("DEEPSEEK_API_KEY")
	self.endpoint = os.getenv("DEEPSEEK_ENDPOINT", "https://api.deepseek.com/v1/chat/completions")
	self.model = os.getenv("DEEPSEEK_MODEL", "deepseek-chat")

	if not self.api_key:
	logger.warning("DeepSeek API 키가 .env 파일에 설정되지 않았습니다.")
	logger.warning("DEEPSEEK_API_KEY를 확인하세요.")
	else:
	logger.info("DeepSeek LLM API 키 로드 완료.")

	def chat_completion(
	self,
	messages: List[Dict[str, str]],
	temperature: float = 0.7,
	max_tokens: int = 1000,
	stream: bool = False,
	**kwargs
	) -> Dict[str, Any]:
	"""
	DeepSeek 채팅 완성 API 호출

	Args:
	messages: 채팅 메시지 목록
	temperature: 생성 온도 (낮을수록 결정적)
	max_tokens: 생성할 최대 토큰 수
	stream: 스트리밍 응답 활성화 여부
	**kwargs: 추가 API 매개변수

	Returns:
	API 응답 (딕셔너리)
	"""
	if not self.api_key:
	logger.error("API 키가 설정되지 않아 DeepSeek API를 호출할 수 없습니다.")
	raise ValueError("DeepSeek API 키가 설정되지 않았습니다.")

	headers = {
	"Authorization": f"Bearer {self.api_key}",
	"Content-Type": "application/json"
	}

	payload = {
	"model": self.model,
	"messages": messages,
	"temperature": temperature,
	"max_tokens": max_tokens,
	"stream": stream,
	**kwargs
	}

	try:
	logger.info(f"DeepSeek API 요청 전송 중: {self.endpoint}")
	response = requests.post(
	self.endpoint,
	headers=headers,
	json=payload,
	timeout=60 # 타임아웃 설정
	)
	response.raise_for_status()

	if stream:
	return response # 스트리밍 응답은 원시 응답 객체 반환
	else:
	return response.json()

	except requests.exceptions.Timeout:
	logger.error("DeepSeek API 요청 시간 초과")
	raise TimeoutError("DeepSeek API 요청 시간 초과")
	except requests.exceptions.RequestException as e:
	logger.error(f"DeepSeek API 요청 실패: {e}")
	if hasattr(e, 'response') and e.response is not None:
	logger.error(f"응답 코드: {e.response.status_code}, 내용: {e.response.text}")
	raise ConnectionError(f"DeepSeek API 요청 실패: {e}")

	def generate(
	self,
	prompt: str,
	system_prompt: Optional[str] = None,
	temperature: float = 0.7,
	max_tokens: int = 1000,
	**kwargs
	) -> str:
	"""
	간단한 텍스트 생성 인터페이스

	Args:
	prompt: 사용자 프롬프트
	system_prompt: 시스템 프롬프트 (선택 사항)
	temperature: 생성 온도
	max_tokens: 생성할 최대 토큰 수
	**kwargs: 추가 API 매개변수

	Returns:
	생성된 텍스트
	"""
	messages = []

	if system_prompt:
	messages.append({"role": "system", "content": system_prompt})

	messages.append({"role": "user", "content": prompt})

	try:
	response = self.chat_completion(
	messages=messages,
	temperature=temperature,
	max_tokens=max_tokens,
	**kwargs
	)

	if not response or "choices" not in response or not response["choices"]:
	logger.error("DeepSeek API 응답에서 생성된 텍스트를 찾을 수 없습니다.")
	return ""

	return response["choices"][0]["message"]["content"].strip()

	except Exception as e:
	logger.error(f"텍스트 생성 중 오류 발생: {e}")
	return f"오류: {str(e)}"

	def rag_generate(
	self,
	query: str,
	context: List[str],
	system_prompt: Optional[str] = None,
	temperature: float = 0.3,
	max_tokens: int = 1000,
	**kwargs
	) -> str:
	"""
	RAG 검색 결과를 활용한 텍스트 생성

	Args:
	query: 사용자 질의
	context: 검색된 문맥 목록
	system_prompt: 시스템 프롬프트 (선택 사항)
	temperature: 생성 온도
	max_tokens: 생성할 최대 토큰 수
	**kwargs: 추가 API 매개변수

	Returns:
	생성된 텍스트
	"""
	if not system_prompt:
	system_prompt = """당신은 검색 결과를 기반으로 질문에 답변하는 도우미입니다.
	- 검색 결과는 <context> 태그 안에 제공됩니다.
	- 검색 결과에 답변이 있으면 해당 정보를 사용하여 명확하게 답변하세요.
	- 검색 결과에 답변이 없으면 "검색 결과에 관련 정보가 없습니다"라고 말하세요.
	- 검색 내용을 그대로 복사하지 말고, 자연스러운 한국어로 답변을 작성하세요.
	- 답변은 간결하고 정확하게 제공하세요."""

	context_text = "\n\n".join([f"문서 {i+1}: {doc}" for i, doc in enumerate(context)])

	prompt = f"""질문: {query}

	<context>
	{context_text}
	</context>

	위 검색 결과를 참고하여 질문에 답변해 주세요."""

	try:
	return self.generate(
	prompt=prompt,
	system_prompt=system_prompt,
	temperature=temperature,
	max_tokens=max_tokens,
	**kwargs
	)
	except Exception as e:
	logger.error(f"RAG 텍스트 생성 중 오류 발생: {e}")
	return f"오류: {str(e)}"