Spaces:

VietCat
/

RAGSample

Sleeping

RAGSample / rag_core /embedder.py

update gemini

4942c09 7 months ago

1.71 kB

	import requests
	import time
	import logging
	import os
	from rag_core.utils import log_timed

	@log_timed("gửi API tạo embedding")
	def get_embedding(text: str, retries: int = 3, base_timeout: int = 30):
	api_key = os.getenv("GEMINI_API_KEY")
	if not api_key:
	raise ValueError("Thiếu biến môi trường GEMINI_API_KEY.")

	# Giới hạn độ dài text gửi lên API (ví dụ 8000 ký tự)
	MAX_LEN = 8000
	if not text or not text.strip():
	raise ValueError("Chunk rỗng, không thể tạo embedding.")
	if len(text) > MAX_LEN:
	logging.warning(f"Chunk quá dài ({len(text)} ký tự), sẽ cắt còn {MAX_LEN} ký tự đầu.")
	text = text[:MAX_LEN]

	url = f"https://generativelanguage.googleapis.com/v1/models/text-embedding-004:embedContent?key={api_key}"

	payload = {
	"content": {
	"parts": [
	{ "text": text }
	]
	}
	}

	for i in range(retries):
	try:
	current_timeout = base_timeout * (i + 1)
	response = requests.post(url, json=payload, timeout=current_timeout)
	response.raise_for_status()

	# Kiểm tra phản hồi chứa trường embedding không
	data = response.json()
	if "embedding" not in data:
	raise ValueError(f"Phản hồi không có 'embedding': {data}")
	return data["embedding"]['values']

	except requests.exceptions.RequestException as e:
	logging.warning(f"Lỗi embedding (lần {i+1}/{retries}, timeout={current_timeout}s): {e}")
	if i < retries - 1:
	time.sleep(2)
	else:
	raise