Spaces:

NLP-Debater-Project
/

FastAPI-Backend-Models

Sleeping

malek-messaoudii

Correct files

544d113 5 months ago

798 Bytes

	from services.gemini_client import get_gemini_client
	from google.genai import types
	import base64

	async def generate_tts(text: str) -> bytes:
	client = get_gemini_client()

	response = client.models.generate_content(
	model="gemini-2.5-flash-preview-tts",
	contents=text,
	config=types.GenerateContentConfig(
	response_modalities=["AUDIO"],
	speech_config=types.SpeechConfig(
	voice_config=types.VoiceConfig(
	prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name="Kore")
	)
	),
	),
	)

	# Decode base64 audio into bytes
	audio_base64 = response.candidates[0].content.parts[0].inline_data.data
	audio_bytes = base64.b64decode(audio_base64)

	return audio_bytes