Spaces:

ayscript
/

space-d

Sleeping

App Files Files Community

space-d / app.py

ayscript

Update app.py

d69c555 verified 13 days ago

raw

history blame contribute delete

3.05 kB

	import gradio as gr
	import requests
	import soundfile as sf
	import numpy as np
	import tempfile
	import os



	ASR_URL = "https://bissakaai-spaceb.hf.space/gradio_api/call/transcribe_audio"
	LLM_URL = "https://bissakaai-health1.hf.space/gradio_api/call/natlas_infer"
	TTS_URL = "https://ayscript-text-to-speech.hf.space/gradio_api/call/synthesize_speech"



	def call_asr(audio_path):
	payload = {
	"data": [audio_path]
	}
	r = requests.post(ASR_URL, json=payload, timeout=120)
	return r.json()["data"][0]


	def call_llm(text):
	payload = {
	"data": [text]
	}
	r = requests.post(LLM_URL, json=payload, timeout=120)
	return r.json()["data"][0]


	def call_tts(text, language):
	payload = {
	"data": [text, language]
	}
	r = requests.post(TTS_URL, json=payload, timeout=120)
	print(r.json())
	return r.json()["data"][0]





	def healthatlas_pipeline(
	mode,
	text_input,
	audio_input,
	tts_language
	):
	if mode == "Text":
	if not text_input.strip():
	return "Please enter text", None

	llm_response = call_llm(text_input)

	audio_path = call_tts(llm_response, tts_language)
	return llm_response, audio_path

	else: # Audio mode
	if audio_input is None:
	return "Please upload audio", None

	# Save uploaded audio
	sr, audio = audio_input
	with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as f:
	sf.write(f.name, audio, sr)
	audio_path = f.name

	transcription = call_asr(audio_path)
	llm_response = call_llm(transcription)
	audio_out = call_tts(llm_response, tts_language)

	return llm_response, audio_out



	#gradio user interface
	with gr.Blocks(title="HealthAtlas AI") as demo:
	gr.Markdown(
	"""
	# 🏥 HealthAtlas
	Multilingual AI Health Triage Assistant
	Languages: English · Yoruba · Hausa · Igbo
	"""
	)

	mode = gr.Radio(
	["Text", "Audio"],
	value="Text",
	label="Input Mode"
	)

	text_input = gr.Textbox(
	label="Text Input",
	visible=True
	)

	audio_input = gr.Audio(
	label="Audio Input",
	type="numpy",
	visible=False
	)

	tts_language = gr.Dropdown(
	choices=["yoruba", "hausa"],
	value="yoruba",
	label="Speech Output Language"
	)

	output_text = gr.Textbox(
	label="HealthAtlas Response"
	)

	output_audio = gr.Audio(
	label="Spoken Response"
	)

	submit = gr.Button("Submit")

	def toggle_inputs(m):
	return (
	gr.update(visible=m == "Text"),
	gr.update(visible=m == "Audio")
	)

	mode.change(
	toggle_inputs,
	inputs=mode,
	outputs=[text_input, audio_input]
	)

	submit.click(
	healthatlas_pipeline,
	inputs=[mode, text_input, audio_input, tts_language],
	outputs=[output_text, output_audio]
	)

	if __name__ == "__main__":
	demo.launch()