Spaces:

imseldrith
/

dantts

Paused

App Files Files Community

imseldrith commited on Jul 21, 2024

Commit

a07ed46

verified ·

1 Parent(s): eece182

Upload 3 files

Browse files

Files changed (3) hide show

src/functions.py +53 -0
src/main.py +101 -0
src/schemas.py +9 -0

src/functions.py ADDED Viewed

	@@ -0,0 +1,53 @@

+import time
+import json
+def get_time_utc(zone ,delay=0):
+    loc_time = time.gmtime(time.time() + delay + zone * 60 * 60)
+    return time.strftime("%Y-%m-%d %H:%M:%S",loc_time)
+def clear_dict(d):
+    if d is None:
+        return None
+    elif isinstance(d, list):
+        return list(filter(lambda x: x is not None, map(clear_dict, d)))
+    elif not isinstance(d, dict):
+        return d
+    else:
+        r = dict(
+                filter(lambda x: x[1] is not None,
+                    map(lambda x: (x[0], clear_dict(x[1])),
+                        d.items())))
+        if not bool(r):
+            return None
+        return r
+def print_env(server_port=6006, sleep=3):
+    print("")
+    print("")
+    print("###########################################")
+    print("environment variable start-----------------------------------")
+    print("###########################################")
+    print("")
+    print("server_port: " + str(server_port))
+    print("")
+    print("###########################################")
+    print("Please check the environment variables (the program will start in 3 seconds) ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑")
+    print("###########################################")
+    print("")
+    print("")
+    time.sleep(sleep)
+    return
+def print_log(request, respose, time_start=0):
+    print("______________________________________________")
+    print("request" + ":::\n" + json.dumps(clear_dict(request.__dict__))) # class dict convert to json
+    print("respose" + ":::")
+    if isinstance(respose, dict) or isinstance(respose,list):
+        print(respose)
+    else:
+        print(respose.__dict__)
+    print("cost:::\n" + str(time.time() - time_start) + "s")
+    print("finish:::\n" + get_time_utc(-8))
+    return

src/main.py ADDED Viewed

	@@ -0,0 +1,101 @@

+from fastapi import FastAPI
+import schemas
+import uvicorn
+from starlette.middleware.cors import CORSMiddleware
+from functions import *
+import base64
+import os
+import traceback
+from bark import SAMPLE_RATE, generate_audio, preload_models
+import soundfile as sf
+import wave
+import numpy as np
+import nltk
+# fastapi port
+server_port = 6006
+# Preload model
+preload_models()
+app = FastAPI(docs_url=None, redoc_url=None)
+# Set allowed access domain names
+origins = ["*"]  # set to "*" means all.
+def concatenate_wavs(wav_files, output_file, silence_duration=0.3):
+    wavs = [wave.open(f, 'rb') for f in wav_files]
+    sampwidth = wavs[0].getsampwidth()
+    framerate = wavs[0].getframerate()
+    nchannels = wavs[0].getnchannels()
+    samples = [wav.readframes(wav.getnframes()) for wav in wavs]
+    total_frames = sum(len(s) for s in samples) + int(silence_duration * framerate * nchannels * sampwidth)
+    output = wave.open(output_file, 'wb')
+    output.setparams((nchannels, sampwidth, framerate, total_frames, 'NONE', 'Uncompressed'))
+    for s in samples:
+        output.writeframes(s)
+        silence_frame = np.zeros((int(silence_duration * framerate), 2)).astype(np.int16).tobytes()
+        for i in range(int(nchannels / 2)):
+            output.writeframes(silence_frame)
+    output.close()
+# Set cross domain parameter transfer
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=origins,  # Set allowed origins sources
+    allow_credentials=True,
+    allow_methods=["*"],  # Set up HTTP methods that allow cross domain access, such as get, post, put, etc.
+    allow_headers=["*"])  # Allowing cross domain headers can be used to identify sources and other functions.
+@app.post("/tts_bark/")
+async def tts_bark(item: schemas.generate_web):
+    time_start = time.time()
+    text = item.text
+    print(f"{text=}")
+    try:
+        sentences = nltk.sent_tokenize(text)
+        idx = 1
+        wavs = []
+        for s in sentences:
+            audio_array = generate_audio(s, history_prompt="en_speaker_8", text_temp=0.6, waveform_temp=0.6)
+            fname = f"tmp-{idx}.wav"
+            sf.write(fname, audio_array, SAMPLE_RATE)
+            idx += 1
+            wavs.append(fname)
+        file_name_pre = f"out-{time.time()}"
+        file_name_wav = file_name_pre + ".wav"
+        file_name_ogg = file_name_pre + ".ogg"
+        concatenate_wavs(wavs, file_name_wav)
+        # convert to OGG
+        os.system("ffmpeg -i " + file_name_wav + " -c:a libopus -b:a 64k -y " + file_name_ogg)
+        with open(file_name_ogg, "rb") as f:
+            audio_content = f.read()
+        base64_audio = base64.b64encode(audio_content).decode("utf-8")
+        res = {"file_base64": base64_audio,
+               "audio_text": text,
+               "file_name": file_name_ogg,
+               }
+        print_log(item, res, time_start)
+        os.remove(file_name_wav)
+        os.remove(file_name_ogg)
+        return res
+    except Exception as err:
+        res = {"code": 9, "msg": "api error", "err": str(err), "traceback": traceback.format_exc()}
+        print_log(item, res, time_start)
+        return res
+if __name__ == '__main__':
+    print_env(server_port)
+    uvicorn.run(app="main:app", host="0.0.0.0", port=server_port, reload=False)

src/schemas.py ADDED Viewed

	@@ -0,0 +1,9 @@

+from pydantic import BaseModel
+from typing import Union
+class generate_web(BaseModel):
+    text: Union[str, None] = None
+    class Config:
+        orm_mode = True