Spaces:

mrsk1883
/

testing

Sleeping

App Files Files Community

mrsk1883 commited on Dec 9, 2023

Commit

9ba52bb

1 Parent(s): 17cf0e6

Upload 3 files

Browse files

Files changed (3) hide show

Article 11 Hidden Technical Debt in Machine Learning Systems.txt +0 -0
app (1).py +52 -0
requirements (1).txt +14 -0

Article 11 Hidden Technical Debt in Machine Learning Systems.txt ADDED Viewed

Binary file (166 kB). View file

app (1).py ADDED Viewed

	@@ -0,0 +1,52 @@

+import gradio as gr
+from PyPDF2 import PdfReader
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
+from gtts import gTTS
+from io import BytesIO
+import re
+model_name = "ArtifactAI/led_large_16384_arxiv_summarization"
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+def extract_first_sentence(text):
+    sentences = re.split(r'(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s', text)
+    if sentences:
+        return sentences[0]
+    else:
+        return text
+def summarize_pdf_abstract(pdf_file):
+    try:
+        reader = PdfReader(pdf_file)
+        abstract_text = ""
+        for page in reader.pages:
+            if "Abstract" in page.extract_text() or "Introduction" in page.extract_text():
+                abstract_text = page.extract_text()
+                break
+        inputs = tokenizer(abstract_text, return_tensors="pt")
+        outputs = model.generate(**inputs)
+        summary = tokenizer.decode(outputs[0])
+        # Extract only the first sentence
+        summary_sentence = extract_first_sentence(summary)
+        # Generate audio
+        speech = gTTS(text=summary_sentence, lang="en")
+        speech_bytes = BytesIO()
+        speech.write_to_fp(speech_bytes)
+        # Return individual output values
+        return summary_sentence, speech_bytes.getvalue()
+    except Exception as e:
+        raise Exception(str(e))
+interface = gr.Interface(
+    fn=summarize_pdf_abstract,
+    inputs=[gr.File(label="Upload PDF")],
+    outputs=[gr.Textbox(label="Summary"), gr.Audio()],
+)
+interface.launch(share=True)

requirements (1).txt ADDED Viewed

	@@ -0,0 +1,14 @@

+gradio
+transformers
+PyPDF2
+gtts
+torch
+numpy
+pytest
+sphinx
+huggingface-hub
+IPython
+torchvision
+torchaudio
+tensorflow
+flax