Spaces:

liloumln
/

AI

Sleeping

App Files Files Community

liloumln commited on Oct 26, 2025

Commit

85707bb

verified ·

1 Parent(s): b90437f

Upload 9 files

Browse files

Files changed (9) hide show

CITATIONS.md +17 -0
DEMO_SCRIPT_FR.md +24 -0
PROMPTS.md +19 -0
README.md +49 -12
USER_GUIDE_FR.md +25 -0
app.py +55 -0
nlp_utils.py +100 -0
requirements.txt +7 -0
sample_transcript.txt +7 -0

CITATIONS.md ADDED Viewed

	@@ -0,0 +1,17 @@

+# CITATIONS
+## Packages
+- **gradio** (Apache 2.0)
+- **transformers** (Apache 2.0) — Wolf et al. 2020
+- **torch** (BSD-style)
+- **sentencepiece** (Apache 2.0)
+- **faster-whisper** (MIT) — implémentation rapide de Whisper
+- **numpy**, **tqdm** (BSD/MIT)
+## Modèles (Hugging Face)
+- `facebook/bart-large-cnn` — Résumé (MIT)
+- `google/flan-t5-large` — Génération/Extraction (Apache 2.0)
+- `Systran/faster-whisper-small` (par défaut dans le code) — Transcription (MIT)
+## Données
+- `data/sample_transcript.txt` — exemple synthétique pour tests.

DEMO_SCRIPT_FR.md ADDED Viewed

	@@ -0,0 +1,24 @@

+# Script de démo (≤ 5 min) — MeetingNotes AI
+0:00–0:20 — Contexte
+- Trop de réunions, pas assez de temps → MeetingNotes AI
+0:20–1:20 — Démo live
+- Collez `data/sample_transcript.txt` ou uploadez un petit .mp3
+- Cliquez **Analyser**
+- Montrez Résumé + Actions + Décisions
+1:20–2:20 — minutes.md
+- Téléchargez / ouvrez le fichier généré
+- Montrez la structure: Titre, Résumé, Actions, Décisions
+2:20–3:30 — Comment ça marche
+- Transcription: faster-whisper (small)
+- Résumé: BART CNN
+- Extraction: Flan-T5 (JSON strict)
+3:30–4:30 — Impact
+- Gain de temps, clarté des responsabilités, meilleur suivi
+4:30–5:00 — CTA
+- Disponible en Space Hugging Face / local

PROMPTS.md ADDED Viewed

	@@ -0,0 +1,19 @@

+# PROMPTS — MeetingNotes AI
+## Résumé (BART via `pipeline("summarization")`)
+- Pas de prompt custom (pipeline par défaut).
+## Actions & Décisions (Flan-T5)
+Template utilisé dans `nlp_utils.py` :
+```
+Tu es un assistant de prise de notes de réunion.
+À partir du transcript ci-dessous, extrais :
+1) une liste concise de "Points d'action" (qui fait quoi, verbe à l'infinitif, deadline si mentionnée)
+2) une liste "Décisions prises" (phrases courtes)
+Retourne du JSON strict de la forme :
+{"actions": ["...","..."], "decisions": ["...","..."]}
+Transcript:
+{TRANSCRIPT}
+```

README.md CHANGED Viewed

@@ -1,12 +1,49 @@
----
-title: AI
-emoji: 📈
-colorFrom: yellow
-colorTo: gray
-sdk: gradio
-sdk_version: 5.49.1
-app_file: app.py
-pinned: false
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# MeetingNotes AI — Résumeur de réunions
+**But** : Uploader un **audio** (ou coller un **transcript**) et obtenir :
+- ✅ Un **résumé clair**
+- 🧱 des **points d'action** (Action items)
+- 🧩 les **décisions prises**
+- 🗂️ un fichier **minutes.md** à partager
+**Tech**
+- Transcription : `faster-whisper` (implémentation rapide de Whisper, CPU/GPU)
+- Résumé : `facebook/bart-large-cnn`
+- Extraction actions/décisions : `google/flan-t5-large`
+- Interface : **Gradio**
+## Installation (local)
+```bash
+python -m venv .venv
+source .venv/bin/activate         # Windows: .venv\Scripts\activate
+pip install -r requirements.txt
+# (Optionnel) installez ffmpeg si besoin d'audio :
+# macOS: brew install ffmpeg
+# Ubuntu/Debian: sudo apt-get install -y ffmpeg
+python app.py
+```
+## Déploiement Hugging Face Spaces (recommandé)
+1. Créez un Space (SDK: **Gradio**, visibilité: Public).
+2. Uploadez **tous les fichiers** de ce dossier.
+3. Attendez la fin du build (il lit `requirements.txt`).
+4. Testez: chargez un `.mp3/.wav` ou collez un transcript.
+## Structure
+```
+MeetingNotes_AI/
+├─ app.py                   # UI Gradio
+├─ nlp_utils.py             # Transcription + résumé + extraction actions/décisions
+├─ requirements.txt
+├─ PROMPTS.md               # Prompts et log d'utilisation d'outils
+├─ CITATIONS.md             # Paquets et modèles utilisés
+├─ USER_GUIDE_FR.md         # Guide utilisateur détaillé (FR)
+├─ DEMO_SCRIPT_FR.md        # Script vidéo ≤ 5 min (FR)
+├─ data/
+│  └─ sample_transcript.txt
+└─ outputs/                 # minutes.md généré
+```
+## Licence
+MIT — 2025

USER_GUIDE_FR.md ADDED Viewed

	@@ -0,0 +1,25 @@

+# Guide Utilisateur (FR) — MeetingNotes AI
+## Lancer l'app
+- Local: voir README (venv → pip install → `python app.py`)
+- Hugging Face Spaces: uploader les fichiers et ouvrir le Space
+## Utilisation
+1. **Choisir l'entrée** :
+   - Uploader un **fichier audio** (.mp3/.wav) → clique **Analyser** pour transcrire.
+   - OU **coller un transcript** dans la zone de texte.
+2. **Sorties** :
+   - **Résumé** (1–2 paragraphes)
+   - **Points d'action** (liste)
+   - **Décisions prises** (liste)
+   - **minutes.md** téléchargeable dans la zone **Fichiers**
+3. **Bonnes pratiques** :
+   - Pour l'audio, privilégier un enregistrement clair.
+   - Si plusieurs locuteurs, la transcription reste utile mais n'est pas diarizée par défaut.
+   - Vous pouvez corriger le transcript puis relancer l'extraction.
+## Dépannage
+- Si l'audio ne fonctionne pas: installez **ffmpeg**.
+- Si c'est lent: utilisez un modèle Whisper plus petit (tiny/base) ou `flan-t5-base`.

app.py ADDED Viewed

	@@ -0,0 +1,55 @@

+import gradio as gr, os, json
+from nlp_utils import transcribe_audio, summarize, extract_actions_decisions, make_minutes_md
+OUT_DIR = "outputs"
+os.makedirs(OUT_DIR, exist_ok=True)
+def process(audio_file, transcript_text, meeting_title):
+    text = ""
+    if audio_file is not None:
+        text = transcribe_audio(audio_file)
+    if transcript_text and transcript_text.strip():
+        extra = transcript_text.strip()
+        text = (text + "\n" + extra).strip() if text else extra
+    if not text or len(text) < 40:
+        return "Merci d'uploader un audio OU de coller un transcript (≥ 40 caractères).", "", [], [], None
+    resum = summarize(text)
+    ed = extract_actions_decisions(text)
+    actions = ed.get("actions", [])
+    decisions = ed.get("decisions", [])
+    title = meeting_title or "Réunion"
+    md = make_minutes_md(title, resum, actions, decisions)
+    md_path = os.path.join(OUT_DIR, "minutes.md")
+    with open(md_path, "w", encoding="utf-8") as f:
+        f.write(md)
+    # HighlightedText expects list of (text, label). We'll tag each item.
+    actions_ht = [(a, "Action") for a in actions] if actions else []
+    decisions_ht = [(d, "Décision") for d in decisions] if decisions else []
+    return "Analyse terminée ✅", resum, actions_ht, decisions_ht, md_path
+with gr.Blocks(title="MeetingNotes AI — Résumeur de réunions") as demo:
+    gr.Markdown("# MeetingNotes AI — Résumeur de réunions")
+    gr.Markdown("Chargez un **audio** ou **collez un transcript**, puis cliquez **Analyser**.")
+    with gr.Row():
+        with gr.Column():
+            meeting_title = gr.Textbox(label="Titre de la réunion", value="Lancement produit — Weekly")
+            audio = gr.Audio(label="Audio (mp3/wav)", sources=["upload"], type="filepath")
+            transcript = gr.Textbox(label="Transcript (optionnel si audio)", lines=10, placeholder="Collez ici…")
+            btn = gr.Button("Analyser")
+        with gr.Column():
+            status = gr.Textbox(label="Statut")
+            resume = gr.Textbox(label="Résumé", lines=8)
+            actions = gr.HighlightedText(label="Points d'action", combine_adjacent=True)
+            decisions = gr.HighlightedText(label="Décisions prises", combine_adjacent=True)
+            files = gr.File(label="Télécharger minutes.md")
+    btn.click(process, inputs=[audio, transcript, meeting_title], outputs=[status, resume, actions, decisions, files])
+if __name__ == "__main__":
+    demo.launch()

nlp_utils.py ADDED Viewed

	@@ -0,0 +1,100 @@

+import os, json, re, datetime
+from typing import Dict, List, Optional
+from transformers import pipeline
+from faster_whisper import WhisperModel
+# --------- Models (lazy init) ---------
+_SUMMARIZER = None
+_QA = None
+_WHISPER = None
+def get_summarizer():
+    global _SUMMARIZER
+    if _SUMMARIZER is None:
+        _SUMMARIZER = pipeline("summarization", model="facebook/bart-large-cnn")
+    return _SUMMARIZER
+def get_extractor():
+    """Use Flan-T5 for JSON-style action/decision extraction via text2text pipeline."""
+    global _QA
+    if _QA is None:
+        _QA = pipeline("text2text-generation", model="google/flan-t5-large", max_new_tokens=256)
+    return _QA
+def get_whisper(device: str = "auto"):
+    global _WHISPER
+    if _WHISPER is None:
+        _WHISPER = WhisperModel("Systran/faster-whisper-small", device=device, compute_type="int8")
+    return _WHISPER
+# --------- Core functions ---------
+def transcribe_audio(audio_path: str) -> str:
+    model = get_whisper()
+    segments, info = model.transcribe(audio_path, beam_size=1)
+    text = " ".join(seg.text.strip() for seg in segments)
+    return text.strip()
+def summarize(text: str) -> str:
+    summarizer = get_summarizer()
+    chunks = _chunk(text, 2200)
+    partials = [summarizer(ch, do_sample=False)[0]["summary_text"] for ch in chunks]
+    merged = " ".join(partials)
+    final = summarizer(merged, do_sample=False, max_length=200, min_length=60)[0]["summary_text"]
+    return final
+def extract_actions_decisions(text: str) -> Dict[str, List[str]]:
+    prompt = f"""Tu es un assistant de prise de notes de réunion.
+À partir du transcript ci-dessous, extrais :
+1) une liste concise de "Points d'action" (qui fait quoi, verbe à l'infinitif, deadline si mentionnée)
+2) une liste "Décisions prises" (phrases courtes)
+Retourne du JSON strict de la forme :
+{{"actions": ["...","..."], "decisions": ["...","..."]}}
+Transcript:
+{text[:7000]}
+"""
+    gen = get_extractor()
+    out = gen(prompt)[0]["generated_text"]
+    try:
+        data = json.loads(out)
+        actions = [s.strip() for s in data.get("actions", []) if s.strip()]
+        decisions = [s.strip() for s in data.get("decisions", []) if s.strip()]
+        return {"actions": actions, "decisions": decisions}
+    except Exception:
+        actions = []
+        decisions = []
+        for line in text.splitlines():
+            if re.search(r"(?i)\b(action|à faire|todo|faire):", line):
+                actions.append(re.sub(r"(?i)^.*?:\s*", "", line).strip())
+            if re.search(r"(?i)\b(décision|decision):", line):
+                decisions.append(re.sub(r"(?i)^.*?:\s*", "", line).strip())
+        return {"actions": actions, "decisions": decisions}
+def make_minutes_md(title: str, summary: str, actions: List[str], decisions: List[str]) -> str:
+    now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M")
+    lines = [
+        f"# {title} — Compte-rendu",
+        f"_Généré le {now}_",
+        "",
+        "## Résumé",
+        summary.strip() if summary else "—",
+        "",
+        "## Points d'action",
+        *[f"- [ ] {a}" for a in (actions or ["—"])],
+        "",
+        "## Décisions prises",
+        *[f"- {d}" for d in (decisions or ["—"])],
+        "",
+    ]
+    return "\n".join(lines)
+def _chunk(text: str, max_chars: int) -> List[str]:
+    parts, buf, size = [], [], 0
+    import re as _re
+    for sent in _re.split(r'(?<=[\.!\?])\s+', text):
+        if size + len(sent) > max_chars and buf:
+            parts.append(" ".join(buf)); buf, size = [], 0
+        buf.append(sent); size += len(sent) + 1
+    if buf: parts.append(" ".join(buf))
+    return parts

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+gradio>=4.44.0
+transformers>=4.44.0
+torch>=2.2.0
+sentencepiece>=0.1.99
+faster-whisper>=1.0.0
+numpy>=1.26.4
+tqdm>=4.66.4

sample_transcript.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+[00:00] Alice: Bienvenue à tous. Objectif: finaliser le plan de lancement.
+[00:15] Bob: Il nous manque encore les visuels pour la campagne.
+[00:30] Chloé: L'équipe design promet une première version mercredi.
+[00:45] Alice: OK. Décision: on garde le budget à 20k€.
+[01:00] Bob: Action: je contacte l'agence média aujourd'hui.
+[01:15] Chloé: Action: je prépare un check-list pour la page produit.
+[01:30] Alice: Prochaine réunion vendredi 10h. Fin.