perachon commited on
Commit
65d7985
·
verified ·
1 Parent(s): 7c62c04

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +60 -51
README.md CHANGED
@@ -1,51 +1,60 @@
1
- # HF Spaces (gratuit / CPU Basic) — endpoint FastAPI (sans vLLM)
2
-
3
- Objectif: obtenir un **endpoint cloud de démonstration** gratuit (CPU) pour l’API du POC.
4
-
5
- Important: ce déploiement **n’utilise pas vLLM** (vLLM requiert un GPU pour être pertinent/rapide). Le rapport explique l’option vLLM (GPU) comme voie recommandée si budget.
6
-
7
- ## Ce que ce Space fournit
8
-
9
- - `GET /health`
10
- - `POST /triage`
11
- - `GET /audit/{interaction_id}`
12
- - Swagger: `/docs`
13
-
14
- Backend par défaut: `TRIAGE_BACKEND=stub` (ne charge pas de modèle).
15
-
16
- ## Déploiement
17
-
18
- Dans ton Space `perachon/p14-space` (SDK Docker, template Blank, CPU Basic):
19
-
20
- 0) Crée un `README.md` **à la racine du Space** avec le front-matter YAML Spaces (obligatoire).
21
- - Template prêt à copier: `cloud/hf_spaces_cpu/README.space_root.md` (à coller dans `README.md` du Space)
22
-
23
- 1) Mets un `Dockerfile` à la racine du Space.
24
- 2) Mets `start.sh` à la racine.
25
- 3) Copie `src/` (le package `triage_llm`) dans le Space.
26
- 4) Copie `requirements-api.txt` dans le Space.
27
-
28
- Astuce: le plus simple est de copier/coller le contenu des fichiers de ce dossier (`cloud/hf_spaces_cpu/`) vers la racine du repo du Space.
29
-
30
- ## URL runtime
31
-
32
- Quand le Space est "Running", l’URL publique est généralement:
33
-
34
- - `https://perachon-p14-space.hf.space`
35
-
36
- Puis:
37
-
38
- - `https://perachon-p14-space.hf.space/health`
39
- - `https://perachon-p14-space.hf.space/docs`
40
-
41
- ## Test rapide (PowerShell)
42
-
43
- ```powershell
44
- $base = "https://perachon-p14-space.hf.space"
45
- Invoke-RestMethod "$base/health" | ConvertTo-Json -Depth 6
46
-
47
- $payload = @{ patient_message = "J'ai mal à la gorge depuis 2 jours, nez qui coule, pas de fièvre."; lang = "fr"; context = @{} }
48
- $json = ($payload | ConvertTo-Json -Depth 6)
49
- $bytes = [System.Text.Encoding]::UTF8.GetBytes($json)
50
- Invoke-RestMethod "$base/triage" -Method Post -ContentType "application/json; charset=utf-8" -Body $bytes | ConvertTo-Json -Depth 10
51
- ```
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: p14-space
3
+ emoji: "🩺"
4
+ colorFrom: indigo
5
+ colorTo: blue
6
+ sdk: docker
7
+ pinned: false
8
+ ---
9
+
10
+ # HF Spaces (gratuit / CPU Basic) — endpoint FastAPI (sans vLLM)
11
+
12
+ Objectif: obtenir un **endpoint cloud de démonstration** gratuit (CPU) pour l’API du POC.
13
+
14
+ Important: ce déploiement **n’utilise pas vLLM** (vLLM requiert un GPU pour être pertinent/rapide). Le rapport explique l’option vLLM (GPU) comme voie recommandée si budget.
15
+
16
+ ## Ce que ce Space fournit
17
+
18
+ - `GET /health`
19
+ - `POST /triage`
20
+ - `GET /audit/{interaction_id}`
21
+ - Swagger: `/docs`
22
+
23
+ Backend par défaut: `TRIAGE_BACKEND=stub` (ne charge pas de modèle).
24
+
25
+ ## Déploiement
26
+
27
+ Dans ton Space `perachon/p14-space` (SDK Docker, template Blank, CPU Basic):
28
+
29
+ 0) Crée un `README.md` **à la racine du Space** avec le front-matter YAML Spaces (obligatoire).
30
+ - Template prêt à copier: `cloud/hf_spaces_cpu/README.space_root.md` (à coller dans `README.md` du Space)
31
+
32
+ 1) Mets un `Dockerfile` à la racine du Space.
33
+ 2) Mets `start.sh` à la racine.
34
+ 3) Copie `src/` (le package `triage_llm`) dans le Space.
35
+ 4) Copie `requirements-api.txt` dans le Space.
36
+
37
+ Astuce: le plus simple est de copier/coller le contenu des fichiers de ce dossier (`cloud/hf_spaces_cpu/`) vers la racine du repo du Space.
38
+
39
+ ## URL runtime
40
+
41
+ Quand le Space est "Running", l’URL publique est généralement:
42
+
43
+ - `https://perachon-p14-space.hf.space`
44
+
45
+ Puis:
46
+
47
+ - `https://perachon-p14-space.hf.space/health`
48
+ - `https://perachon-p14-space.hf.space/docs`
49
+
50
+ ## Test rapide (PowerShell)
51
+
52
+ ```powershell
53
+ $base = "https://perachon-p14-space.hf.space"
54
+ Invoke-RestMethod "$base/health" | ConvertTo-Json -Depth 6
55
+
56
+ $payload = @{ patient_message = "J'ai mal à la gorge depuis 2 jours, nez qui coule, pas de fièvre."; lang = "fr"; context = @{} }
57
+ $json = ($payload | ConvertTo-Json -Depth 6)
58
+ $bytes = [System.Text.Encoding]::UTF8.GetBytes($json)
59
+ Invoke-RestMethod "$base/triage" -Method Post -ContentType "application/json; charset=utf-8" -Body $bytes | ConvertTo-Json -Depth 10
60
+ ```