Spaces:

Marcel0123
/

supervised-learning

Sleeping

App Files Files Community

Marcel0123 commited on Aug 27, 2025

Commit

9975da0

verified ·

1 Parent(s): 1d12e6c

Upload 2 files

Browse files

Files changed (1) hide show

app.py +21 -13

app.py CHANGED Viewed

@@ -28,14 +28,14 @@ iets zegt over hun **gezondheid**. Een van de dingen die onderzocht wordt is het
 We gebruiken hier **echte gegevens** uit een medische dataset (dus **geen foto’s**, maar gemeten waarden van mensen
 die in een onderzoek hebben meegedaan). Elke deelnemer heeft:
-- een **BMI-waarde** (hoe zwaar of licht iemand is ten opzichte van zijn lengte),
 - en een **score** die aangeeft hoe ernstig de diabetes bij die persoon verloopt.
 Met lineaire regressie testen we: *kunnen we een lijn tekenen die laat zien of een hogere BMI vaak samenvalt met een
 hogere (of juist lagere) score?*
 **Waarom is dat belangrijk?**
-- Als er wél een duidelijk verband is, kan dit helpen om **risico’s eerder te signaleren**.
 - Als er géén verband is, leren we dat BMI misschien niet de juiste voorspeller is en moet er verder gekeken worden
   naar andere factoren.
@@ -43,6 +43,13 @@ Kortom: dit experiment laat je zien hoe data ons kan helpen om **patronen in gez
 we hier stap voor stap, live op je scherm.
 """
 def load_bmi_diabetes():
     d = datasets.load_diabetes()
     X = d.data[:, 2]  # BMI feature (genormaliseerd)
@@ -67,8 +74,7 @@ def sgd_train_generator(lr, epochs, batch_size, seed, split_seed):
     w, b = 0.0, 0.0
     x_min, x_max = float(np.min(x)), float(np.max(x))
-    train_losses = []
-    test_losses = []
     rng = np.random.RandomState(int(seed))
@@ -108,7 +114,7 @@ def sgd_train_generator(lr, epochs, batch_size, seed, split_seed):
         ax1.scatter(x_te, y_te, alpha=0.8, s=22, marker="x", label="test")
         xs = np.linspace(x_min, x_max, 200)
         ax1.plot(xs, w * xs + b, linewidth=2, label="model")
-        ax1.set_title(f"{{label}} — Epoch {{epoch}}/{{epochs}}")
         ax1.set_xlabel("BMI (genormaliseerd)")
         ax1.set_ylabel("Progressiescore")
         ax1.legend()
@@ -127,14 +133,15 @@ def sgd_train_generator(lr, epochs, batch_size, seed, split_seed):
         ax2.grid(True, linestyle=":", linewidth=0.6)
         plt.tight_layout()
-        # Plain-language results
         verdict = "positief" if w >= 0 else "negatief"
         summary = (
             f"**Wat levert dit op?**\n"
-            f"- Huidige regressielijn: `y = {{w:.4f}} * x + {{b:.4f}}`\n"
-            f"- Train MSE: `{{mse_tr:.2f}}` — Test MSE: `{{mse_te:.2f}}` — Test R²: `{{r2_te:.3f}}`\n"
-            f"- Interpretatie: het verband tussen BMI en progressiescore is **{{verdict}}** in deze dataset "
-            f"(hogere BMI hangt samen met hogere score als `w > 0`)."
         )
         yield fig_main, fig_loss, summary
@@ -151,20 +158,21 @@ with gr.Blocks(title="Diabetes: BMI → Progressiescore (Live Regressie)") as de
             seed = gr.Slider(0, 9999, value=42, step=1, label="Training seed")
             split_seed = gr.Slider(0, 9999, value=7, step=1, label="Train/test split seed")
             train_btn = gr.Button("Train live")
-            story = gr.Markdown(STORY_MD)  # story directly under the button
         with gr.Column(scale=2):
             plot_main = gr.Plot(label="Data (train/test) & regressielijn (live)")
             plot_loss = gr.Plot(label="Loss-curve (MSE per epoch) — train vs test")
             results = gr.Markdown()
-    # Button-triggered training
     train_btn.click(
         fn=sgd_train_generator,
         inputs=[lr, epochs, batch, seed, split_seed],
         outputs=[plot_main, plot_loss, results]
     )
-    # Auto-train on load with defaults
     demo.load(
         fn=sgd_train_generator,
         inputs=[lr, epochs, batch, seed, split_seed],

 We gebruiken hier **echte gegevens** uit een medische dataset (dus **geen foto’s**, maar gemeten waarden van mensen
 die in een onderzoek hebben meegedaan). Elke deelnemer heeft:
+- een **BMI-waarde** (hoe zwaar of licht iemand is ten opzichte van zijn lengte),
 - en een **score** die aangeeft hoe ernstig de diabetes bij die persoon verloopt.
 Met lineaire regressie testen we: *kunnen we een lijn tekenen die laat zien of een hogere BMI vaak samenvalt met een
 hogere (of juist lagere) score?*
 **Waarom is dat belangrijk?**
+- Als er wél een duidelijk verband is, kan dit helpen om **risico’s eerder te signaleren**.
 - Als er géén verband is, leren we dat BMI misschien niet de juiste voorspeller is en moet er verder gekeken worden
   naar andere factoren.
 we hier stap voor stap, live op je scherm.
 """
+CONCLUSION_MD = r"""
+# **Conclusie**
+Mensen met een hogere **BMI** hebben in dit onderzoek gemiddeld vaker een ernstiger verloop van **diabetes**.
+Maar **BMI is niet de enige factor** — leeftijd, erfelijkheid, leefstijl en andere medische waarden spelen ook mee.
+"""
 def load_bmi_diabetes():
     d = datasets.load_diabetes()
     X = d.data[:, 2]  # BMI feature (genormaliseerd)
     w, b = 0.0, 0.0
     x_min, x_max = float(np.min(x)), float(np.max(x))
+    train_losses, test_losses = [], []
     rng = np.random.RandomState(int(seed))
         ax1.scatter(x_te, y_te, alpha=0.8, s=22, marker="x", label="test")
         xs = np.linspace(x_min, x_max, 200)
         ax1.plot(xs, w * xs + b, linewidth=2, label="model")
+        ax1.set_title(f"{label} — Epoch {epoch}/{epochs}")
         ax1.set_xlabel("BMI (genormaliseerd)")
         ax1.set_ylabel("Progressiescore")
         ax1.legend()
         ax2.grid(True, linestyle=":", linewidth=0.6)
         plt.tight_layout()
+        # Resultaten + opvallende conclusie
         verdict = "positief" if w >= 0 else "negatief"
         summary = (
             f"**Wat levert dit op?**\n"
+            f"- Huidige regressielijn: `y = {w:.4f} * x + {b:.4f}`\n"
+            f"- Train MSE: `{mse_tr:.2f}` — Test MSE: `{mse_te:.2f}` — Test R²: `{r2_te:.3f}`\n"
+            f"- Interpretatie: het verband tussen BMI en progressiescore is **{verdict}** in deze dataset "
+            f"(hogere BMI hangt samen met hogere score als `w > 0`).\n\n"
+            f"{CONCLUSION_MD}"
         )
         yield fig_main, fig_loss, summary
             seed = gr.Slider(0, 9999, value=42, step=1, label="Training seed")
             split_seed = gr.Slider(0, 9999, value=7, step=1, label="Train/test split seed")
             train_btn = gr.Button("Train live")
+            # Story direct onder de knop
+            gr.Markdown(STORY_MD)
         with gr.Column(scale=2):
             plot_main = gr.Plot(label="Data (train/test) & regressielijn (live)")
             plot_loss = gr.Plot(label="Loss-curve (MSE per epoch) — train vs test")
             results = gr.Markdown()
+    # Training starten via knop
     train_btn.click(
         fn=sgd_train_generator,
         inputs=[lr, epochs, batch, seed, split_seed],
         outputs=[plot_main, plot_loss, results]
     )
+    # Auto-train bij laden met default-waarden
     demo.load(
         fn=sgd_train_generator,
         inputs=[lr, epochs, batch, seed, split_seed],