Spaces:

ggalancs
/

hfl

Running

App Files Files Community

Gabriel Galán commited on Mar 7

Commit

d5be6a0

verified ·

1 Parent(s): c2fc392

Upload index.html with huggingface_hub

Browse files

Files changed (1) hide show

index.html +200 -18

index.html CHANGED Viewed

@@ -1,19 +1,201 @@
-<!doctype html>
-<html>
-	<head>
-		<meta charset="utf-8" />
-		<meta name="viewport" content="width=device-width" />
-		<title>My static Space</title>
-		<link rel="stylesheet" href="style.css" />
-	</head>
-	<body>
-		<div class="card">
-			<h1>Welcome to your static Space!</h1>
-			<p>You can modify this app directly by editing <i>index.html</i> in the Files and versions tab.</p>
-			<p>
-				Also don't forget to check the
-				<a href="https://huggingface.co/docs/hub/spaces" target="_blank">Spaces documentation</a>.
-			</p>
-		</div>
-	</body>
 </html>

+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>HFL — HuggingFace Local</title>
+<style>
+  :root {
+    --bg: #0d1117; --surface: #161b22; --surface2: #21262d; --border: #30363d;
+    --text: #c9d1d9; --text-muted: #8b949e; --accent: #58a6ff; --green: #3fb950;
+    --yellow: #d29922; --red: #f85149; --purple: #bc8cff; --orange: #f0883e;
+  }
+  * { margin: 0; padding: 0; box-sizing: border-box; }
+  body { background: var(--bg); color: var(--text); font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', sans-serif; line-height: 1.6; }
+  .container { max-width: 900px; margin: 0 auto; padding: 2rem; }
+  .hero { text-align: center; padding: 3rem 0 2rem; }
+  .hero h1 { font-size: 2.8rem; background: linear-gradient(135deg, var(--accent), var(--purple)); -webkit-background-clip: text; -webkit-text-fill-color: transparent; margin-bottom: 0.5rem; }
+  .hero .subtitle { font-size: 1.1rem; color: var(--text-muted); margin-bottom: 1.5rem; }
+  .badges { display: flex; gap: 0.8rem; justify-content: center; flex-wrap: wrap; margin-bottom: 2rem; }
+  .badges span { background: var(--surface); padding: 0.3rem 0.8rem; border-radius: 6px; font-size: 0.85rem; border: 1px solid var(--border); }
+  .cta { display: flex; gap: 1rem; justify-content: center; flex-wrap: wrap; margin: 2rem 0; }
+  .cta a { display: inline-block; padding: 0.7rem 1.5rem; border-radius: 8px; text-decoration: none; font-weight: 600; font-size: 0.95rem; transition: opacity 0.2s; }
+  .cta a:hover { opacity: 0.85; }
+  .cta-primary { background: var(--accent); color: #fff; }
+  .cta-secondary { background: var(--surface2); color: var(--text); border: 1px solid var(--border); }
+  section { margin: 2.5rem 0; }
+  h2 { font-size: 1.5rem; color: var(--accent); margin-bottom: 1rem; padding-bottom: 0.3rem; border-bottom: 2px solid var(--border); }
+  h3 { font-size: 1.1rem; color: var(--green); margin: 1.2rem 0 0.5rem; }
+  p { margin-bottom: 0.8rem; }
+  .card { background: var(--surface); border: 1px solid var(--border); border-radius: 10px; padding: 1.2rem; margin-bottom: 0.8rem; }
+  .card h3 { margin-top: 0; }
+  .grid { display: grid; grid-template-columns: repeat(auto-fit, minmax(250px, 1fr)); gap: 0.8rem; }
+  code { background: var(--surface2); padding: 0.15rem 0.4rem; border-radius: 4px; font-family: 'JetBrains Mono', monospace; font-size: 0.85em; color: var(--orange); }
+  pre { background: var(--surface); border: 1px solid var(--border); border-radius: 8px; padding: 1rem; overflow-x: auto; margin: 1rem 0; font-size: 0.85rem; }
+  pre code { background: none; padding: 0; color: var(--text); }
+  table { width: 100%; border-collapse: collapse; margin: 1rem 0; font-size: 0.9rem; }
+  th { background: var(--surface2); color: var(--accent); text-align: left; padding: 0.6rem 0.8rem; border: 1px solid var(--border); }
+  td { padding: 0.5rem 0.8rem; border: 1px solid var(--border); }
+  .highlight { border-left: 4px solid var(--accent); background: rgba(88,166,255,0.08); padding: 1rem; margin: 1rem 0; border-radius: 0 8px 8px 0; }
+  .footer { text-align: center; padding: 2rem 0; color: var(--text-muted); font-size: 0.85rem; border-top: 1px solid var(--border); margin-top: 3rem; }
+  .comparison td:first-child { font-weight: 600; color: var(--accent); }
+  .check { color: var(--green); }
+  .cross { color: var(--red); }
+</style>
+</head>
+<body>
+<div class="container">
+<div class="hero">
+  <h1>HFL</h1>
+  <p class="subtitle">Run any HuggingFace model locally. 500K+ models at your fingertips.</p>
+  <div class="badges">
+    <span>v0.1.0</span>
+    <span>Python &ge;3.10</span>
+    <span>1900 tests</span>
+    <span>90%+ coverage</span>
+    <span>OpenAI &amp; Ollama compatible</span>
+  </div>
+  <div class="cta">
+    <a href="https://github.com/ggalancs/hfl" class="cta-primary">GitHub Repository</a>
+    <a href="https://ggalancs.github.io/hfl/" class="cta-secondary">Full Architecture Docs</a>
+  </div>
+</div>
+<section>
+  <h2>What is HFL?</h2>
+  <p><strong>HFL (HuggingFace Local)</strong> is a CLI + API server that lets you run HuggingFace models locally. While Ollama offers ~500 curated models, HFL gives you access to the <strong>500,000+ models</strong> on the HuggingFace Hub.</p>
+  <div class="highlight">
+    <strong>Key insight:</strong> HFL is to HuggingFace Hub what Ollama is to its own model library &mdash; but with 1000x more models available.
+  </div>
+</section>
+<section>
+  <h2>Quick Start</h2>
+<pre><code># Install
+pip install hfl
+# Pull a model
+hfl pull microsoft/Phi-3-mini-4k-instruct-gguf
+# Chat interactively
+hfl run microsoft/Phi-3-mini-4k-instruct-gguf
+# Start API server (OpenAI + Ollama compatible)
+hfl serve --model microsoft/Phi-3-mini-4k-instruct-gguf</code></pre>
+</section>
+<section>
+  <h2>HFL vs Ollama</h2>
+  <table class="comparison">
+    <tr><th>Feature</th><th>HFL</th><th>Ollama</th></tr>
+    <tr><td>Available models</td><td><span class="check">500,000+</span></td><td>~500</td></tr>
+    <tr><td>Source</td><td><span class="check">HuggingFace Hub</span></td><td>Ollama Library</td></tr>
+    <tr><td>OpenAI API compatible</td><td><span class="check">&#10003;</span></td><td><span class="check">&#10003;</span></td></tr>
+    <tr><td>Ollama API compatible</td><td><span class="check">&#10003;</span></td><td><span class="check">&#10003;</span></td></tr>
+    <tr><td>TTS support</td><td><span class="check">&#10003;</span></td><td><span class="cross">&#10007;</span></td></tr>
+    <tr><td>Multiple backends</td><td><span class="check">llama.cpp, transformers, vLLM</span></td><td>llama.cpp only</td></tr>
+    <tr><td>License verification</td><td><span class="check">Automatic (5 levels)</span></td><td><span class="cross">&#10007;</span></td></tr>
+    <tr><td>EU AI Act compliance</td><td><span class="check">Built-in</span></td><td><span class="cross">&#10007;</span></td></tr>
+    <tr><td>GGUF auto-conversion</td><td><span class="check">&#10003;</span></td><td><span class="cross">&#10007;</span></td></tr>
+    <tr><td>i18n (EN/ES)</td><td><span class="check">&#10003;</span></td><td><span class="cross">&#10007;</span></td></tr>
+  </table>
+</section>
+<section>
+  <h2>API Compatibility</h2>
+  <p>HFL exposes both <strong>OpenAI</strong> and <strong>Ollama</strong> compatible APIs, so it works as a drop-in replacement with existing tools:</p>
+  <div class="grid">
+    <div class="card">
+      <h3>OpenAI Endpoints</h3>
+      <p><code>POST /v1/chat/completions</code></p>
+      <p><code>POST /v1/completions</code></p>
+      <p><code>GET /v1/models</code></p>
+      <p><code>POST /v1/audio/speech</code></p>
+    </div>
+    <div class="card">
+      <h3>Ollama Endpoints</h3>
+      <p><code>POST /api/generate</code></p>
+      <p><code>POST /api/chat</code></p>
+      <p><code>GET /api/tags</code></p>
+      <p><code>POST /api/tts</code></p>
+    </div>
+  </div>
+  <p>Works with: <strong>Open WebUI</strong>, <strong>Chatbox</strong>, <strong>Continue.dev</strong>, and any OpenAI/Ollama-compatible client.</p>
+</section>
+<section>
+  <h2>12 CLI Commands</h2>
+  <table>
+    <tr><th>Command</th><th>Description</th></tr>
+    <tr><td><code>hfl pull</code></td><td>Download model from HuggingFace Hub</td></tr>
+    <tr><td><code>hfl run</code></td><td>Interactive chat with a model</td></tr>
+    <tr><td><code>hfl serve</code></td><td>Start API server</td></tr>
+    <tr><td><code>hfl list</code></td><td>List local models</td></tr>
+    <tr><td><code>hfl search</code></td><td>Search HuggingFace Hub</td></tr>
+    <tr><td><code>hfl inspect</code></td><td>Show model details</td></tr>
+    <tr><td><code>hfl rm</code></td><td>Remove a model</td></tr>
+    <tr><td><code>hfl alias</code></td><td>Create model aliases</td></tr>
+    <tr><td><code>hfl login / logout</code></td><td>Manage HF authentication</td></tr>
+    <tr><td><code>hfl version</code></td><td>Show version info</td></tr>
+    <tr><td><code>hfl compliance-report</code></td><td>Legal compliance report</td></tr>
+  </table>
+</section>
+<section>
+  <h2>Architecture Highlights</h2>
+  <div class="grid">
+    <div class="card">
+      <h3>3 Inference Backends</h3>
+      <p><strong>llama.cpp</strong> for GGUF (CPU/GPU), <strong>transformers</strong> for safetensors, <strong>vLLM</strong> for production GPU with real async streaming.</p>
+    </div>
+    <div class="card">
+      <h3>FailoverEngine</h3>
+      <p>Multi-backend with sticky routing. Automatically retries with the next engine if one fails.</p>
+    </div>
+    <div class="card">
+      <h3>Model Pool</h3>
+      <p>LRU eviction with real-time RAM/GPU memory tracking. Non-recursive concurrent loading.</p>
+    </div>
+    <div class="card">
+      <h3>Legal Compliance</h3>
+      <p>5-level license classification, EU AI Act notices, provenance logging, AI disclaimers.</p>
+    </div>
+    <div class="card">
+      <h3>Production Ready</h3>
+      <p>Rate limiting, API key auth, health probes, Prometheus metrics, SLO monitoring, structured logging.</p>
+    </div>
+    <div class="card">
+      <h3>TTS Support</h3>
+      <p>Text-to-speech via Bark and Coqui XTTS-v2 engines with OpenAI-compatible endpoints.</p>
+    </div>
+  </div>
+</section>
+<section>
+  <h2>Tech Stack</h2>
+  <div class="grid">
+    <div class="card">
+      <h3>Core</h3>
+      <p>Python 3.10+ &bull; FastAPI &bull; Typer &bull; Rich &bull; Pydantic</p>
+    </div>
+    <div class="card">
+      <h3>ML</h3>
+      <p>llama-cpp-python &bull; transformers &bull; vLLM &bull; Bark &bull; Coqui TTS</p>
+    </div>
+    <div class="card">
+      <h3>Quality</h3>
+      <p>1900 tests &bull; 90%+ coverage &bull; mypy &bull; ruff &bull; CI/CD</p>
+    </div>
+  </div>
+</section>
+<div class="footer">
+  <p>Created by <a href="https://github.com/ggalancs" style="color: var(--accent)">Gabriel Galan Pelayo</a> &bull; License: HRUL v1.0 &bull; March 2026</p>
+  <p style="margin-top: 0.5rem;"><a href="https://github.com/ggalancs/hfl" style="color: var(--accent)">GitHub</a> &bull; <a href="https://ggalancs.github.io/hfl/" style="color: var(--accent)">Full Docs</a> &bull; <a href="https://github.com/sponsors/ggalancs" style="color: var(--accent)">Sponsor</a></p>
+</div>
+</div>
+</body>
 </html>