Spaces:

jaczad
/

JacekAI

Sleeping

Jacek Zadrożny commited on Dec 12, 2025

Commit

ed9cfa3

1 Parent(s): 5a209a3

Docs: Update README.md and consolidate deployment info

- Updated README.md with comprehensive project information, installation instructions, and deployment details for Hugging Face Spaces.
- Consolidated information from README_DEPLOYMENT.md into the main README.md.
- Deleted the now redundant README_DEPLOYMENT.md.
- Corrected Gradio SDK version in README metadata.

Files changed (2) hide show

README.md +59 -50
README_DEPLOYMENT.md +0 -91

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ emoji: ♿
 colorFrom: blue
 colorTo: green
 sdk: gradio
-sdk_version: 6.1.0
 python_version: "3.10"
 app_file: app.py
 pinned: true
@@ -13,74 +13,83 @@ short_description: Inteligentny asystent do spraw dostępności cyfrowej
 # 🤖 A11y Expert - Asystent Dostępności Cyfrowej
-Inteligentny agent AI wyspecjalizowany w dostępności cyfrowej, wykorzystujący RAG (Retrieval-Augmented Generation) z bazą wiedzy WCAG, ARIA i najlepszych praktyk.
-## ✨ Funkcje
-- 💬 **Rozmowa w języku polskim i angielskim** - automatyczna detekcja języka
-- 📚 **Baza wiedzy** - WCAG 2.2, ARIA, i praktyczne przykłady
-- 🔍 **RAG** - odpowiedzi oparte na oficjalnej dokumentacji
-- 🎯 **Specjalistyczne odpowiedzi** - cytowanie kryteriów i źródeł
-- ⚡ **Streaming** - płynne generowanie odpowiedzi
-## 🚀 Jak używać
-1. Wpisz pytanie o dostępność cyfrową
-2. Zadaj pytanie po polsku lub angielsku
-3. Otrzymaj szczegółową odpowiedź z cytowaniem źródeł
-**Przykładowe pytania:**
-- "Jakie są wymagania WCAG 2.2 dla etykiet formularzy?"
-- "Wyjaśnij rolę 'alert' w ARIA i podaj przykład"
-- "Czy ten przycisk jest dostępny? `<div onclick='...'>Click me</div>`"
-## 🔧 Technologie
-- **Gradio** - interfejs użytkownika
-- **OpenAI GPT-4** - model językowy
-- **LanceDB** - wektorowa baza danych
-- **RAG** - wyszukiwanie semantyczne w bazie wiedzy
-## 📝 Konfiguracja (dla developerów)
-### Zmienne środowiskowe
-```bash
-OPENAI_API_KEY=sk-...        # Wymagane
-SERVER_HOST=0.0.0.0           # Dla Hugging Face Spaces
-SERVER_PORT=7860              # Port Gradio
-LOG_LEVEL=INFO                # Poziom logowania
-```
-### Instalacja lokalna
-```bash
-pip install -r requirements.txt
-cp .env.example .env
-# Ustaw OPENAI_API_KEY w .env
-python app.py
-```
-### Test przed wdrożeniem
 ```bash
 python test_startup.py
 ```
-## 📖 Dokumentacja
-- [Deployment Guide](./README_DEPLOYMENT.md) - szczegółowy przewodnik wdrożeniowy
-- [WCAG 2.2](https://www.w3.org/TR/WCAG22/) - oficjalna specyfikacja
-- [ARIA](https://www.w3.org/TR/wai-aria/) - dostępne komponenty internetowe
-## 🐛 Rozwiązane problemy
-✅ Konflikty pętli zdarzeń asyncio
-✅ Brak czyszczenia zasobów przy shutdown
-✅ Konflikty wersji bibliotek (Pydantic 2.x)
-✅ Graceful shutdown na Hugging Face Spaces
-## 📄 Licencja
-Ten projekt służy celom edukacyjnym. Baza wiedzy pochodzi z publicznych źródeł (W3C, MDN).
-## 👨‍💻 Autor
-Stworzony z pomocą GitHub Copilot CLI

 colorFrom: blue
 colorTo: green
 sdk: gradio
+sdk_version: "4.29.0"
 python_version: "3.10"
 app_file: app.py
 pinned: true
 # 🤖 A11y Expert - Asystent Dostępności Cyfrowej
+Inteligentny agent AI wyspecjalizowany w dostępności cyfrowej (a11y), wykorzystujący RAG (Retrieval-Augmented Generation) z bazą wiedzy WCAG, ARIA i najlepszych praktyk.
+## ✨ Główne Funkcje
+- **Obsługa wielu języków**: Płynna rozmowa po polsku i angielsku z automatycznym wykrywaniem języka.
+- **Bogata baza wiedzy**: Odpowiedzi oparte na standardach WCAG 2.2, ARIA oraz sprawdzonych praktykach dostępności.
+- **Wiarygodne odpowiedzi (RAG)**: Każda odpowiedź jest generowana w oparciu o konkretne źródła z bazy wektorowej, z możliwością cytowania.
+- **Streaming odpowiedzi**: Agent generuje odpowiedzi w sposób płynny, token po tokenie.
+## 🔧 Architektura i Technologie
+- **Interfejs użytkownika**: Gradio
+- **Model językowy**: OpenAI GPT-4 (lub nowszy)
+- **Wektorowa baza danych**: LanceDB do przechowywania i przeszukiwania wiedzy.
+- **Wyszukiwanie semantyczne**: Architektura RAG do precyzyjnego odnajdywania informacji.
+---
+## 🛠️ Uruchomienie i Rozwój
+### 1. Wymagania wstępne
+- Python 3.10+
+- Klucz API OpenAI
+### 2. Instalacja lokalna
+1.  **Sklonuj repozytorium:**
+    ```bash
+    git clone <URL_repozytorium>
+    cd <nazwa_repozytorium>
+    ```
+2.  **Zainstaluj zależności:**
+    ```bash
+    pip install -r requirements.txt
+    ```
+3.  **Skonfiguruj zmienne środowiskowe:**
+    - Skopiuj plik `.env.example` do `.env`:
+      ```bash
+      cp .env.example .env
+      ```
+    - Otwórz plik `.env` i wklej swój klucz API OpenAI:
+      ```
+      OPENAI_API_KEY="sk-..."
+      ```
+4.  **Uruchom aplikację:**
+    ```bash
+    python app.py
+    ```
+    Aplikacja będzie dostępna pod adresem `http://127.0.0.1:7860`.
+### 3. Testowanie
+Przed wdrożeniem warto uruchomić prosty test startowy, aby upewnić się, że agent inicjalizuje się poprawnie:
 ```bash
 python test_startup.py
 ```
+---
+## ☁️ Wdrożenie na Hugging Face Spaces
+Aplikacja jest skonfigurowana do wdrożenia jako Gradio App na Hugging Face Spaces.
+### 1. Konfiguracja w Hugging Face
+- W ustawieniach swojego Space, w sekcji **Secrets**, dodaj sekret o nazwie `OPENAI_API_KEY` i wklej swój klucz API.
+### 2. Kluczowe aspekty wdrożenia
+- **Baza danych `lancedb`**: Baza jest tylko do odczytu i musi znajdować się w repozytorium, aby była dostępna dla aplikacji. Zalecane jest użycie `git lfs` do śledzenia katalogu `lancedb/`.
+- **Plik `app.py`**: Logika startowa aplikacji jest dostosowana do wymogów HF Spaces - nie używa bloku `if __name__ == "__main__:"` do uruchomienia i nie wymaga ręcznego wywoływania `demo.launch()`.
+- **Zarządzanie zasobami**: Mechanizm `atexit` został celowo wyłączony, aby uniknąć przedwczesnego zamykania aplikacji w środowisku HF Spaces.
+## 📄 Licencja
+Ten projekt służy celom edukacyjnym. Baza wiedzy pochodzi z publicznych źródeł (W3C, MDN).

README_DEPLOYMENT.md DELETED Viewed

@@ -1,91 +0,0 @@
-# Deployment Guide for Hugging Face Spaces
-## Problemy rozwiązane w tej wersji
-### 1. Konflikty pętli zdarzeń asyncio
-- **Problem**: `asyncio.run()` przed `demo.launch()` tworzył zamkniętą pętlę zdarzeń
-- **Rozwiązanie**: Używamy jednej, globalnej pętli zdarzeń z `asyncio.get_event_loop()`
-### 2. Brak czyszczenia zasobów
-- **Problem**: Zasoby (cache, połączenia DB) nie były zamykane przy shutdown
-- **Rozwiązanie**: Dodano `atexit.register(cleanup_resources)` i metody `close()` dla wszystkich klientów
-### 3. Konflikty wersji bibliotek
-- **Problem**: Brak określonych wersji w requirements.txt
-- **Rozwiązanie**: Określono zakresy kompatybilnych wersji dla wszystkich bibliotek
-## Konfiguracja dla Hugging Face Spaces
-### 1. Zmienne środowiskowe (Secrets)
-W ustawieniach Space dodaj:
-```
-OPENAI_API_KEY=sk-...
-SERVER_HOST=0.0.0.0
-SERVER_PORT=7860
-LOG_LEVEL=INFO
-```
-### 2. Struktura plików
-Upewnij się, że:
-- `lancedb/` folder jest w `.gitignore` (jeśli nie jest częścią repo)
-- `cache/` folder jest w `.gitignore`
-- `.env` NIE jest commitowany (tylko `.env.example`)
-### 3. app.py Configuration
-Aplikacja automatycznie:
-- Tworzy pętlę zdarzeń tylko jeśli nie istnieje
-- Rejestruje funkcję czyszczącą zasoby
-- Zamyka wszystkie połączenia przy shutdown
-- Wyłapuje KeyboardInterrupt dla graceful shutdown
-### 4. Testowanie lokalnie
-```bash
-# Zainstaluj zależności
-pip install -r requirements.txt
-# Skopiuj i edytuj .env
-cp .env.example .env
-# Ustaw OPENAI_API_KEY w .env
-# Uruchom aplikację
-python app.py
-```
-### 5. Monitorowanie na Hugging Face
-Sprawdź logi, czy widzisz:
-- ✅ "A11y Expert Agent is ready!"
-- ✅ "Launching Gradio app..."
-- Brak błędów asyncio RuntimeError
-## Potencjalne problemy i rozwiązania
-### Problem: "RuntimeError: Event loop is closed"
-**Rozwiązanie**: Upewnij się, że używasz tej zaktualizowanej wersji `app.py`
-### Problem: Aplikacja zamyka się po kilku sekundach
-**Możliwe przyczyny**:
-1. Brak OPENAI_API_KEY → sprawdź Secrets
-2. Brak dostępu do lancedb → upewnij się, że folder istnieje i ma dane
-3. Konflikt portów → Hugging Face używa 7860
-### Problem: "Table doesn't exist"
-**Rozwiązanie**: Upewnij się, że `lancedb/` folder z danymi jest dostępny:
-- Jeśli dane są w repo: użyj Git LFS
-- Jeśli dane są generowane: uruchom skrypt ETL przed startem
-## Porady optymalizacyjne
-1. **Używaj cache**: `diskcache` znacząco przyspiesza embeddings
-2. **Limituj history**: Agent przechowuje tylko 4 ostatnie wiadomości
-3. **Monitoruj memory**: LanceDB + cache mogą zużywać pamięć
-4. **Timeout na Hugging Face**: Free tier ma limit czasu bezczynności
-## Sprawdzenie czy wszystko działa
-✅ Checklist:
-- [ ] Aplikacja startuje bez błędów
-- [ ] Agent odpowiada na pytania
-- [ ] Streaming działa płynnie
-- [ ] Brak ostrzeżeń asyncio w logach
-- [ ] Aplikacja nie crashuje po kilku minutach
-- [ ] Graceful shutdown przy SIGTERM