isakskogstad commited on
Commit
f0ea187
·
verified ·
1 Parent(s): 2763744

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +73 -104
README.md CHANGED
@@ -1,113 +1,82 @@
1
  ---
2
- title: Global API Data Harvester - 10 Sources
3
  emoji: 🌍
4
  colorFrom: blue
5
- colorTo: green
6
  sdk: streamlit
7
  sdk_version: 1.28.0
8
- app_file: app_enhanced.py
9
  pinned: false
10
  license: mit
11
  ---
12
 
13
- # 🌍 Global API Data Harvester - 10 Data Sources
14
-
15
- En avancerad webbapplikation för automatisk datainsamling från svenska myndigheter, EU-organisationer och internationella institutioner med AI-driven endpoint discovery och bulk data collection.
16
-
17
- ## Funktioner
18
-
19
- ### Stödda API:er (10 datakällor)
20
-
21
- #### 🇸🇪 Svenska myndigheter:
22
- - **Skolverket** - Skolenheter, utbildningstillfällen, läroplaner, SUSA-navet
23
- - **SCB** - Officiell statistik om befolkning, ekonomi, arbetsmarknad
24
- - **Kolada** - Nyckeltal för kommuner och regioner
25
- - **Riksbanken** - Finansiell statistik, valutakurser, räntor
26
- - **Swecris** - Forskningsprojekt, finansiering, publikationer (VR)
27
- - **CSN** - Statistik om studiestöd och studielån (PX-Web)
28
-
29
- #### 🌍 Internationella organisationer:
30
- - **Eurostat** - EU-statistik om utbildning, befolkning, ekonomi
31
- - **WHO** - Global hälsostatistik via GHO API
32
- - **OECD** - Ekonomiska och sociala indikatorer (SDMX)
33
- - **Världsbanken** - Global utvecklingsdata och indikatorer
34
-
35
- ### Huvudfunktioner
36
- - 🏠 **Dashboard Homepage** - Overview av alla API:er med realtidsstatistik
37
- - 🔍 **Automatic Endpoint Discovery** - AI-driven scanning av API dokumentation
38
- - 📊 **Bulk Data Collection** - Parallel datahämtning från alla endpoints
39
- - 💾 **Database Storage** - SQLite databas med full data management
40
- - 📈 **Progress Tracking** - Realtidsövervakning av datainsamling
41
- - 📁 **Export & Backup** - Fullständig dataexport med backup-funktionalitet
42
-
43
- ### Teknisk implementation
44
- - **Asynkron datahämtning** med `aiohttp`
45
- - **XML/JSON parsing** med automatisk formatdetektering
46
- - **Rate limiting** hantering för API:er som SCB
47
- - **Felhantering** med detaljerade felmeddelanden
48
- - **Caching** för optimerad prestanda
49
-
50
- ## Installation
51
-
52
- ```bash
53
- pip install -r requirements.txt
54
- streamlit run app.py
55
- ```
56
-
57
- ## Användning
58
-
59
- 1. Välj API-källa i sidopanelen
60
- 2. Konfigurera parametrar för den valda API:n
61
- 3. Aktivera kontinuerlig hämtning om önskat
62
- 4. Klicka "Hämta Data" för att starta
63
- 5. Exportera resultat som JSON eller CSV
64
-
65
- ## API-specifikationer
66
-
67
- ### Skolverket
68
- - **Endpoints**: Planerade utbildningar, Skolenhetsregistret, Läroplaner
69
- - **Format**: JSON/XML
70
- - **Rate limit**: Ingen
71
- - **Auth**: Ingen
72
-
73
- ### SCB
74
- - **Endpoints**: Befolkning, ekonomi
75
- - **Format**: JSON/XML
76
- - **Rate limit**: 10 anrop/10 sekunder
77
- - **Auth**: Ingen
78
-
79
- ### Kolada
80
- - **Endpoints**: KPI-data, kommundata
81
- - **Format**: JSON
82
- - **Rate limit**: Ingen
83
- - **Auth**: Ingen
84
-
85
- ### Världsbanken
86
- - **Endpoints**: Indikatorer, länderdata
87
- - **Format**: JSON/XML/CSV
88
- - **Rate limit**: Ingen
89
- - **Auth**: Ingen
90
-
91
- ### Riksbanken
92
- - **Endpoints**: Valutakurser, räntor
93
- - **Format**: JSON/XML/CSV
94
- - **Rate limit**: Ingen
95
- - **Auth**: Ingen
96
-
97
- ### CSN
98
- - **Endpoints**: Studiestöd via PX-Web
99
- - **Format**: JSON/XML/CSV
100
- - **Rate limit**: Ingen
101
- - **Auth**: Ingen
102
-
103
- ## Kontinuerlig datahämtning
104
-
105
- Aktivera "Kontinuerlig datahämtning" för att:
106
- - Automatiskt hämta data med konfigurerbart intervall (10-300 sekunder)
107
- - Bygga tidsserier av data
108
- - Övervaka förändringar i realtid
109
- - Spara all hämtningshistorik
110
-
111
- ## Licens
112
-
113
- MIT License - följ respektive API:s användarvillkor.
 
1
  ---
2
+ title: Global Data Harvester
3
  emoji: 🌍
4
  colorFrom: blue
5
+ colorTo: purple
6
  sdk: streamlit
7
  sdk_version: 1.28.0
8
+ app_file: app_modern.py
9
  pinned: false
10
  license: mit
11
  ---
12
 
13
+ # 🌍 Global Data Harvester
14
+
15
+ Modern, minimalist web application for intelligent data collection from 10 international sources with real-time processing and beautiful visualizations.
16
+
17
+ ## ✨ Features
18
+
19
+ ### 🌍 **10 Data Sources** - Verified API endpoints based on 2024 documentation
20
+ - 🇸🇪 **Swedish Government**: Skolverket, SCB, Kolada, Riksbanken, Swecris, CSN
21
+ - 🌍 **International**: Eurostat, WHO, OECD, World Bank
22
+
23
+ ### 🎯 **Modern Interface**
24
+ - **Minimalist Design** - Clean, gradient interface with glass morphism
25
+ - **Real-time Metrics** - Live status indicators and progress tracking
26
+ - **Interactive Cards** - Hover effects and modern UI components
27
+ - **Responsive Layout** - Works perfectly on all devices
28
+
29
+ ### 🚀 **Smart Features**
30
+ - **One-click Bulk Fetch** - Collect from all APIs simultaneously
31
+ - **Auto-deduplication** - SHA256 hashing prevents duplicate data
32
+ - **Rate Limiting** - Automatic compliance (SCB: 10 req/10 sec)
33
+ - **Error Handling** - Graceful failures with detailed reporting
34
+ - **Real-time Visualization** - Plotly charts and interactive graphs
35
+
36
+ ### 🔧 **Technical Implementation**
37
+ - **Modern Python Stack** - Streamlit, Plotly, Pandas, Requests
38
+ - **SQLite Database** - Lightweight, embedded data storage
39
+ - **Async Processing** - Non-blocking data collection
40
+ - **API Authentication** - Secure handling of tokens (Swecris)
41
+ - **Format Support** - JSON, XML, SDMX, PX-Web, HAL+JSON
42
+
43
+ ## 📊 **API Details**
44
+
45
+ ### Swedish Sources
46
+ - **Skolverket**: Education data, school units, curricula (HAL+JSON)
47
+ - **SCB**: Population, economy statistics (Rate limit: 10/10 sec)
48
+ - **Kolada**: Municipal KPIs and regional data
49
+ - **Riksbanken**: Exchange rates, interest rates (EUR/SEK, USD/SEK)
50
+ - **Swecris**: Research projects (Bearer token auth)
51
+ - **CSN**: Student aid statistics (PX-Web format)
52
+
53
+ ### International Sources
54
+ - **Eurostat**: EU statistics (JSON-stat 2.0 format)
55
+ - **WHO**: Global health indicators (GHO API)
56
+ - **OECD**: Economic indicators (SDMX format)
57
+ - **World Bank**: Development data (JSON format, v2 API)
58
+
59
+ ## 🚀 **Usage**
60
+
61
+ 1. **Individual Fetch** - Click any API card to fetch data from that source
62
+ 2. **Bulk Collection** - Use "Fetch All APIs" for comprehensive data gathering
63
+ 3. **Real-time Monitoring** - Watch live metrics and progress indicators
64
+ 4. **Data Preview** - Explore fetched data with interactive tables
65
+ 5. **Export & Analysis** - Download results in JSON format
66
+
67
+ ## 🎨 **Modern Design**
68
+
69
+ - **Glass Morphism** - Translucent cards with backdrop blur
70
+ - **Gradient Backgrounds** - Beautiful blue-to-purple gradients
71
+ - **Status Indicators** - Color-coded API health monitoring
72
+ - **Smooth Animations** - CSS transitions and hover effects
73
+ - **Responsive Grid** - Adaptive layout for all screen sizes
74
+
75
+ ## 📈 **Data Visualization**
76
+
77
+ - **Success Rate Pie Charts** - Visual fetch status overview
78
+ - **Records Bar Charts** - Compare data volume by API
79
+ - **Real-time Metrics** - Live updating counters and indicators
80
+ - **Interactive Tables** - Sortable, filterable data preview
81
+
82
+ Built with modern web technologies for a seamless user experience.