Spaces:

Rutson
/

Streamlit

Sleeping

App Files Files Community

Rutson commited on Apr 25

Commit

457028c

verified ·

1 Parent(s): a671899

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -24

app.py CHANGED Viewed

@@ -4,59 +4,57 @@ from sklearn.preprocessing import StandardScaler
 from sklearn.neighbors import NearestNeighbors
 from thefuzz import process
-# Configuração visual
-st.set_page_config(page_title="DNA Sonoro Pro", page_icon="🧬")
-st.title("🧬 DNA Sonoro: Deep Search")
-st.markdown("Recomendação técnica por vibe. Sem anúncios, focado em sonoridade real.")
 @st.cache_data
-def carregar_dados_estaveis():
-    # Base de dados robusta e diversificada (incluindo K-pop e B-sides)
-    # Link direto de um repositório oficial de ciência de dados (estável)
-    url = "https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-01-21/spotify_songs.csv"
-    df = pd.read_csv(url)
-    df = df.drop_duplicates(subset=['track_name', 'track_artist'])
-    df['search_info'] = df['track_name'].astype(str) + " " + df['track_artist'].astype(str)
     return df
 try:
-    with st.spinner("Sincronizando motor de busca..."):
-        df = carregar_dados_estaveis()
-    # Filtros técnicos da vibe
     features = ['danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']
     scaler = StandardScaler()
     df_scaled = scaler.fit_transform(df[features])
-    # Modelo de vizinhos com métrica de 'cosine' para precisão máxima
     model = NearestNeighbors(n_neighbors=7, metric='cosine')
     model.fit(df_scaled)
-    query = st.text_input("Qual música ou artista você quer analisar?", placeholder="Ex: Spring Day, BTS, Enhypen...")
     if query:
-        # Busca inteligente (Fuzzy)
         choices = df['search_info'].tolist()
         best_match = process.extractOne(query, choices)
-        if best_match and best_match[1] > 60:
             idx = df[df['search_info'] == best_match[0]].index[0]
             track = df.iloc[idx]
-            st.success(f"✅ **Original Identificada:** {track['track_name']} — {track['track_artist']}")
-            # Cálculo de proximidade
             distances, indices = model.kneighbors([df_scaled[idx]])
-            st.subheader("💡 Recomendações pelo DNA Sonoro:")
             for i in indices[0]:
                 if i != idx:
                     res = df.iloc[i]
-                    st.write(f"✨ **{res['track_name']}** — {res['track_artist']}")
                     simil = int((1 - distances[0][list(indices[0]).index(i)]) * 100)
                     st.caption(f"DNA compatível em {simil}%")
         else:
-            st.warning("Ainda não tenho essa na minha memória. Tente um hit ou artista similar.")
 except Exception as e:
-    st.error(f"Erro ao carregar o motor. Detalhe: {e}")

 from sklearn.neighbors import NearestNeighbors
 from thefuzz import process
+st.set_page_config(page_title="DNA Sonoro: Database Real", page_icon="🧬")
+st.title("🧬 DNA Sonoro: Modo Offline")
+# Função para carregar o arquivo que você subiu
 @st.cache_data
+def carregar_dados_locais():
+    # Lendo o arquivo de 346MB que você acabou de subir
+    df = pd.read_csv("tracks_features.csv")
+    # Limpeza básica para não pesar na memória
+    df = df[['name', 'artists', 'danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']].dropna()
+    df = df.drop_duplicates(subset=['name', 'artists'])
+    df['search_info'] = df['name'].astype(str) + " " + df['artists'].astype(str)
     return df
 try:
+    with st.spinner("Analisando 1.2M de faixas... Isso pode levar um minuto na primeira vez."):
+        df = carregar_dados_locais()
+    # Preparando o motor matemático
     features = ['danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']
     scaler = StandardScaler()
     df_scaled = scaler.fit_transform(df[features])
     model = NearestNeighbors(n_neighbors=7, metric='cosine')
     model.fit(df_scaled)
+    query = st.text_input("Busque sua B-side ou Artista:", placeholder="Ex: Spring Day, STAYC, Enhypen...")
     if query:
+        # Busca aproximada na sua base gigante
         choices = df['search_info'].tolist()
+        # Pegamos os top matches para ser mais preciso
         best_match = process.extractOne(query, choices)
+        if best_match and best_match[1] > 65:
             idx = df[df['search_info'] == best_match[0]].index[0]
             track = df.iloc[idx]
+            st.success(f"🎯 **Encontrei na Base:** {track['name']} — {track['artists']}")
             distances, indices = model.kneighbors([df_scaled[idx]])
+            st.subheader("💡 Recomendações Técnicas:")
             for i in indices[0]:
                 if i != idx:
                     res = df.iloc[i]
+                    st.write(f"✨ **{res['name']}** — {res['artists']}")
                     simil = int((1 - distances[0][list(indices[0]).index(i)]) * 100)
                     st.caption(f"DNA compatível em {simil}%")
         else:
+            st.warning("Ainda não encontrei. Tente o nome exato da música.")
 except Exception as e:
+    st.error(f"Erro ao ler o arquivo: {e}")