Spaces:

Rutson
/

Streamlit

Sleeping

App Files Files Community

Rutson commited on Apr 25

Commit

b0b2ee4

verified ·

1 Parent(s): 457028c

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -29

app.py CHANGED Viewed

@@ -2,59 +2,67 @@ import streamlit as st
 import pandas as pd
 from sklearn.preprocessing import StandardScaler
 from sklearn.neighbors import NearestNeighbors
-from thefuzz import process
-st.set_page_config(page_title="DNA Sonoro: Database Real", page_icon="🧬")
-st.title("🧬 DNA Sonoro: Modo Offline")
-# Função para carregar o arquivo que você subiu
 @st.cache_data
-def carregar_dados_locais():
-    # Lendo o arquivo de 346MB que você acabou de subir
     df = pd.read_csv("tracks_features.csv")
-    # Limpeza básica para não pesar na memória
     df = df[['name', 'artists', 'danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']].dropna()
-    df = df.drop_duplicates(subset=['name', 'artists'])
-    df['search_info'] = df['name'].astype(str) + " " + df['artists'].astype(str)
     return df
 try:
-    with st.spinner("Analisando 1.2M de faixas... Isso pode levar um minuto na primeira vez."):
-        df = carregar_dados_locais()
-    # Preparando o motor matemático
     features = ['danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']
     scaler = StandardScaler()
     df_scaled = scaler.fit_transform(df[features])
-    model = NearestNeighbors(n_neighbors=7, metric='cosine')
     model.fit(df_scaled)
-    query = st.text_input("Busque sua B-side ou Artista:", placeholder="Ex: Spring Day, STAYC, Enhypen...")
-    if query:
-        # Busca aproximada na sua base gigante
-        choices = df['search_info'].tolist()
-        # Pegamos os top matches para ser mais preciso
-        best_match = process.extractOne(query, choices)
-        if best_match and best_match[1] > 65:
-            idx = df[df['search_info'] == best_match[0]].index[0]
             track = df.iloc[idx]
-            st.success(f"🎯 **Encontrei na Base:** {track['name']} — {track['artists']}")
             distances, indices = model.kneighbors([df_scaled[idx]])
-            st.subheader("💡 Recomendações Técnicas:")
             for i in indices[0]:
                 if i != idx:
                     res = df.iloc[i]
                     st.write(f"✨ **{res['name']}** — {res['artists']}")
                     simil = int((1 - distances[0][list(indices[0]).index(i)]) * 100)
-                    st.caption(f"DNA compatível em {simil}%")
         else:
-            st.warning("Ainda não encontrei. Tente o nome exato da música.")
 except Exception as e:
-    st.error(f"Erro ao ler o arquivo: {e}")

 import pandas as pd
 from sklearn.preprocessing import StandardScaler
 from sklearn.neighbors import NearestNeighbors
+st.set_page_config(page_title="DNA Sonoro: Filtro de Elite", page_icon="🧬")
+st.title("🧬 DNA Sonoro: Precisão Máxima")
 @st.cache_data
+def carregar_dados():
     df = pd.read_csv("tracks_features.csv")
+    # Mantendo apenas o essencial para não fritar a memória
     df = df[['name', 'artists', 'danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']].dropna()
+    # Limpeza de strings para busca não falhar por causa de espaço ou letra maiúscula
+    df['name_clean'] = df['name'].str.lower().str.strip()
+    df['artists_clean'] = df['artists'].str.lower().str.strip()
     return df
 try:
+    df = carregar_dados()
+    # Motor matemático
     features = ['danceability', 'energy', 'acousticness', 'instrumentalness', 'valence', 'tempo']
     scaler = StandardScaler()
     df_scaled = scaler.fit_transform(df[features])
+    model = NearestNeighbors(n_neighbors=11, metric='cosine')
     model.fit(df_scaled)
+    st.markdown("### 🔎 Busca Refinada")
+    col1, col2 = st.columns(2)
+    with col1:
+        musica_input = st.text_input("Nome da música:", placeholder="Ex: Spring Day")
+    with col2:
+        artista_input = st.text_input("Nome do artista (Opcional):", placeholder="Ex: BTS")
+    if musica_input:
+        # Busca exata ou parcial mas rigorosa
+        termo_musica = musica_input.lower().strip()
+        termo_artista = artista_input.lower().strip() if artista_input else ""
+        # Filtro direto no DataFrame (mais rápido e preciso que o Fuzzy para 1M de linhas)
+        if termo_artista:
+            match = df[(df['name_clean'].str.contains(termo_musica)) & (df['artists_clean'].str.contains(termo_artista))]
+        else:
+            match = df[df['name_clean'] == termo_musica]
+            if match.empty:
+                match = df[df['name_clean'].str.contains(termo_musica)].head(1)
+        if not match.empty:
+            idx = match.index[0]
             track = df.iloc[idx]
+            st.success(f"🎯 **Identificada:** {track['name']} — {track['artists']}")
+            # Cálculo da vibe
             distances, indices = model.kneighbors([df_scaled[idx]])
+            st.subheader("💡 Recomendações com DNA idêntico:")
             for i in indices[0]:
                 if i != idx:
                     res = df.iloc[i]
                     st.write(f"✨ **{res['name']}** — {res['artists']}")
                     simil = int((1 - distances[0][list(indices[0]).index(i)]) * 100)
+                    st.caption(f"Compatibilidade: {simil}%")
         else:
+            st.error("Não achei essa combinação na base. Tente apenas uma palavra-chave da música.")
 except Exception as e:
+    st.error(f"Erro no motor: {e}")