Spaces:

nyanko7
/

danbooru-images

Sleeping

App Files Files Community

nyanko7 commited on Jun 12, 2024

Commit

5c4ad21

verified ·

0 Parent(s):

Super-squash branch 'main' using huggingface_hub

Browse files

Files changed (4) hide show

.gitattributes +37 -0
README.md +13 -0
app.py +107 -0
requirements.txt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,37 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+danbooru_all_tags.json filter=lfs diff=lfs merge=lfs -text
+danbooru_id_url.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: Danbooru Images
+emoji: 🚀
+colorFrom: red
+colorTo: blue
+sdk: streamlit
+sdk_version: 1.35.0
+app_file: app.py
+pinned: false
+license: mit
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,107 @@

+import streamlit as st
+import pandas as pd
+import time
+import json
+import plotly.graph_objects as go
+st.set_page_config(layout="wide")
+@st.cache_resource
+def load_and_preprocess_data():
+    start_time = time.time()
+    df = pd.read_parquet(os.getenv('PARQUET_FILE'))
+    df = df.sort_values(by='post_id', ascending=False)
+    df["tags"] = df["tags"].apply(lambda x: set(x))
+    df.set_index('post_id', inplace=True)
+    sorted_indices = {
+        'Post ID (Descending)': df.index,
+        'Post ID (Ascending)': df.index[::-1],
+        'Clip Score': df['clip_aesthetic'].sort_values(ascending=False).index,
+        'Siglip Score': df['clip_aesthetic_2_5'].sort_values(ascending=False).index,
+    }
+    print(f"Data loaded and preprocessed: {time.time() - start_time:.2f} seconds")
+    return df, sorted_indices
+st.title('Danbooru Images')
+data, sorted_indices = load_and_preprocess_data()
+# isdebar
+st.sidebar.header('Filter Options')
+st.sidebar.write('Adjust the filter options to refine the results.')
+score_range = st.sidebar.slider('Select clip score range', min_value=0.0, max_value=10.0, value=(0.0, 10.0), step=0.1, help='Filter images based on their CLIP score range.')
+score_range_v2 = st.sidebar.slider('Select siglip score range', min_value=0.0, max_value=10.0, value=(6.0, 10.0), step=0.1, help='Filter images based on their SigLIP score range.')
+page_number = st.sidebar.number_input('Page', min_value=1, value=1, step=1, help='Navigate through the pages of filtered results.')
+sort_option = st.sidebar.selectbox('Sort by (slow)', options=['Post ID (Descending)', 'Post ID (Ascending)', 'Clip Score', 'Siglip Score'], help='Select sorting option for the results.')
+# user input
+user_input_tags = st.text_input('Enter tags (space-separated)', help='Filter images based on tags. Use "-" to exclude tags.')
+selected_tags = set([tag.strip() for tag in user_input_tags.split() if tag.strip() and not tag.strip().startswith('-')])
+undesired_tags = set([tag[1:] for tag in  user_input_tags.split() if tag.startswith('-')])
+print(f"Selected tags: {selected_tags}, Undesired tags: {undesired_tags}")
+# Function to filter data based on user input
+def filter_data(df, score_range, score_range_v2, selected_tags, sort_option):
+    start_time = time.time()
+    filtered_data = df[
+        (df['clip_aesthetic'] >= score_range[0]) &
+        (df['clip_aesthetic'] <= score_range[1]) &
+        (df['clip_aesthetic_2_5'] >= score_range_v2[0]) &
+        (df['clip_aesthetic_2_5'] <= score_range_v2[1])
+    ]
+    print(f"Data filtered based on scores: {time.time() - start_time:.2f} seconds")
+    if sort_option != "Post ID (Descending)":
+        sorted_index = sorted_indices[sort_option]
+        sorted_index = sorted_index[sorted_index.isin(filtered_data.index)]
+        filtered_data = filtered_data.loc[sorted_index]
+        print(f"Applying indcies: {time.time() - start_time:.2f} seconds")
+    if selected_tags or undesired_tags:
+        filtered_data = filtered_data[filtered_data['tags'].apply(lambda x: selected_tags.issubset(x) and not undesired_tags.intersection(x))]
+    print(f"Data filtered: {time.time() - start_time:.2f} seconds")
+    return filtered_data
+# Filter data
+filtered_data = filter_data(data, score_range, score_range_v2, selected_tags, sort_option)
+st.sidebar.write(f"Total filtered images: {len(filtered_data)}")
+# Pagination
+items_per_page = 30
+start_idx = (page_number - 1) * items_per_page
+end_idx = start_idx + items_per_page
+current_data = filtered_data.iloc[start_idx:end_idx]
+# Display the data
+columns_per_row = 5
+rows = [current_data.iloc[i:i + columns_per_row] for i in range(0, len(current_data), columns_per_row)]
+for row in rows:
+    cols = st.columns(columns_per_row)
+    for col, (_, row_data) in zip(cols, row.iterrows()):
+        with col:
+            st.image(row_data['large_file_url'], caption=f"ID: {row_data.name}, CLIP: {row_data['clip_aesthetic']:.2f}, SigLIP: {row_data['clip_aesthetic_2_5']:.2f}", use_column_width=True)
+            # st.markdown("<div style='margin: 2px;'></div>", unsafe_allow_html=True)
+def histogram_slider(df, column1, column2):
+    sample_data = df.sample(min(5000, len(df)))
+    fig = go.Figure()
+    fig.add_trace(go.Histogram(x=sample_data[column1], nbinsx=50, name=column1, opacity=0.75))
+    fig.add_trace(go.Histogram(x=sample_data[column2], nbinsx=50, name=column2, opacity=0.75))
+    fig.update_layout(
+        barmode='overlay',
+        bargap=0.1,
+        height=200,
+        xaxis=dict(showticklabels=True),
+        yaxis=dict(showticklabels=True),
+        margin=dict(l=0, r=0, t=0, b=0),
+        legend=dict(orientation='h', yanchor='bottom', y=-0.4, xanchor='center', x=0.5),
+    )
+    st.sidebar.plotly_chart(fig, use_container_width=True, config={'displayModeBar': False})
+# histogram
+start_time = time.time()
+histogram_slider(filtered_data, 'clip_aesthetic', 'clip_aesthetic_2_5')
+print(f"Histogram displayed: {time.time() - start_time:.2f} seconds")

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+pyarrow>=16.0.0
+pandas>=2.2.2
+plotly