Spaces:

lea97338
/

Encoder

Paused

lea97338 commited on 13 days ago

Commit

6562a48

verified ·

1 Parent(s): 421f7d7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,17 +2,23 @@ import torch
 import gradio as gr
 from diffusers import Flux2Pipeline
-# Charger FLUX.2 COMPLET
 pipe = Flux2Pipeline.from_pretrained(
     "black-forest-labs/FLUX.2-klein-4B",
     torch_dtype=torch.float32,
     low_cpu_mem_usage=True,
 )
 tokenizer = pipe.tokenizer
 text_encoder = pipe.text_encoder
 def encode_text(prompt: str):
     inputs = tokenizer(
         prompt,
         return_tensors="pt",
@@ -21,6 +27,7 @@ def encode_text(prompt: str):
         max_length=512,
     )
     with torch.inference_mode():
         outputs = text_encoder(
             **inputs,
@@ -28,15 +35,21 @@ def encode_text(prompt: str):
             use_cache=False,
         )
-    embeds = outputs.hidden_states[-1]  # [B, L, 4096]
     torch.save(embeds, "embeds.pt")
     return f"shape={tuple(embeds.shape)}", "embeds.pt"
 demo = gr.Interface(
     fn=encode_text,
-    inputs=gr.Textbox(),
-    outputs=[gr.Textbox(), gr.File()],
 )
 demo.launch()

 import gradio as gr
 from diffusers import Flux2Pipeline
+# Charger FLUX.2 Klein COMPLET pour récupérer le vrai text encoder (Qwen3)
 pipe = Flux2Pipeline.from_pretrained(
     "black-forest-labs/FLUX.2-klein-4B",
     torch_dtype=torch.float32,
+    transformer=None,
+    vae=None,
+    scheduler=None,
+    feature_extractor =None,
     low_cpu_mem_usage=True,
 )
+# Récupération du tokenizer + text_encoder (Qwen3ForCausalLM)
 tokenizer = pipe.tokenizer
 text_encoder = pipe.text_encoder
 def encode_text(prompt: str):
+    # Tokenisation simple
     inputs = tokenizer(
         prompt,
         return_tensors="pt",
         max_length=512,
     )
+    # Encodage texte → embeddings 2560 dims
     with torch.inference_mode():
         outputs = text_encoder(
             **inputs,
             use_cache=False,
         )
+    # Dernière couche cachée = embeddings texte
+    embeds = outputs.hidden_states[-1]  # [B, L, 2560]
+    # Sauvegarde dans un fichier .pt
     torch.save(embeds, "embeds.pt")
     return f"shape={tuple(embeds.shape)}", "embeds.pt"
+# Interface Gradio
 demo = gr.Interface(
     fn=encode_text,
+    inputs=gr.Textbox(label="Prompt"),
+    outputs=[gr.Textbox(label="Shape"), gr.File(label="Embeddings (.pt)")],
+    title="FLUX.2 Klein — Text Embedder (Qwen3 2560 dims)",
+    description="Encodeur texte officiel de FLUX.2 Klein (Qwen3ForCausalLM).",
 )
 demo.launch()