Spaces:

lea97338
/

Encoder

Paused

App Files Files Community

lea97338 commited on 13 days ago

Commit

aef300d

verified ·

1 Parent(s): c95b5a0

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -26

app.py CHANGED Viewed

@@ -1,26 +1,30 @@
 import torch
 import gradio as gr
-from transformers import Qwen3ForCausalLM
 from diffusers import Flux2Pipeline
-# Charger FLUX.2 Klein COMPLET pour récupérer le vrai text encoder (Qwen3)
 pipe = Flux2Pipeline.from_pretrained(
     "black-forest-labs/FLUX.2-klein-4B",
-    torch_dtype=torch.float32,
-    transformer=None,
-    vae=None,
-    scheduler=None,
-    feature_extractor =None,
     low_cpu_mem_usage=True,
 )
-# Récupération du tokenizer + text_encoder (Qwen3ForCausalLM)
-tokenizer = pipe.tokenizer
-text_encoder = Qwen3ForCausalLM.from_pretained(pipe.text_encoder)
-def encode_text(prompt: str):
-    # Tokenisation simple
-    inputs = tokenizer(
         prompt,
         return_tensors="pt",
         padding=True,
@@ -28,29 +32,29 @@ def encode_text(prompt: str):
         max_length=512,
     )
-    # Encodage texte → embeddings 2560 dims
     with torch.inference_mode():
-        outputs = text_encoder(
-            **inputs,
             output_hidden_states=True,
             use_cache=False,
         )
-    # Dernière couche cachée = embeddings texte
-    embeds = outputs.hidden_states[-1]  # [B, L, 2560]
-    # Sauvegarde dans un fichier .pt
-    torch.save(embeds, "embeds.pt")
-    return f"shape={tuple(embeds.shape)}", "embeds.pt"
-# Interface Gradio
 demo = gr.Interface(
-    fn=encode_text,
     inputs=gr.Textbox(label="Prompt"),
-    outputs=[gr.Textbox(label="Shape"), gr.File(label="Embeddings (.pt)")],
-    title="FLUX.2 Klein — Text Embedder (Qwen3 2560 dims)",
-    description="Encodeur texte officiel de FLUX.2 Klein (Qwen3ForCausalLM).",
 )
 demo.launch()

 import torch
 import gradio as gr
+from transformers import AutoTokenizer, Qwen2ForCausalLM
 from diffusers import Flux2Pipeline
+device = "cpu"
+dtype = torch.float32
+# Charger FLUX pour récupérer les embedder internes
 pipe = Flux2Pipeline.from_pretrained(
     "black-forest-labs/FLUX.2-klein-4B",
+    torch_dtype=dtype,
     low_cpu_mem_usage=True,
 )
+pos_embedder = pipe.transformer.pos_embedder
+extra_embedder = pipe.transformer.extra_embedder
+# Charger Qwen (encodeur texte)
+tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2-1.5B")
+text_encoder = Qwen2ForCausalLM.from_pretrained(
+    "Qwen/Qwen2-1.5B",
+    torch_dtype=dtype,
+)
+def encode(prompt):
+    tokens = tokenizer(
         prompt,
         return_tensors="pt",
         padding=True,
         max_length=512,
     )
     with torch.inference_mode():
+        out = text_encoder(
+            **tokens,
             output_hidden_states=True,
             use_cache=False,
         )
+    text = out.hidden_states[-1]  # [1, L, 2560]
+    pos = pos_embedder(text)      # [1, L, 2560]
+    extra = extra_embedder(text)  # [1, L, 2140]
+    final = torch.cat([text, pos, extra], dim=-1)  # [1, L, 7260]
+    torch.save(final, "embeds.pt")
+    return str(final.shape), "embeds.pt"
 demo = gr.Interface(
+    fn=encode,
     inputs=gr.Textbox(label="Prompt"),
+    outputs=[gr.Textbox(label="Shape"), gr.File(label="Embeddings")],
+    title="FLUX Klein — External Encoder (7260 dims)"
 )
 demo.launch()