Malaji71 commited on
Commit
f552e86
·
verified ·
1 Parent(s): d7e63f9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +186 -1
README.md CHANGED
@@ -11,4 +11,189 @@ license: mit
11
  short_description: Enriquecimiento de prompts visuales
12
  ---
13
 
14
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
11
  short_description: Enriquecimiento de prompts visuales
12
  ---
13
 
14
+ # PromptCraft: Refinamiento Estructural de Prompts
15
+
16
+ **PromptCraft** es un sistema de ingeniería de prompts asistida por IA que transforma ideas en lenguaje natural en prompts optimizados para modelos de difusión (Midjourney, FLUX, SDXL).
17
+ A diferencia de los refinadores basados en parafraseo, **PromptCraft analiza la gramática descriptiva de 100.000 prompts profesionales** y reconstruye el concepto del usuario imitando esa estructura real.
18
+
19
+ > **No impone plantillas. No inventa. Solo estructura.**
20
+
21
+ ---
22
+
23
+ ## 🌐 Flujo del sistema
24
+ Usuario (castellano)
25
+
26
+ Traducción local (es → en)
27
+
28
+ Recuperación semántica (FAISS + categoría)
29
+
30
+ Re-ranking con Cross-Encoder (top 6)
31
+
32
+ Reconstrucción con LLaMA-3.2-3B (gramática del dataset)
33
+
34
+ Generación con SDXL
35
+
36
+
37
+ ---
38
+
39
+ ## 🔑 Características clave
40
+
41
+ - **Refinamiento estructural**: el LLM imita la gramática de prompts reales, no sigue una plantilla abstracta.
42
+ - **Categorización contextual**: filtra ejemplos por tipo (entidad, estilo, composición, etc.).
43
+ - **Transparencia total**: muestra los 6 ejemplos del dataset usados para el refinamiento.
44
+ - **Iteración libre**: refina el prompt tantas veces como necesites antes de generar.
45
+ - **100% funcional en CPU**: traducción y análisis locales; solo la generación usa la nube.
46
+
47
+ ---
48
+
49
+ ## 🛠️ Cómo usarlo
50
+
51
+ 1. **Escribe tu idea en castellano** (ej: *"un mercado en Antigua Guatemala"*).
52
+ 2. **(Opcional) Selecciona una categoría**:
53
+ - **Automática**: el sistema decide.
54
+ - **Entidad**: personas, objetos, criaturas.
55
+ - **Composición**: escenas, entornos, narrativas.
56
+ - **Estilo artístico**: pintura, ilustración, fotografía.
57
+ - **Imaginativo**: fantasía, ciencia ficción.
58
+ - **Texto**: tipografía, logotipos.
59
+ 3. Haz clic en **"🔄 Refinar prompt"**.
60
+ 4. Si no te gusta el resultado, **refina de nuevo**.
61
+ 5. Cuando estés satisfecho, haz clic en **"🎨 Generar imagen"**.
62
+
63
+ ---
64
+
65
+ ## 📁 Requisitos del dataset
66
+
67
+ Tu `metadata.json` debe tener este formato:
68
+ ```json
69
+ [
70
+ {
71
+ "caption": "a cyberpunk street at night, neon signs...",
72
+ "category": "composition"
73
+ },
74
+ {
75
+ "caption": "oil painting of a forest, style of Van Gogh",
76
+ "category": "style"
77
+ }
78
+ ]
79
+
80
+ Sin el campo "category", el sistema funciona en modo "Automática" (sin filtrar).
81
+
82
+ 📦 Dependencias
83
+ gradio==4.24.0
84
+ Pillow
85
+ huggingface-hub>=0.24.0
86
+ sentence-transformers>=2.3.0
87
+ faiss-cpu==1.7.4
88
+ datasets>=2.10.0
89
+ torch
90
+ transformers
91
+ sentencepiece
92
+ profile
93
+ Qwen3-Max
94
+ 7:48 pm
95
+ ¡Claro, socio! Aquí tienes el README.md completo en un solo bloque de código, listo para copiar y pegar, con los créditos finales como pediste.
96
+
97
+ markdown
98
+
99
+
100
+ 1
101
+ 2
102
+ 3
103
+ 4
104
+ 5
105
+ 6
106
+ 7
107
+ 8
108
+ 9
109
+ 10
110
+ 11
111
+
112
+
113
+ # PromptCraft: Refinamiento Estructural de Prompts
114
+
115
+ **PromptCraft** es un sistema de ingeniería de prompts asistida por IA que transforma ideas en lenguaje natural en prompts optimizados para modelos de difusión (Midjourney, FLUX, SDXL).
116
+ A diferencia de los refinadores basados en parafraseo, **PromptCraft analiza la gramática descriptiva de 100.000 prompts profesionales** y reconstruye el concepto del usuario imitando esa estructura real.
117
+
118
+ > **No impone plantillas. No inventa. Solo estructura.**
119
+
120
+ ---
121
+
122
+ ## 🌐 Flujo del sistema
123
+
124
+ Usuario (castellano)
125
+
126
+ Traducción local (es → en)
127
+
128
+ Recuperación semántica (FAISS + categoría)
129
+
130
+ Re-ranking con Cross-Encoder (top 6)
131
+
132
+ Reconstrucción con LLaMA-3.2-3B (gramática del dataset)
133
+
134
+ Generación con SDXL
135
+
136
+ ---
137
+
138
+ ## 🔑 Características clave
139
+
140
+ - **Refinamiento estructural**: el LLM imita la gramática de prompts reales, no sigue una plantilla abstracta.
141
+ - **Categorización contextual**: filtra ejemplos por tipo (entidad, estilo, composición, etc.).
142
+ - **Transparencia total**: muestra los 6 ejemplos del dataset usados para el refinamiento.
143
+ - **Iteración libre**: refina el prompt tantas veces como necesites antes de generar.
144
+ - **100% funcional en CPU**: traducción y análisis locales; solo la generación usa la nube.
145
+
146
+ ---
147
+
148
+ ## 🛠️ Cómo usarlo
149
+
150
+ 1. **Escribe tu idea en castellano** (ej: *"un mercado en Antigua Guatemala"*).
151
+ 2. **(Opcional) Selecciona una categoría**:
152
+ - **Automática**: el sistema decide.
153
+ - **Entidad**: personas, objetos, criaturas.
154
+ - **Composición**: escenas, entornos, narrativas.
155
+ - **Estilo artístico**: pintura, ilustración, fotografía.
156
+ - **Imaginativo**: fantasía, ciencia ficción.
157
+ - **Texto**: tipografía, logotipos.
158
+ 3. Haz clic en **"🔄 Refinar prompt"**.
159
+ 4. Si no te gusta el resultado, **refina de nuevo**.
160
+ 5. Cuando estés satisfecho, haz clic en **"🎨 Generar imagen"**.
161
+
162
+ ---
163
+
164
+ ## 📁 Requisitos del dataset
165
+
166
+ Tu `metadata.json` debe tener este formato:
167
+ ```json
168
+ [
169
+ {
170
+ "caption": "a cyberpunk street at night, neon signs...",
171
+ "category": "composition"
172
+ },
173
+ {
174
+ "caption": "oil painting of a forest, style of Van Gogh",
175
+ "category": "style"
176
+ }
177
+ ]
178
+ Sin el campo "category", el sistema funciona en modo "Automática" (sin filtrar).
179
+
180
+ 📦 Dependencias
181
+
182
+ gradio==4.24.0
183
+ Pillow
184
+ huggingface-hub>=0.24.0
185
+ sentence-transformers>=2.3.0
186
+ faiss-cpu==1.7.4
187
+ datasets>=2.10.0
188
+ torch
189
+ transformers
190
+ sentencepiece
191
+
192
+ 🚀 Créditos
193
+ Motor semántico: FAISS + bge-small-en-v1.5 + Cross-Encoder.
194
+ Traducción: Helsinki-NLP/opus-mt-es-en (local, CPU).
195
+ Refinamiento: meta-llama/Llama-3.2-3B-Instruct.
196
+ Generación: stabilityai/stable-diffusion-xl-base-1.0.
197
+ Este proyecto nace de la necesidad de coherencia narrativa y control estructural en la generación de imágenes por IA, especialmente para cineastas, escritores y artistas visuales.
198
+
199
+ Creado por Angel E. Pariente 🇬🇹 según la idea de Nacho Ravinovich 🇦🇷