Spaces:
Runtime error
Runtime error
Web UI — product specification
What to build: this file. How to run / deploy: WEB_DEV_GUIDE.md.
Overview
Image and video generation from prompts and optional reference images.
AI 创作台
A. 图片 — 0–3 张参考图 + 提示词 → 一张图。模型含 Nano Banana(gemini-2.5-flash-image,无长思考)、Nano Banana 2(gemini-3.1-flash-image-preview,可选长思考)、Nano Banana Pro(gemini-3-pro-image-preview,长思考);默认选项为 Nano Banana 2 快速。宽高比、分辨率见 generation_options.json。
B. 视频 — 0–3 张参考图 + 提示词 → 短视频。Veo 模型可配置;Veo 3 / Veo 3 Fast 与 Veo 3.1 Lite 为 **supports_reference_images: false**(前两者仅纯提示词)。默认模型 Veo 3.1 Fast。有参考图时时长 8s;仅文案时 4/6/8s(以 API 为准)。
C. 首尾过渡 — 起始帧必填 + 提示词;时长 固定 8s。Veo 3 / Veo 3 Fast(supports_end_frame: false)仅起始帧;Veo 3.1 可选独立结尾帧或「与起始相同」。默认模型 Veo 3.1 Fast。
辅助工具
- 超分辨率: 单张原图 → 高清图;默认提示词可改;宽高比按原图自动建议(表单底部可改);比例不匹配时警告仍可生成。
- 提取视频帧: 本地视频 → 时间轴选帧 → PNG。
- 图像裁剪: 前端 Canvas,不上传服务器;自由或固定比例 → PNG。
- 替换纯色背景: 前端 Canvas;原/目标色、容差、预览与 PNG。
示例
静态演示(预置素材),不调用模型。
仓库脚本
run_gen_image_*.sh、run_gen_video_*.sh 等可能只覆盖简化场景。API 文档:图片、视频。
界面
- 密码登录(
WEB_UI_PASSWORD)。 - 侧栏进入各功能;提示词必填;参考图规则按 A/B/C;生成中显示耗时。
- 模型名、分辨率、宽高比等来自 **
web/config/generation_options.json**(可用 **GENERATION_OPTIONS_PATH**),避免写死在代码里;改 JSON 通常不必重编前端。
其他
GEMINI_API_KEY仅环境变量,勿入库。- 代码英文为主;界面与提示词可用中文。