Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

Benjamin Potzmann

Giymo11

1

·

Giymo11

AI & ML interests

Multimodal AI, LLMs, RAG

Organizations

None yet

Giymo11 's collections 3

Multimodal (Audio + Visual)

Qwen/Qwen3-Omni-30B-A3B-Instruct

Any-to-Any • 35B • Updated Sep 22, 2025 • 1.94M • 955
google/gemma-3n-E4B-it

Image-Text-to-Text • 8B • Updated Jul 14, 2025 • 21.1k • • 918
Qwen/Qwen2.5-Omni-7B

Any-to-Any • 11B • Updated Apr 30, 2025 • 591k • 1.92k
meta-llama/Llama-4-Scout-17B-16E

Image-Text-to-Text • 109B • Updated Apr 9, 2025 • 32.5k • 259

nvidia/canary-qwen-2.5b

Automatic Speech Recognition • 3B • Updated Apr 21 • 110k • 445
nvidia/parakeet-tdt-0.6b-v3

Automatic Speech Recognition • 0.6B • Updated 10 days ago • 105k • • 986
zai-org/GLM-ASR-Nano-2512

Automatic Speech Recognition • 2B • Updated Apr 7 • 148k • 383
Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • 8B • Updated Nov 20, 2024 • 12.6k • 172

Multimodal (Audio)

Qwen/Qwen3-Omni-30B-A3B-Instruct

Any-to-Any • 35B • Updated Sep 22, 2025 • 1.94M • 955
Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • 8B • Updated Nov 20, 2024 • 12.6k • 172
mistralai/Voxtral-Small-24B-2507

Audio-Text-to-Text • 24B • Updated Dec 20, 2025 • 172k • 507
mistralai/Voxtral-Mini-3B-2507

5B • Updated Jul 28, 2025 • 387k • 660

Multimodal (Audio + Visual)

Qwen/Qwen3-Omni-30B-A3B-Instruct

Any-to-Any • 35B • Updated Sep 22, 2025 • 1.94M • 955
google/gemma-3n-E4B-it

Image-Text-to-Text • 8B • Updated Jul 14, 2025 • 21.1k • • 918
Qwen/Qwen2.5-Omni-7B

Any-to-Any • 11B • Updated Apr 30, 2025 • 591k • 1.92k
meta-llama/Llama-4-Scout-17B-16E

Image-Text-to-Text • 109B • Updated Apr 9, 2025 • 32.5k • 259

Multimodal (Audio)

Qwen/Qwen3-Omni-30B-A3B-Instruct

Any-to-Any • 35B • Updated Sep 22, 2025 • 1.94M • 955
Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • 8B • Updated Nov 20, 2024 • 12.6k • 172
mistralai/Voxtral-Small-24B-2507

Audio-Text-to-Text • 24B • Updated Dec 20, 2025 • 172k • 507
mistralai/Voxtral-Mini-3B-2507

5B • Updated Jul 28, 2025 • 387k • 660

nvidia/canary-qwen-2.5b

Automatic Speech Recognition • 3B • Updated Apr 21 • 110k • 445
nvidia/parakeet-tdt-0.6b-v3

Automatic Speech Recognition • 0.6B • Updated 10 days ago • 105k • • 986
zai-org/GLM-ASR-Nano-2512

Automatic Speech Recognition • 2B • Updated Apr 7 • 148k • 383
Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • 8B • Updated Nov 20, 2024 • 12.6k • 172

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs