CrashOverrideX
/

Quillan-Ronin

Text Generation

image-generation

video-generation

audio-generation

text-generation-inference

Model card Files Files and versions

CrashOverrideX commited on Mar 4

Commit

175d37c

·

verified ·

1 Parent(s): c0e6da2

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md +53 -33

README.md CHANGED Viewed

@@ -1,33 +1,53 @@
-# Quillan-Ronin Llama-Compatible GGUF Export
-## Files Created:
-- model.safetensors: Model weights in Llama-compatible format (float16)
-- config.json: Llama model configuration
-- tokenizer_config.json: Tokenizer configuration
-- vocab.json: Vocabulary mapping
-- special_tokens_map.json: Special tokens mapping
-## GGUF Conversion Instructions:
-### Option 1: Local Conversion (Recommended)
-```bash
-cd llama.cpp
-python convert_hf_to_gguf.py ../gguf_export/ --outtype f16
-./build/bin/llama-quantize model.gguf model-Q4_K_M.gguf Q4_K_M
-```
-### Option 2: Online Conversion
-Upload gguf_export folder to: https://huggingface.co/spaces/ggml-org/gguf-my-repo
-Select GGUF output format and Q4_K_M quantization
-### Option 3: Direct Ollama Creation
-```bash
-ollama create quillan-ronin -f ./gguf_export
-```
-## Architecture Notes:
-- Uses LlamaForCausalLM architecture for compatibility
-- Maintains Quillan's core capabilities through weight mapping
-- 4 transformer layers, 8 attention heads, 1024 hidden dim
-- Supports standard Llama inference pipelines

+---
+license: mit
+language: en
+library_name: transformers
+tags:
+- llama
+- causal-lm
+- multimodal
+- text-generation
+- image-generation
+- video-generation
+- audio-generation
+---
+# Quillan-Ronin v6.0 - Expanded Council Architecture
+An advanced multimodal AI with 34 expert councils and 300,000 micro-agents.
+## Model Description
+Quillan-Ronin v6.0 is an expanded multimodal AI system featuring:
+- 4K resolution image generation
+- 720p 30fps video generation
+- 10-minute high-quality audio generation
+- 34 expert councils for specialized reasoning
+- 300,000 micro-agent swarm controller
+- 12 vector processing cores
+## Architecture
+- **Model Type**: LlamaForCausalLM (GGUF compatible)
+- **Parameters**: ~68M (lightweight version)
+- **Context Length**: 1024 tokens
+- **Hidden Size**: 1024
+- **Layers**: 4 transformer layers
+- **Attention Heads**: 8
+## Capabilities
+- Text processing and generation
+- Image generation (4K resolution)
+- Video generation (720p @ 30fps)
+- Audio generation (44.1kHz, 10-minute clips)
+- Multimodal integration
+- Advanced reasoning through council system
+## Usage
+This model is designed for GGUF conversion and use with Ollama or llama.cpp.
+## License
+MIT License