Upload 8 files

Browse files

Files changed (9) hide show

.gitattributes +1 -0
002_Eng-turbo/README.md +52 -0
002_Eng-turbo/config.json +49 -0
002_Eng-turbo/generation_config.json +4 -0
002_Eng-turbo/high-1764639553.jpg +3 -0
002_Eng-turbo/nzg nzg 73.txt +12 -0
002_Eng-turbo/preprocessor_config.json +5 -0
002_Eng-turbo/tokenizer.json +0 -0
002_Eng-turbo/tokenizer_config.json +15 -0

.gitattributes CHANGED Viewed

@@ -41,3 +41,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 002_Eng-turbo/onnx/embed_tokens_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
 002_Eng-turbo/onnx/language_model_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
 002_Eng-turbo/onnx/speech_encoder_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text

 002_Eng-turbo/onnx/embed_tokens_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
 002_Eng-turbo/onnx/language_model_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
 002_Eng-turbo/onnx/speech_encoder_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
+002_Eng-turbo/high-1764639553.jpg filter=lfs diff=lfs merge=lfs -text

002_Eng-turbo/README.md ADDED Viewed

	@@ -0,0 +1,52 @@

+---
+license: mit
+base_model: ResembleAI/chatterbox-turbo-ONNX
+tags:
+  - text-to-speech
+  - tts
+  - onnx
+  - webgpu
+  - transformers.js
+---
+# Chatterbox Turbo - WebGPU Compatible
+This is a WebGPU-compatible version of [ResembleAI/chatterbox-turbo-ONNX](https://huggingface.co/ResembleAI/chatterbox-turbo-ONNX).
+## Changes from Original
+The original model contains `int64` Cast operations and tensors that WebGPU cannot execute.
+This version converts all `int64` operations to `int32`, enabling direct WebGPU inference.
+### Modifications Made:
+- **conditional_decoder**: 521 Cast nodes inserted (376 Shape/Range ops)
+- **speech_encoder**: 350 Cast nodes inserted (243 Shape/Range ops)
+- **language_model**: 3 Cast nodes inserted
+- **embed_tokens**: 1 Cast node inserted
+## Usage with Transformers.js
+```javascript
+import { AutoModel, AutoProcessor } from '@huggingface/transformers';
+const model = await AutoModel.from_pretrained('spacekaren/chatterbox-turbo-webgpu', {
+  device: 'webgpu',
+  dtype: 'q4f16',
+});
+const processor = await AutoProcessor.from_pretrained('spacekaren/chatterbox-turbo-webgpu');
+```
+## Model Size
+- **Total**: ~539 MB (q4f16 quantization)
+- Same architecture as original, just int64→int32 conversion
+## License
+MIT (same as original)
+## Credits
+- Original model: [ResembleAI/chatterbox-turbo-ONNX](https://huggingface.co/ResembleAI/chatterbox-turbo-ONNX)
+- Conversion script: [local.core/scripts/convert_int64_to_int32.py](https://github.com/anthropics/lama)

002_Eng-turbo/config.json ADDED Viewed

	@@ -0,0 +1,49 @@

+{
+  "model_type": "chatterbox",
+  "text_config": {
+    "activation_function": "gelu_new",
+    "architectures": [
+      "GPT2LMHeadModel"
+    ],
+    "attn_pdrop": 0.1,
+    "bos_token_id": 50256,
+    "embd_pdrop": 0.1,
+    "eos_token_id": 50256,
+    "initializer_range": 0.02,
+    "layer_norm_epsilon": 1e-05,
+    "model_type": "gpt2",
+    "n_ctx": 8196,
+    "n_embd": 1024,
+    "n_head": 16,
+    "n_inner": null,
+    "n_layer": 24,
+    "n_positions": 8196,
+    "n_special": 0,
+    "predict_special_tokens": true,
+    "reorder_and_upcast_attn": false,
+    "resid_pdrop": 0.1,
+    "scale_attn_by_inverse_layer_idx": false,
+    "scale_attn_weights": true,
+    "summary_activation": null,
+    "summary_first_dropout": 0.1,
+    "summary_proj_to_labels": true,
+    "summary_type": "cls_index",
+    "summary_use_proj": true,
+    "task_specific_params": {
+      "text-generation": {
+        "do_sample": true,
+        "max_length": 50
+      }
+    },
+    "transformers_version": "5.0.0.dev0",
+    "use_cache": true,
+    "vocab_size": 6563
+  },
+  "transformers.js_config": {
+    "use_external_data_format": true,
+    "kv_cache_dtype": {
+      "fp16": "float16",
+      "q4f16": "float16"
+    }
+  }
+}

002_Eng-turbo/generation_config.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "eos_token_id": 6562,
+  "repetition_penalty": 1.2
+}

002_Eng-turbo/high-1764639553.jpg ADDED Viewed

Git LFS Details

SHA256: 94c318266c496e74e2f1ce0d1187c4ebc6714ba15fb94ce10811880c3ad4ea37
Pointer size: 131 Bytes
Size of remote file: 129 kB

002_Eng-turbo/nzg nzg 73.txt ADDED Viewed

	@@ -0,0 +1,12 @@

+📺 YouTube :-  @NZG73
+🌐 Website:- nzg73.blogspot.com
+📧 Email:- nzgnzg73@gmail.com

002_Eng-turbo/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+  "feature_extractor_type": "ChatterboxFeatureExtractor",
+  "processor_class": "ChatterboxProcessor",
+  "sampling_rate": 24000
+}

002_Eng-turbo/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

002_Eng-turbo/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "additional_special_tokens": null,
+  "backend": "tokenizers",
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|endoftext|>",
+  "errors": "replace",
+  "is_local": false,
+  "model_max_length": 1024,
+  "model_specific_special_tokens": {},
+  "pad_token": "<|endoftext|>",
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|endoftext|>"
+}