int4 llm - a roshniramesh Collection

Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

roshniramesh 's Collections

int4 llm

updated Jan 16, 2025

OpenVINO/phi-2-int4-ov

Text Generation • Updated Nov 5, 2024 • 11 • 1
nvidia/Gemma-2b-it-ONNX-INT4

Updated Nov 15, 2024 • 9
nvidia/Meta-Llama-3.1-8B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 14 • 8
nvidia/Meta-Llama-3.2-3B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Phi-3.5-mini-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 2
nvidia/Mistral-Nemo-12B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 4
nvidia/Nemotron-Mini-4B-Instruct-ONNX-INT4

Updated Nov 18, 2024 • 8
meta-llama/Llama-3.2-1B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 27 • 39
hugging-quants/gemma-2-9b-it-AWQ-INT4

Text Generation • 9B • Updated Oct 17, 2024 • 9.11k • 9
Qwen/Qwen2-7B-Instruct-GPTQ-Int4

Text Generation • 8B • Updated Aug 21, 2024 • 687 • 28
hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4

Text Generation • Updated Aug 7, 2024 • 183k • 91
RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated 20 days ago • 74.9k • 30
ModelCloud/Meta-Llama-3.1-8B-gptq-4bit

Text Generation • 8B • Updated Jul 26, 2024 • 206
hugging-quants/Llama-3.2-3B-Instruct-Q4_K_M-GGUF

Text Generation • 3B • Updated Sep 25, 2024 • 33.6k • 31
hugging-quants/Meta-Llama-3.1-70B-Instruct-AWQ-INT4

Text Generation • Updated Aug 7, 2024 • 386k • 109
hugging-quants/Llama-3.2-1B-Instruct-Q4_K_M-GGUF

Text Generation • 1B • Updated Sep 25, 2024 • 42.5k • 26
hugging-quants/Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

Text Generation • 71B • Updated Aug 7, 2024 • 1.39k • 23
hugging-quants/Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

Text Generation • 8B • Updated Aug 7, 2024 • 4.19k • 42
meta-llama/Llama-Guard-3-1B-INT4

Text Generation • Updated Sep 25, 2024 • 13 • 29
meta-llama/Llama-3.2-3B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 74 • 74
meta-llama/Llama-3.2-3B-Instruct-SpinQuant_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 12 • 40
meta-llama/Llama-3.2-1B-Instruct-QLORA_INT4_EO8

Text Generation • Updated Nov 18, 2024 • 51 • 48
RedHatAI/Mistral-7B-Instruct-v0.3-GPTQ-4bit

Text Generation • 7B • Updated Jun 10, 2024 • 1.16k • 25
RedHatAI/Mistral-7B-Instruct-v0.3-quantized.w4a16

Text Generation • 7B • Updated Mar 13, 2025 • 460 • 2
RedHatAI/Llama-2-7b-chat-quantized.w4a16

Text Generation • 7B • Updated Jul 18, 2024 • 7
RedHatAI/Meta-Llama-3-8B-Instruct-quantized.w4a16

Text Generation • 8B • Updated Jul 18, 2024 • 1.05k • 2
RedHatAI/Meta-Llama-3-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Aug 29, 2024 • 16 • 2
RedHatAI/gemma-2-2b-it-quantized.w4a16

Text Generation • 3B • Updated Oct 9, 2024 • 92 • 1
RedHatAI/gemma-2-9b-it-quantized.w4a16

Text Generation • 10B • Updated Oct 9, 2024 • 125 • 2
RedHatAI/Mistral-Nemo-Instruct-2407-quantized.w4a16

Text Generation • 12B • Updated Oct 9, 2024 • 364 • 4
RedHatAI/Meta-Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Feb 12, 2025 • 77.1k • 33
nvidia/Mistral-7B-Instruct-v0.3-ONNX-INT4

Updated Nov 15, 2024 • 7
OpenVINO/mistral-7b-instruct-v0.1-int4-ov

Text Generation • Updated Oct 29, 2024 • 40
OpenVINO/Mistral-7B-Instruct-v0.2-int4-ov

Text Generation • Updated Oct 31, 2024 • 76 • 1
Qwen/Qwen-72B-Chat-Int4

Text Generation • 72B • Updated Jan 4, 2024 • 69 • 47
Qwen/Qwen-14B-Chat-Int4

Text Generation • 14B • Updated Dec 13, 2023 • 738 • 100
Qwen/Qwen-7B-Chat-Int4

Text Generation • 8B • Updated Jan 4, 2024 • 586 • 75
Qwen/Qwen-1_8B-Chat-Int4

Text Generation • 2B • Updated Dec 13, 2023 • 219 • 36
Qwen/Qwen1.5-110B-Chat-GPTQ-Int4

Text Generation • 111B • Updated Apr 30, 2024 • 125 • 18
Qwen/Qwen1.5-1.8B-Chat-GPTQ-Int4

Text Generation • 2B • Updated Apr 30, 2024 • 130 • 7
Qwen/Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4

Text Generation • 14B • Updated Jun 9, 2024 • 3.88k • 50
Qwen/Qwen1.5-4B-Chat-GPTQ-Int4

Text Generation • 4B • Updated Apr 30, 2024 • 12 • 6
Qwen/Qwen1.5-72B-Chat-GPTQ-Int4

Text Generation • 72B • Updated Apr 30, 2024 • 4.05k • 37
Qwen/Qwen1.5-4B-Chat-GGUF

Text Generation • 4B • Updated Apr 9, 2024 • 986 • 16
Qwen/Qwen1.5-0.5B-Chat-GGUF

Text Generation • 0.6B • Updated Apr 9, 2024 • 9.97k • 35
Qwen/Qwen1.5-7B-Chat-GGUF

Text Generation • 8B • Updated Apr 9, 2024 • 1.01k • 71
Qwen/CodeQwen1.5-7B-Chat-GGUF

Text Generation • 7B • Updated Apr 23, 2024 • 703 • 111
Qwen/Qwen2.5-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Oct 9, 2024 • 1.48k • 3
Qwen/Qwen2.5-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.5B • Updated Sep 19, 2024 • 2.89k • 9
Qwen/Qwen2.5-0.5B-Instruct-GGUF

Text Generation • 0.6B • Updated Sep 20, 2024 • 199k • 107
Qwen/Qwen2-1.5B-Instruct-GGUF

Text Generation • 2B • Updated Jun 18, 2024 • 49.5k • 29
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • 0.5B • Updated Aug 21, 2024 • 10.4k • 73
Qwen/Qwen2-7B-Instruct-GGUF

Text Generation • 8B • Updated Aug 21, 2024 • 71.9k • 179
Qwen/Qwen2-0.5B-Instruct-GPTQ-Int4

Text Generation • 0.6B • Updated Aug 21, 2024 • 79 • 15
Qwen/Qwen2-1.5B-Instruct-GPTQ-Int4

Text Generation • 2B • Updated Aug 21, 2024 • 39.5k • 5
Qwen/Qwen2-72B-Instruct-GPTQ-Int4

Text Generation • 73B • Updated Aug 21, 2024 • 68 • 33
Qwen/Qwen2-57B-A14B-Instruct-GPTQ-Int4

Text Generation • 57B • Updated Aug 21, 2024 • 73 • 23

Collection guide
Browse collections

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs