tabularisai
/

multilingual-sentiment-analysis

@@ -23,7 +23,6 @@ language:
 - tl
 - nl
 - gsw
-- sw
 library_name: transformers
 license: cc-by-nc-4.0
 pipeline_tag: text-classification
@@ -40,57 +39,26 @@ tags:
 - multilingual
 - 🇪🇺
 - region:eu
-- synthetic
-datasets:
-- tabularisai/swahili_sentiment_dataset
----
-> [!TIP]
-> 🚀 These models are now available through the Tabularis API.
-> Fast multilingual sentiment + emotion classification in 23 languages with structured outputs and simple pricing.
->
-> ✅ Free 10K credits/month
-> 📚 Docs + API key: https://tabularis.ai/sentiment-analysis/
-# 🚀 Multilingual Sentiment Classification Model (23 Languages)
 <!-- TRY IT HERE: `coming soon`
  -->
-<!-- [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/Discord%20button.png" width="200"/>](https://discord.gg/sznxwdqBXj)
- -->
- [![Join Discord](https://img.shields.io/badge/Discord-Join%20community-5865F2?logo=discord&logoColor=white)](https://discord.gg/sznxwdqBXj)
-# NEWS!
-- 2025/8: Major model update +1 new language: **Swahili**! Also, general improvements accross all languages.
-- 2025/8: Free DEMO API for our model! Please see below!
-- 2025/7: We’ve just released ModernFinBERT, a model we’ve been working on for a while. It’s built on the ModernBERT architecture and trained on a mix of real and synthetic data, with LLM-based label correction applied to public datasets to fix human annotation errors.
-It’s performing well across a range of benchmarks — in some cases improving accuracy by up to 48% over existing models like FinBERT.
-You can check it out here on Hugging Face:
-👉 https://huggingface.co/tabularisai/ModernFinBERT
-## 🔌 Hosted DEMO API
-We provide a hosted inference API:
-**Example request body:**
-```json
-curl -X POST https://api.tabularis.ai/ \
-     -H "Content-Type: application/json" \
-     -d '{"text":"I love the design","return_all_scores":false}'
-```
 ## Model Details
 - `Model Name:` tabularisai/multilingual-sentiment-analysis
 - `Base Model:` distilbert/distilbert-base-multilingual-cased
 - `Task:` Text Classification (Sentiment Analysis)
-- `Languages:` Supports English plus Chinese (中文), Spanish (Español), Hindi (हिन्दी), Arabic (العربية), Bengali (বাংলা), Portuguese (Português), Russian (Русский), Japanese (日本語), German (Deutsch), Malay (Bahasa Melayu), Telugu (తెలుగు), Vietnamese (Tiếng Việt), Korean (한국어), French (Français), Turkish (Türkçe), Italian (Italiano), Polish (Polski), Ukrainian (Українська), Tagalog, Dutch (Nederlands), Swiss German (Schweizerdeutsch), and Swahili.
 - `Number of Classes:` 5 (*Very Negative, Negative, Neutral, Positive, Very Positive*)
 - `Usage:`
   - Social media analysis
@@ -101,8 +69,6 @@ curl -X POST https://api.tabularis.ai/ \
   - Customer service optimization
   - Competitive intelligence
 ## Model Description
 This model is a fine-tuned version of `distilbert/distilbert-base-multilingual-cased` for multilingual sentiment analysis. It leverages synthetic data from multiple sources to achieve robust performance across different languages and cultural contexts.
@@ -212,46 +178,12 @@ for text, sentiment in zip(texts, predict_sentiment(texts)):
 Synthetic data reduces bias, but validation in real-world scenarios is advised.
 ## Citation
-```bib
-@misc{tabularisai2025multilingualsentiment,
-  author    = {Vadim Borisov and Samuel Gyamfi and Richard H. Schreiber},
-  title     = {Multilingual Sentiment Analysis},
-  year      = {2025},
-  doi       = {10.57967/hf/5968},
-  url       = {https://huggingface.co/tabularisai/multilingual-sentiment-analysis},
-  publisher = {Hugging Face},
-  note      = {Revision 69afb83}
-}
 ```
 ## Contact
 For inquiries, data, private APIs, better models, contact info@tabularis.ai
-tabularis.ai
-<table align="center">
-  <tr>
-    <td align="center">
-      <a href="https://www.linkedin.com/company/tabularis-ai/">
-        <img src="https://cdn.jsdelivr.net/gh/simple-icons/simple-icons/icons/linkedin.svg" alt="LinkedIn" width="30" height="30">
-      </a>
-    </td>
-    <td align="center">
-      <a href="https://x.com/tabularis_ai">
-        <img src="https://cdn.jsdelivr.net/gh/simple-icons/simple-icons/icons/x.svg" alt="X" width="30" height="30">
-      </a>
-    </td>
-    <td align="center">
-      <a href="https://github.com/tabularis-ai">
-        <img src="https://cdn.jsdelivr.net/gh/simple-icons/simple-icons/icons/github.svg" alt="GitHub" width="30" height="30">
-      </a>
-    </td>
-    <td align="center">
-      <a href="https://tabularis.ai">
-        <img src="https://cdn.jsdelivr.net/gh/simple-icons/simple-icons/icons/internetarchive.svg" alt="Website" width="30" height="30">
-      </a>
-    </td>
-  </tr>
-</table>

 - tl
 - nl
 - gsw
 library_name: transformers
 license: cc-by-nc-4.0
 pipeline_tag: text-classification
 - multilingual
 - 🇪🇺
 - region:eu
+---
+# 🚀 distilbert-based Multilingual Sentiment Classification Model
 <!-- TRY IT HERE: `coming soon`
  -->
+[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/Discord%20button.png" width="200"/>](https://discord.gg/sznxwdqBXj)
+# NEWS!
+- 2024/12: We are excited to introduce a multilingual sentiment model! Now you can analyze sentiment across multiple languages, enhancing your global reach.
 ## Model Details
 - `Model Name:` tabularisai/multilingual-sentiment-analysis
 - `Base Model:` distilbert/distilbert-base-multilingual-cased
 - `Task:` Text Classification (Sentiment Analysis)
+- `Languages:` Supports English plus Chinese (中文), Spanish (Español), Hindi (हिन्दी), Arabic (العربية), Bengali (বাংলা), Portuguese (Português), Russian (Русский), Japanese (日本語), German (Deutsch), Malay (Bahasa Melayu), Telugu (తెలుగు), Vietnamese (Tiếng Việt), Korean (한국어), French (Français), Turkish (Türkçe), Italian (Italiano), Polish (Polski), Ukrainian (Українська), Tagalog, Dutch (Nederlands), Swiss German (Schweizerdeutsch).
 - `Number of Classes:` 5 (*Very Negative, Negative, Neutral, Positive, Very Positive*)
 - `Usage:`
   - Social media analysis
   - Customer service optimization
   - Competitive intelligence
 ## Model Description
 This model is a fine-tuned version of `distilbert/distilbert-base-multilingual-cased` for multilingual sentiment analysis. It leverages synthetic data from multiple sources to achieve robust performance across different languages and cultural contexts.
 Synthetic data reduces bias, but validation in real-world scenarios is advised.
 ## Citation
+```
+Will be included.
 ```
 ## Contact
 For inquiries, data, private APIs, better models, contact info@tabularis.ai
+tabularis.ai

config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"
@@ -34,6 +35,6 @@
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.55.0",
   "vocab_size": 119547
 }

 {
+  "_name_or_path": "results/checkpoint-1400_best",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.46.3",
   "vocab_size": 119547
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ab3cecb8605da0a240e5b4e18d969704d44e27c6ea48533ef6693d31dbb926a
 size 541326604

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bb33a58e6056036c2b396c6971d3c7ebe916c7f2d7fb5bb46aa319ed3288ff8
 size 541326604