Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing

  • Log In
  • Sign Up

procesaur
/
Emo355

Sentence Similarity
sentence-transformers
Safetensors
roberta
feature-extraction
Generated from Trainer
dataset_size:11968
loss:MSELoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use procesaur/Emo355 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use procesaur/Emo355 with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("procesaur/Emo355")
    
    sentences = [
        "Pazi, sanse za pune stipendije su uvek male, prvo razmisli da li kod nas mozes da ulises master na stipendiju, pa onda tek kod njih. Realno neces se kajati ako probas cak i da te odbiju.",
        "Ako radis samo ux/ui onda mislim da ne bi trebao da imas problema sa 7410. Ukoliko dodatno nesto petljas oko koda ili koristis neke CMS-ove onda 6201. Postavi ovo pitanje na dizajnzoni, moguce da je neko imao slicne nedoumice...",
        "Polagao sam pre par meseci pa ovako: \\n\\n1. Od kada je korona polaže se isključivo na računaru, nema više papira, ali ne od kuće već u njihovim test centrima. Reading, writing i listening se rade uvek u test centru, dok se za speaking ide u prostorije kod kalemegdana gde pričaš. \\n\\n2. Cena je koliko se secam bila oko 20k \\n\\n3. Zavisi od tvog znanja, ja i par drugara smo polagali bez pripreme i svi smo imali 8, 8.5 ili 9 od 9, ali zato par ljudi nikako da položi. \\n\\n4. Ima dosta koji imaju istu težinu kao što su CAE, TOEFL itd. ali IELTS ti je najlakši.",
        "Ključna reč je *classified as*. Pojam/klasifikacija \"naroda Han\" je u formulaciji iz 1911 - dovoljno govori to koliko jezika govore. Danas su u \"narodu Han\" i Mandžurijci, o kojima su kineski antropolozi pisali pre 100 godina kao o drugoj rasi i isticali koliko su Mandžurijci \"rasno inferiorni\". Čak i da to zanemarimo, obrati pažnju koliki procenat kineske teritorije ima drugačiju kulturu - i koliko takvih regiona danas ima separatističke pokrete.\\n\\nAli čak i to da zanemarimo sve i uzmemo da je situacija takva kakvom je predstavljaš - dakle oblasti naroda Han su ubedljivo najrazvijenije i oni nemaju problema sa time, dok ostale teritorije predstavljaju nešto više od izvoznika sirovina. Da li takva treba i Srbija da bude - hoće li u Srbiji svođenje vlaških oblasti na izvoznika sirovina dovesti do pojave separatizma?\\n\\nU stvari, kako je ova situacija u Kini drastično drugačija od srpske - Beograd i njegovi produžeci danas nemaju nikakve separatističke namere. Da li bi ti pristao na Srbiju u kojoj skoro sva industrija biva u Vojvodini, a ostatak Srbije za nju proizvodi sirovine i radnu snagu - da li je to model ravnomernog razvoja koji promovišeš?"
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
Emo355
1.42 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 3 commits
procesaur's picture
procesaur
Upload labels_emo.json
c789cbd verified 12 months ago
  • 1_Pooling
    Upload 14 files 12 months ago
  • 2_Dense
    Upload 14 files 12 months ago
  • .gitattributes
    1.52 kB
    initial commit 12 months ago
  • README.md
    22.7 kB
    Upload 14 files 12 months ago
  • config.json
    699 Bytes
    Upload 14 files 12 months ago
  • config_sentence_transformers.json
    210 Bytes
    Upload 14 files 12 months ago
  • labels_emo.json
    107 Bytes
    Upload labels_emo.json 12 months ago
  • merges.txt
    498 kB
    Upload 14 files 12 months ago
  • model.safetensors
    1.42 GB
    xet
    Upload 14 files 12 months ago
  • modules.json
    360 Bytes
    Upload 14 files 12 months ago
  • sentence_bert_config.json
    56 Bytes
    Upload 14 files 12 months ago
  • special_tokens_map.json
    295 Bytes
    Upload 14 files 12 months ago
  • tokenizer.json
    3.59 MB
    Upload 14 files 12 months ago
  • tokenizer_config.json
    1.27 kB
    Upload 14 files 12 months ago
  • vocab.json
    832 kB
    Upload 14 files 12 months ago