Rahkakavee Baskaran commited on
Commit
f8b83ae
·
1 Parent(s): 61043c0

delete model

Browse files
.gitattributes DELETED
@@ -1 +0,0 @@
1
- pytorch_model.bin filter=lfs diff=lfs merge=lfs -text
 
 
1_Pooling/config.json DELETED
@@ -1,7 +0,0 @@
1
- {
2
- "word_embedding_dimension": 768,
3
- "pooling_mode_cls_token": false,
4
- "pooling_mode_mean_tokens": true,
5
- "pooling_mode_max_tokens": false,
6
- "pooling_mode_mean_sqrt_len_tokens": false
7
- }
 
 
 
 
 
 
 
 
README.md DELETED
@@ -1,126 +0,0 @@
1
- ---
2
- pipeline_tag: sentence-similarity
3
- tags:
4
- - sentence-transformers
5
- - feature-extraction
6
- - sentence-similarity
7
- - transformers
8
-
9
- ---
10
-
11
- # {MODEL_NAME}
12
-
13
- This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
14
-
15
- <!--- Describe your model here -->
16
-
17
- ## Usage (Sentence-Transformers)
18
-
19
- Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
20
-
21
- ```
22
- pip install -U sentence-transformers
23
- ```
24
-
25
- Then you can use the model like this:
26
-
27
- ```python
28
- from sentence_transformers import SentenceTransformer
29
- sentences = ["This is an example sentence", "Each sentence is converted"]
30
-
31
- model = SentenceTransformer('{MODEL_NAME}')
32
- embeddings = model.encode(sentences)
33
- print(embeddings)
34
- ```
35
-
36
-
37
-
38
- ## Usage (HuggingFace Transformers)
39
- Without [sentence-transformers](https://www.SBERT.net), you can use the model like this: First, you pass your input through the transformer model, then you have to apply the right pooling-operation on-top of the contextualized word embeddings.
40
-
41
- ```python
42
- from transformers import AutoTokenizer, AutoModel
43
- import torch
44
-
45
-
46
- #Mean Pooling - Take attention mask into account for correct averaging
47
- def mean_pooling(model_output, attention_mask):
48
- token_embeddings = model_output[0] #First element of model_output contains all token embeddings
49
- input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
50
- return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)
51
-
52
-
53
- # Sentences we want sentence embeddings for
54
- sentences = ['This is an example sentence', 'Each sentence is converted']
55
-
56
- # Load model from HuggingFace Hub
57
- tokenizer = AutoTokenizer.from_pretrained('{MODEL_NAME}')
58
- model = AutoModel.from_pretrained('{MODEL_NAME}')
59
-
60
- # Tokenize sentences
61
- encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
62
-
63
- # Compute token embeddings
64
- with torch.no_grad():
65
- model_output = model(**encoded_input)
66
-
67
- # Perform pooling. In this case, mean pooling.
68
- sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])
69
-
70
- print("Sentence embeddings:")
71
- print(sentence_embeddings)
72
- ```
73
-
74
-
75
-
76
- ## Evaluation Results
77
-
78
- <!--- Describe how your model was evaluated -->
79
-
80
- For an automated evaluation of this model, see the *Sentence Embeddings Benchmark*: [https://seb.sbert.net](https://seb.sbert.net?model_name={MODEL_NAME})
81
-
82
-
83
- ## Training
84
- The model was trained with the parameters:
85
-
86
- **DataLoader**:
87
-
88
- `torch.utils.data.dataloader.DataLoader` of length 190 with parameters:
89
- ```
90
- {'batch_size': 16, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
91
- ```
92
-
93
- **Loss**:
94
-
95
- `sentence_transformers.losses.CosineSimilarityLoss.CosineSimilarityLoss`
96
-
97
- Parameters of the fit()-Method:
98
- ```
99
- {
100
- "epochs": 3,
101
- "evaluation_steps": 0,
102
- "evaluator": "NoneType",
103
- "max_grad_norm": 1,
104
- "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
105
- "optimizer_params": {
106
- "lr": 2e-05
107
- },
108
- "scheduler": "WarmupLinear",
109
- "steps_per_epoch": null,
110
- "warmup_steps": 100,
111
- "weight_decay": 0.01
112
- }
113
- ```
114
-
115
-
116
- ## Full Model Architecture
117
- ```
118
- SentenceTransformer(
119
- (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
120
- (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
121
- )
122
- ```
123
-
124
- ## Citing & Authors
125
-
126
- <!--- Describe where people can find more information -->
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
added_tokens.json DELETED
@@ -1,277 +0,0 @@
1
- {
2
- "Abfallentsorgung": 31124,
3
- "Abfallkalender": 31332,
4
- "Abfallmenge": 31252,
5
- "Abgabestelle": 31173,
6
- "Ampelanlage": 31274,
7
- "Angebot und Beratungsstelle": 31336,
8
- "Anliegenmanagement": 31227,
9
- "Apotheke": 31337,
10
- "Arbeitslosigkeit": 31112,
11
- "Arzt": 31155,
12
- "Ausbildung": 31103,
13
- "Bad und Freibad": 31287,
14
- "Bau": 31245,
15
- "Baufertigstellung": 31228,
16
- "Baugenehmigung": 31317,
17
- "Bauleitplan": 31138,
18
- "Baumbestand - Baumfällung": 31230,
19
- "Baumbestand - Baumkataster": 31355,
20
- "Baumbestand - Baumstandort": 31107,
21
- "Bauprojekt": 31286,
22
- "Baustelle": 31121,
23
- "Bebauungsplan": 31357,
24
- "Behinderung - Behindertenwohnheim": 31218,
25
- "Behinderung - Menschen mit Behinderung": 31273,
26
- "Beleuchtung": 31246,
27
- "Bericht": 31310,
28
- "Bericht und Analyse - Klimabilanz": 31196,
29
- "Bericht und Analyse - Luft und Emission": 31264,
30
- "Bericht und Analyse - Verkehrsmessung": 31202,
31
- "Bericht und Analyse - Wasser": 31338,
32
- "Berufspendler": 31133,
33
- "Beschäftigung": 31374,
34
- "Beteiligung": 31299,
35
- "Beteiligung an Öffentlicher Wirtschaft - Ausschreibung und Vergabe": 31200,
36
- "Beteiligung an Öffentlicher Wirtschaft - Beteiligung": 31143,
37
- "Bevölkerungsstruktur": 31129,
38
- "Bibliothek - Ausleihe": 31282,
39
- "Bibliothek - Bestand": 31283,
40
- "Bibliothek - Besucherzahl": 31359,
41
- "Bibliothek - Budget": 31136,
42
- "Bibliothek - Standort": 31262,
43
- "Bildung": 31179,
44
- "Brunnen": 31269,
45
- "Bürgerbeteiligung - Bürgerentscheid": 31364,
46
- "Bürgerbeteiligung - Bürgerhaushalt": 31175,
47
- "Bürgerbeteiligung - Entwicklung und Information": 31115,
48
- "Bürgerbeteiligung - Umfrage": 31290,
49
- "Bürgerservice": 31236,
50
- "Büro, Industrie und Gewerbefläche": 31258,
51
- "Co-Working": 31208,
52
- "Container": 31370,
53
- "Demografiebericht": 31308,
54
- "Denkmal": 31137,
55
- "Dienstleistung": 31278,
56
- "Dienstleistung - Einzelhandel": 31297,
57
- "Dienstleistung - Handwerk": 31182,
58
- "Dienstleistung - Postfiliale": 31242,
59
- "Dienstleistung - Weihnachtsmarkt": 31325,
60
- "Dienstleistung - Wochenmarkt": 31281,
61
- "Digitalisierung": 31153,
62
- "Einwohnerzahl": 31309,
63
- "Energie": 31251,
64
- "Energiebericht": 31322,
65
- "Entwässerung": 31248,
66
- "Ferienangebot": 31360,
67
- "Feuerwehr - Feuerwehreinsatz": 31257,
68
- "Feuerwehr - Personal": 31140,
69
- "Feuerwehr - Standort": 31376,
70
- "Finanzen": 31289,
71
- "Finanzielle Unterstützung - Förderung": 31118,
72
- "Finanzielle Unterstützung - Grundsicherung": 31141,
73
- "Finanzielle Unterstützung - Wohngeld": 31292,
74
- "Flora und Fauna": 31319,
75
- "Flucht - Asylbewerber": 31366,
76
- "Flucht - Flüchtlingsunterbringung": 31219,
77
- "Flucht - Flüchtlingszahl": 31206,
78
- "Flucht - Integration": 31320,
79
- "Flugverkehr - Flugbewegung": 31152,
80
- "Flugverkehr - Flughafen": 31170,
81
- "Fläche - Ausgleichsfläche": 31187,
82
- "Fläche - Biotopfläche": 31293,
83
- "Fläche - Grünfläche und Grünflächenkataster": 31183,
84
- "Fläche - Hundewiese": 31334,
85
- "Fläche - Jagdbezirk": 31204,
86
- "Fläche - Naturschutzgebiet": 31232,
87
- "Fläche - Waldfläche": 31343,
88
- "Flächennutzung": 31181,
89
- "Freizeit": 31304,
90
- "Friedhof - Grabstätte": 31162,
91
- "Friedhof - Standort": 31108,
92
- "Fußverkehr - Fußgängerzone": 31352,
93
- "Fußverkehr - Gehweg": 31134,
94
- "Fußverkehr - Lauf und Wanderstrecke": 31225,
95
- "Geförderter Wohnbau": 31268,
96
- "Geschichte": 31209,
97
- "Gesetzestext": 31375,
98
- "Gesundheit": 31105,
99
- "Gesundheitsberichtserstattung": 31150,
100
- "Gewerbeanmeldung": 31254,
101
- "Gewässer - Pegelstand": 31164,
102
- "Gewässer - Wasserfläche": 31178,
103
- "Grillplatz": 31168,
104
- "Grundstücksbewertung": 31132,
105
- "Gästezahl": 31158,
106
- "Haushalt - Außerplanmäßige Aufwendung": 31354,
107
- "Haushalt - Controlling": 31298,
108
- "Haushalt - Jahresabschluss": 31363,
109
- "Haushalt - Plan": 31197,
110
- "Haushalt - Produktbereichssumme": 31167,
111
- "Haushalt - Produktplan": 31335,
112
- "Haushalt - Satzung": 31302,
113
- "Haushalt - Sponsoring": 31333,
114
- "Haushalt - Zuwendung und Förderung": 31114,
115
- "Haushaltszusammensetzung": 31149,
116
- "Hebamme": 31324,
117
- "Hitze": 31194,
118
- "Hochschule - Standort": 31277,
119
- "Hochschule - Studentenwohnheim": 31234,
120
- "Hochschule - Studierendenzahl": 31313,
121
- "Hundekottüte": 31139,
122
- "Infektion": 31250,
123
- "Insolvenz": 31342,
124
- "Jugendeinrichtung": 31128,
125
- "Justiz": 31307,
126
- "Justizeinrichtung": 31340,
127
- "KFZ - Autobahn": 31111,
128
- "KFZ - Bußgeld": 31280,
129
- "KFZ - Carsharing": 31244,
130
- "KFZ - Elektrotankstelle": 31323,
131
- "KFZ - Fahrzeugzulassung": 31102,
132
- "KFZ - Messung": 31214,
133
- "KFZ - Parkplatz": 31330,
134
- "KFZ - Tankstelle": 31198,
135
- "KFZ - Taxistand": 31135,
136
- "KFZ - Verkehrsaufkommen": 31368,
137
- "Kindertageseinrichtung - Betreuungsplatz": 31331,
138
- "Kindertageseinrichtung - Standort": 31346,
139
- "Kirche, Kapelle und Kloster": 31166,
140
- "Klima und Umweltschutz": 31161,
141
- "Krankenhaus": 31229,
142
- "Kriminalitätsstatistik": 31217,
143
- "Kultur": 31146,
144
- "Kunstwerk": 31122,
145
- "Lehr und Wanderpfad": 31321,
146
- "Liegenschaft - Grundstück und Gebäude": 31123,
147
- "Liegenschaft - Liegenschaftenkataster": 31270,
148
- "Liegenschaft - Satzung": 31285,
149
- "Messung": 31241,
150
- "Migrationshintergrund": 31226,
151
- "Museum - Besucherzahl": 31110,
152
- "Museum - Standort": 31265,
153
- "Musikschule - Teilnehmerzahl": 31288,
154
- "Musikschule - Unterrichtsangebot": 31190,
155
- "Müllabfuhr": 31358,
156
- "Müllgebühr": 31373,
157
- "Open Data - Planung": 31174,
158
- "Open Data - Zugriffszahl": 31231,
159
- "Ordnungsamt": 31300,
160
- "Orthofoto": 31188,
161
- "Pflege": 31350,
162
- "Politische Partizipation": 31131,
163
- "Politische Vertretung - Bürgermeister": 31316,
164
- "Politische Vertretung - Gremium": 31367,
165
- "Politische Vertretung - Mandatsträger": 31239,
166
- "Polizei": 31213,
167
- "Pressemitteilung und Veröffentlichung": 31205,
168
- "Quelle - Archivbestand": 31160,
169
- "Quelle - Entschädigung": 31192,
170
- "Quelle - Historische Karte": 31294,
171
- "Quelle - Historische Luftaufnahme": 31361,
172
- "Quelle - Personalverzeichnis": 31126,
173
- "Radioaktivitätsmessung": 31371,
174
- "Radverkehr - Abstellplatz": 31221,
175
- "Radverkehr - Ladestation": 31104,
176
- "Radverkehr - Messung": 31148,
177
- "Radverkehr - Radweg und Radroute": 31142,
178
- "Radverkehr - Verkehrsteilnehmer": 31223,
179
- "Radverkehr - Verleih": 31172,
180
- "Raumgliederung - Adresse": 31303,
181
- "Raumgliederung - Block": 31201,
182
- "Raumgliederung - Hausnummer": 31203,
183
- "Raumgliederung - Ortsteil": 31314,
184
- "Raumgliederung - Postleitzahlengebiet": 31211,
185
- "Raumgliederung - Stadtgebiet": 31169,
186
- "Raumgliederung - Straße": 31301,
187
- "Raumordnung, Raumplanung und Raumentwicklung": 31312,
188
- "Religionszugehörigkeit": 31224,
189
- "Rettungsdienst - Defibrillator": 31176,
190
- "Rettungsdienst - Rettungsdiensteinsatz": 31345,
191
- "Rettungshilfe - Anlaufstelle": 31329,
192
- "Rettungshilfe - Notfallnummer": 31240,
193
- "Rettungshilfe - Notinsel": 31144,
194
- "Rettungshilfe - Waldrettungspunkt": 31199,
195
- "Schiff und Fährverkehr - Anlegestelle": 31233,
196
- "Schiff und Fährverkehr - Fracht": 31147,
197
- "Schiff und Fährverkehr - Passagier": 31344,
198
- "Schule - Internetanbindung": 31207,
199
- "Schule - Schulangebot": 31193,
200
- "Schule - Schuleingangsuntersuchung": 31222,
201
- "Schule - Schulentwicklungsplan": 31339,
202
- "Schule - Schülerzahl": 31266,
203
- "Schule - Standort": 31260,
204
- "Schule - Wunschschule": 31145,
205
- "Sehenswürdigkeit": 31295,
206
- "Sicherheit": 31275,
207
- "Sitzgelegenheit": 31305,
208
- "Solar": 31109,
209
- "Sondernutzung": 31195,
210
- "Sonstiges": 31276,
211
- "Soziale Hilfe": 31369,
212
- "Sozialraum": 31157,
213
- "Spielplatz und Spielstätte ": 31349,
214
- "Staatsangehörigkeit": 31256,
215
- "Stadtführung": 31185,
216
- "Stadtmarketing": 31177,
217
- "Stadtplan": 31212,
218
- "Standort mit Geschichte": 31184,
219
- "Stellenausschreibung": 31365,
220
- "Stellenplan": 31159,
221
- "Steuern und Abgaben": 31210,
222
- "Straßenreinigung": 31306,
223
- "Stromversorgung": 31284,
224
- "Städtisches Personal": 31130,
225
- "Telefonverzeichnis": 31216,
226
- "Termin": 31263,
227
- "Theater - Besucherzahl": 31191,
228
- "Theater - Programm": 31259,
229
- "Tiefbau": 31120,
230
- "Tourismus": 31255,
231
- "Umweltzone": 31347,
232
- "Unfall": 31353,
233
- "Unterkunft - Campingplatz": 31341,
234
- "Unterkunft - Herberge": 31247,
235
- "Unterkunft - Hotel": 31237,
236
- "Unterkunft - Privatunterkunft": 31311,
237
- "Urban Gardening": 31125,
238
- "Veranstaltung - Angebot": 31119,
239
- "Veranstaltung - Besucherzahl": 31348,
240
- "Verband": 31267,
241
- "Verein": 31117,
242
- "Verkehr": 31215,
243
- "Volkshochschule - Teilnehmerzahl": 31351,
244
- "Volkshochschule - Veranstaltung": 31116,
245
- "Vorname": 31328,
246
- "WLAN und Mobilfunk": 31127,
247
- "Wahl - Beiratswahl": 31296,
248
- "Wahl - Bundestagswahl": 31220,
249
- "Wahl - Europawahl": 31372,
250
- "Wahl - Kandidatenliste": 31356,
251
- "Wahl - Kommunalwahl": 31243,
252
- "Wahl - Landtagswahl": 31279,
253
- "Wahl - Straßenverzeichnis": 31318,
254
- "Wahl - Verbundwahl": 31154,
255
- "Wahl - Wahlkreis und Wahlbezirk": 31171,
256
- "Wahl - Wahllokal": 31271,
257
- "Wartezeit": 31156,
258
- "Wasserversorgung": 31327,
259
- "Webseite": 31238,
260
- "Wetter": 31113,
261
- "Windenergie": 31253,
262
- "Wirtschaft": 31291,
263
- "Wirtschaftsförderung": 31180,
264
- "Wirtschaftsstandort": 31186,
265
- "Wohnungsbestand": 31106,
266
- "Wärmeversorgung": 31151,
267
- "Zivil und Katastrophenschutz - Kampfmittelfund": 31272,
268
- "Zivil und Katastrophenschutz - Sirene": 31261,
269
- "corona": 31165,
270
- "ÖPNV - Aufzug und Rolltreppe": 31326,
271
- "ÖPNV - Fahrgastzahl": 31249,
272
- "ÖPNV - Liniennetz": 31163,
273
- "ÖPNV - Sollfahrdaten": 31315,
274
- "ÖPNV - Vertriebsstelle": 31235,
275
- "Öffentliche Toilette": 31189,
276
- "Öffentlichkeitsarbeit": 31362
277
- }
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
config.json DELETED
@@ -1,25 +0,0 @@
1
- {
2
- "_name_or_path": "/Users/rahkakaveebaskaran/.cache/huggingface/hub/models--and-effect--musterdatenkatalog_clf/snapshots/a19c9e8bb2f826a510b99c76ef88f0844e30e98d/",
3
- "architectures": [
4
- "BertModel"
5
- ],
6
- "attention_probs_dropout_prob": 0.1,
7
- "classifier_dropout": null,
8
- "hidden_act": "gelu",
9
- "hidden_dropout_prob": 0.1,
10
- "hidden_size": 768,
11
- "initializer_range": 0.02,
12
- "intermediate_size": 3072,
13
- "layer_norm_eps": 1e-12,
14
- "max_position_embeddings": 512,
15
- "model_type": "bert",
16
- "num_attention_heads": 12,
17
- "num_hidden_layers": 12,
18
- "pad_token_id": 0,
19
- "position_embedding_type": "absolute",
20
- "torch_dtype": "float32",
21
- "transformers_version": "4.25.1",
22
- "type_vocab_size": 2,
23
- "use_cache": true,
24
- "vocab_size": 30000
25
- }
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
config_sentence_transformers.json DELETED
@@ -1,7 +0,0 @@
1
- {
2
- "__version__": {
3
- "sentence_transformers": "2.2.2",
4
- "transformers": "4.25.1",
5
- "pytorch": "1.13.1"
6
- }
7
- }
 
 
 
 
 
 
 
 
modules.json DELETED
@@ -1,14 +0,0 @@
1
- [
2
- {
3
- "idx": 0,
4
- "name": "0",
5
- "path": "",
6
- "type": "sentence_transformers.models.Transformer"
7
- },
8
- {
9
- "idx": 1,
10
- "name": "1",
11
- "path": "1_Pooling",
12
- "type": "sentence_transformers.models.Pooling"
13
- }
14
- ]
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
pytorch_model.bin DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:a770dca55b32474ad3d9a25a060ff82d1cc784593dd0592a017f299626890fa6
3
- size 436393773
 
 
 
 
sentence_bert_config.json DELETED
@@ -1,4 +0,0 @@
1
- {
2
- "max_seq_length": 512,
3
- "do_lower_case": false
4
- }
 
 
 
 
 
special_tokens_map.json DELETED
@@ -1,7 +0,0 @@
1
- {
2
- "cls_token": "[CLS]",
3
- "mask_token": "[MASK]",
4
- "pad_token": "[PAD]",
5
- "sep_token": "[SEP]",
6
- "unk_token": "[UNK]"
7
- }
 
 
 
 
 
 
 
 
tokenizer.json DELETED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json DELETED
@@ -1,14 +0,0 @@
1
- {
2
- "cls_token": "[CLS]",
3
- "do_lower_case": false,
4
- "mask_token": "[MASK]",
5
- "model_max_length": 1000000000000000019884624838656,
6
- "name_or_path": "/Users/rahkakaveebaskaran/.cache/huggingface/hub/models--and-effect--musterdatenkatalog_clf/snapshots/a19c9e8bb2f826a510b99c76ef88f0844e30e98d/",
7
- "pad_token": "[PAD]",
8
- "sep_token": "[SEP]",
9
- "special_tokens_map_file": null,
10
- "strip_accents": null,
11
- "tokenize_chinese_chars": true,
12
- "tokenizer_class": "BertTokenizer",
13
- "unk_token": "[UNK]"
14
- }
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
vocab.txt DELETED
The diff for this file is too large to render. See raw diff