Commit ·
152ce6d
1
Parent(s): 5621479
Update README.md
Browse files
README.md
CHANGED
|
@@ -38,9 +38,10 @@ embeddings = encode([
|
|
| 38 |
"4 декабря 2000 года",
|
| 39 |
"Давно такого не читала, очень хорошо пишешь!",
|
| 40 |
"Я тогда не понимала, что происходит, не понимаю и сейчас.",
|
|
|
|
| 41 |
])
|
| 42 |
print(embeddings.shape)
|
| 43 |
-
# torch.Size([
|
| 44 |
|
| 45 |
# now try to recover the texts from the vectors
|
| 46 |
out = decoder.generate(
|
|
@@ -50,7 +51,8 @@ out = decoder.generate(
|
|
| 50 |
)
|
| 51 |
for tokens in out:
|
| 52 |
print(dec_tokenizer.decode(tokens, skip_special_tokens=True))
|
| 53 |
-
# После
|
| 54 |
-
# Не так
|
| 55 |
-
# Я не
|
|
|
|
| 56 |
```
|
|
|
|
| 38 |
"4 декабря 2000 года",
|
| 39 |
"Давно такого не читала, очень хорошо пишешь!",
|
| 40 |
"Я тогда не понимала, что происходит, не понимаю и сейчас.",
|
| 41 |
+
"London is the capital of Great Britain.",
|
| 42 |
])
|
| 43 |
print(embeddings.shape)
|
| 44 |
+
# torch.Size([4, 768])
|
| 45 |
|
| 46 |
# now try to recover the texts from the vectors
|
| 47 |
out = decoder.generate(
|
|
|
|
| 51 |
)
|
| 52 |
for tokens in out:
|
| 53 |
print(dec_tokenizer.decode(tokens, skip_special_tokens=True))
|
| 54 |
+
# После 4 декабря 2000 года
|
| 55 |
+
# Не так давно, это многое читала!
|
| 56 |
+
# Я не понимала того, что происходит сейчас тогда, дальше.
|
| 57 |
+
# Британская столица Англии.
|
| 58 |
```
|