Sentence Similarity
sentence-transformers
Safetensors
bert
feature-extraction
Generated from Trainer
dataset_size:935
loss:MultipleNegativesRankingLoss
text-embeddings-inference
Instructions to use YarKo69/e5-base-retrievers with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use YarKo69/e5-base-retrievers with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("YarKo69/e5-base-retrievers") sentences = [ "query: A.1.2. Матрица Фишера\nОптимизация при помощи натурального градиента предлагает использовать другую метрику, которая учтёт\nструктуру нашего функционала:\n\n\n\nf(φ) ≈f(φ0) + ⟨∇φf(φ)|φ=φ0\n,φ −φ0⟩→ min\nφ\nKL(q(x|φ0) ∥q(x|φ)) ≤α\nКак решать такую задачу условной оптимизации? Еслиφ≈φ0, достаточно аппроксимировать дивергенцию\nKL(q(x|φ0) ∥q(x|φ)) при помощи разложения в ряд Тейлора до второго члена. До второго /emdash.cyr потому что\nпервое ноль.\nУтверждение 93:\n∇φKL(q(x|φ0) ∥q(x|φ))|φ=φ0\n= 0\nДоказательство. KL-дивергенция в точкеφ= φ0 равна 0 как дивергенция между одинаковыми распре-\nделениями, следовательно как функция отφона достигает в этой точке глобального минимума⇒градиент\nравен нулю. ■\nОпределение 128: Для распределенияq(x|φ) матрицей Фишера(Fisher matrix) называется\nFq(φ) := −Eq(x|φ)∇2\nφlog q(x|φ)\nТеорема 93: Матрица Фишера есть гессианKL-дивергенции:\n∇2\nφKL(q(x|φ0) ∥q(x|φ))\n⏐⏐⏐\nφ=φ0\n= Fq(φ0)\nДоказательство.\n∇2\nφKL(q(x|φ0) ∥q(x|φ))\n⏐⏐⏐\nφ=φ0\n= ∇2\nφ\n[\nconst(φ) −Eq(x|φ0) log q(x|φ)\n]⏐⏐⏐", "passage: ства оптимальных стратегий. Для доказательства нам понадобится факт, который мы технически докажем в\nрамках повествования чуть позже: для данного MDPQ∗/emdash.cyr единственная функцияS×A→ R, удовлетворя-\nющая уравнениям оптимальности Беллмана.\nТеорема 15 /emdash.cyr Критерий оптимальности Беллмана: πоптимальна тогда и только тогда, когда∀s,a: π(a|s) >0\nверно:\na∈Argmax\na\nQπ(s,a)\nНеобходимость. Пустьπ/emdash.cyr оптимальна. Тогда её оценочные функции совпадают сV∗,Q∗, для которых\nвыполнено уравнение (3.15):\nVπ(s) = V∗(s) = max\na\nQ∗(s,a) = max\na\nQπ(s,a)\nС другой стороны из связи VQ (3.6) верноVπ(s) = Eπ(a|s)Qπ(s,a); получаем\nEπ(a|s)Qπ(s,a) = max\na\nQπ(s,a),\nиз чего вытекает доказываемое. ■\nДостаточность. Пусть условие выполнено. Тогда для любой парыs,a:\nQπ(s,a) = {связь QQ (3.7)}= r(s,a) + γEs′Eπ(a′|s′)Qπ(s′,a′) = r(s,a) + γEs′max\na′\nQπ(s′,a′)\nИз единственности решения этого уравнения следуетQπ(s,a) = Q∗(s,a), и, следовательно,π оптимальна.\n■", "passage: A.1.2. Матрица Фишера\nОптимизация при помощи натурального градиента предлагает использовать другую метрику, которая учтёт\nструктуру нашего функционала:\n\n\n\nf(φ) ≈f(φ0) + ⟨∇φf(φ)|φ=φ0\n,φ −φ0⟩→ min\nφ\nKL(q(x|φ0) ∥q(x|φ)) ≤α\nКак решать такую задачу условной оптимизации? Еслиφ≈φ0, достаточно аппроксимировать дивергенцию\nKL(q(x|φ0) ∥q(x|φ)) при помощи разложения в ряд Тейлора до второго члена. До второго /emdash.cyr потому что\nпервое ноль.\nУтверждение 93:\n∇φKL(q(x|φ0) ∥q(x|φ))|φ=φ0\n= 0\nДоказательство. KL-дивергенция в точкеφ= φ0 равна 0 как дивергенция между одинаковыми распре-\nделениями, следовательно как функция отφона достигает в этой точке глобального минимума⇒градиент\nравен нулю. ■\nОпределение 128: Для распределенияq(x|φ) матрицей Фишера(Fisher matrix) называется\nFq(φ) := −Eq(x|φ)∇2\nφlog q(x|φ)\nТеорема 93: Матрица Фишера есть гессианKL-дивергенции:\n∇2\nφKL(q(x|φ0) ∥q(x|φ))\n⏐⏐⏐\nφ=φ0\n= Fq(φ0)\nДоказательство.\n∇2\nφKL(q(x|φ0) ∥q(x|φ))\n⏐⏐⏐\nφ=φ0\n= ∇2\nφ\n[\nconst(φ) −Eq(x|φ0) log q(x|φ)\n]⏐⏐⏐", "passage: 4.3.5 Distributional Value Iteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108\n4.3.6 Категориальная аппроксимация Z-функций . . . . . . . . . . . . . . . . . . . . . . . . . . 110\n4.3.7 Categorical DQN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111\n4.3.8 Квантильная аппроксимация Z-функций . . . . . . . . . . . . . . . . . . . . . . . . . . . 114\n4.3.9 Quantile Regression DQN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115\n4.3.10 Implicit Quantile Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117\n4.3.11 Rainbow DQN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118\n5 Policy Gradient подход 120\n5.1 Policy Gradient Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120\n5.1.1 Вывод первым способом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120" ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
Ctrl+K