Buckets:
| import{s as hl,o as Ul,n as Gt}from"../chunks/scheduler.36a0863c.js";import{S as gl,i as jl,g as p,s,r as M,A as _l,h as c,f as l,c as i,j as zt,u as f,x as h,k as Jl,y as Nt,a,v as w,d as y,t as J,w as T}from"../chunks/index.f891bdb2.js";import{C as g}from"../chunks/CodeBlock.3ec784ea.js";import{F as Tl,M as Lt}from"../chunks/Markdown.7b58822e.js";import{H as _,E as bl}from"../chunks/EditOnGithub.a58e27a9.js";function $l(j){let n,d='El script de ejemplo descarga y preprocesa un conjunto de datos de la biblioteca 馃 <a href="https://huggingface.co/docs/datasets/" rel="nofollow">Datasets</a>. Luego, el script ajusta un conjunto de datos con <a href="https://huggingface.co/docs/transformers/main_classes/trainer" rel="nofollow">Trainer</a> en una arquitectura que soporta la tarea de resumen. El siguiente ejemplo muestra c贸mo ajustar un <a href="https://huggingface.co/google-t5/t5-small" rel="nofollow">T5-small</a> en el conjunto de datos <a href="https://huggingface.co/datasets/cnn_dailymail" rel="nofollow">CNN/DailyMail</a>. El modelo T5 requiere un argumento adicional <code>source_prefix</code> debido a c贸mo fue entrenado. Este aviso le permite a T5 saber que se trata de una tarea de resumir.',r,m,u;return m=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfbmFtZSUyMGNubl9kYWlseW1haWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfY29uZmlnJTIwJTIyMy4wLjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXNvdXJjZV9wcmVmaXglMjAlMjJzdW1tYXJpemUlM0ElMjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW91dHB1dF9kaXIlMjAlMkZ0bXAlMkZ0c3Qtc3VtbWFyaXphdGlvbiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV90cmFpbl9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV9ldmFsX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdmVyd3JpdGVfb3V0cHV0X2RpciUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcHJlZGljdF93aXRoX2dlbmVyYXRl",highlighted:`python examples/pytorch/summarization/run_summarization.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),{c(){n=p("p"),n.innerHTML=d,r=s(),M(m.$$.fragment)},l(o){n=c(o,"P",{"data-svelte-h":!0}),h(n)!=="svelte-ig5tl8"&&(n.innerHTML=d),r=i(o),f(m.$$.fragment,o)},m(o,U){a(o,n,U),a(o,r,U),w(m,o,U),u=!0},p:Gt,i(o){u||(y(m.$$.fragment,o),u=!0)},o(o){J(m.$$.fragment,o),u=!1},d(o){o&&(l(n),l(r)),T(m,o)}}}function Cl(j){let n,d;return n=new Lt({props:{$$slots:{default:[$l]},$$scope:{ctx:j}}}),{c(){M(n.$$.fragment)},l(r){f(n.$$.fragment,r)},m(r,m){w(n,r,m),d=!0},p(r,m){const u={};m&2&&(u.$$scope={dirty:m,ctx:r}),n.$set(u)},i(r){d||(y(n.$$.fragment,r),d=!0)},o(r){J(n.$$.fragment,r),d=!1},d(r){T(n,r)}}}function Xl(j){let n,d='El script de ejemplo descarga y preprocesa un conjunto de datos de la biblioteca 馃 <a href="https://huggingface.co/docs/datasets/" rel="nofollow">Datasets</a>. Luego, el script ajusta un conjunto de datos utilizando Keras en una arquitectura que soporta la tarea de resumir. El siguiente ejemplo muestra c贸mo ajustar un <a href="https://huggingface.co/google-t5/t5-small" rel="nofollow">T5-small</a> en el conjunto de datos <a href="https://huggingface.co/datasets/cnn_dailymail" rel="nofollow">CNN/DailyMail</a>. El modelo T5 requiere un argumento adicional <code>source_prefix</code> debido a c贸mo fue entrenado. Este aviso le permite a T5 saber que se trata de una tarea de resumir.',r,m,u;return m=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZ0ZW5zb3JmbG93JTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9uYW1lJTIwY25uX2RhaWx5bWFpbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9jb25maWclMjAlMjIzLjAuMCUyMiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tb3V0cHV0X2RpciUyMCUyRnRtcCUyRnRzdC1zdW1tYXJpemF0aW9uJTIwJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX3RyYWluX2JhdGNoX3NpemUlMjA4JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX2V2YWxfYmF0Y2hfc2l6ZSUyMDE2JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1udW1fdHJhaW5fZXBvY2hzJTIwMyUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWw=",highlighted:`python examples/tensorflow/summarization/run_summarization.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size 8 \\ | |
| --per_device_eval_batch_size 16 \\ | |
| --num_train_epochs 3 \\ | |
| --do_train \\ | |
| --do_eval`,wrap:!1}}),{c(){n=p("p"),n.innerHTML=d,r=s(),M(m.$$.fragment)},l(o){n=c(o,"P",{"data-svelte-h":!0}),h(n)!=="svelte-njgvsa"&&(n.innerHTML=d),r=i(o),f(m.$$.fragment,o)},m(o,U){a(o,n,U),a(o,r,U),w(m,o,U),u=!0},p:Gt,i(o){u||(y(m.$$.fragment,o),u=!0)},o(o){J(m.$$.fragment,o),u=!1},d(o){o&&(l(n),l(r)),T(m,o)}}}function vl(j){let n,d;return n=new Lt({props:{$$slots:{default:[Xl]},$$scope:{ctx:j}}}),{c(){M(n.$$.fragment)},l(r){f(n.$$.fragment,r)},m(r,m){w(n,r,m),d=!0},p(r,m){const u={};m&2&&(u.$$scope={dirty:m,ctx:r}),n.$set(u)},i(r){d||(y(n.$$.fragment,r),d=!0)},o(r){J(n.$$.fragment,r),d=!1},d(r){T(n,r)}}}function Al(j){let n,d='Las Unidades de Procesamiento de Tensor (TPUs) est谩n dise帽adas espec铆ficamente para acelerar el rendimiento. PyTorch admite TPU con el compilador de aprendizaje profundo <a href="https://www.tensorflow.org/xla" rel="nofollow">XLA</a> (consulta <a href="https://github.com/pytorch/xla/blob/master/README.md" rel="nofollow">aqu铆</a> para obtener m谩s detalles). Para usar una TPU, inicia el script <code>xla_spawn.py</code> y usa el argumento <code>num_cores</code> para establecer la cantidad de n煤cleos de TPU que deseas usar.',r,m,u;return m=new g({props:{code:"cHl0aG9uJTIweGxhX3NwYXduLnB5JTIwLS1udW1fY29yZXMlMjA4JTIwJTVDJTBBJTIwJTIwJTIwJTIwc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfbmFtZSUyMGNubl9kYWlseW1haWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfY29uZmlnJTIwJTIyMy4wLjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXNvdXJjZV9wcmVmaXglMjAlMjJzdW1tYXJpemUlM0ElMjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW91dHB1dF9kaXIlMjAlMkZ0bXAlMkZ0c3Qtc3VtbWFyaXphdGlvbiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV90cmFpbl9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV9ldmFsX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdmVyd3JpdGVfb3V0cHV0X2RpciUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcHJlZGljdF93aXRoX2dlbmVyYXRl",highlighted:`python xla_spawn.py --num_cores 8 \\ | |
| summarization/run_summarization.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),{c(){n=p("p"),n.innerHTML=d,r=s(),M(m.$$.fragment)},l(o){n=c(o,"P",{"data-svelte-h":!0}),h(n)!=="svelte-1xabxpp"&&(n.innerHTML=d),r=i(o),f(m.$$.fragment,o)},m(o,U){a(o,n,U),a(o,r,U),w(m,o,U),u=!0},p:Gt,i(o){u||(y(m.$$.fragment,o),u=!0)},o(o){J(m.$$.fragment,o),u=!1},d(o){o&&(l(n),l(r)),T(m,o)}}}function Il(j){let n,d;return n=new Lt({props:{$$slots:{default:[Al]},$$scope:{ctx:j}}}),{c(){M(n.$$.fragment)},l(r){f(n.$$.fragment,r)},m(r,m){w(n,r,m),d=!0},p(r,m){const u={};m&2&&(u.$$scope={dirty:m,ctx:r}),n.$set(u)},i(r){d||(y(n.$$.fragment,r),d=!0)},o(r){J(n.$$.fragment,r),d=!1},d(r){T(n,r)}}}function Wl(j){let n,d='Las Unidades de Procesamiento de Tensor (TPUs) est谩n dise帽adas espec铆ficamente para acelerar el rendimiento. TensorFlow utiliza <a href="https://www.tensorflow.org/guide/distributed_training#tpustrategy" rel="nofollow"><code>TPUStrategy</code></a> para entrenar en TPUs. Para usar una TPU, pasa el nombre del recurso de la TPU al argumento <code>tpu</code>',r,m,u;return m=new g({props:{code:"cHl0aG9uJTIwcnVuX3N1bW1hcml6YXRpb24ucHklMjAlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXRwdSUyMG5hbWVfb2ZfdHB1X3Jlc291cmNlJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9uYW1lJTIwY25uX2RhaWx5bWFpbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9jb25maWclMjAlMjIzLjAuMCUyMiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tb3V0cHV0X2RpciUyMCUyRnRtcCUyRnRzdC1zdW1tYXJpemF0aW9uJTIwJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX3RyYWluX2JhdGNoX3NpemUlMjA4JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX2V2YWxfYmF0Y2hfc2l6ZSUyMDE2JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1udW1fdHJhaW5fZXBvY2hzJTIwMyUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWw=",highlighted:`python run_summarization.py \\ | |
| --tpu name_of_tpu_resource \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size 8 \\ | |
| --per_device_eval_batch_size 16 \\ | |
| --num_train_epochs 3 \\ | |
| --do_train \\ | |
| --do_eval`,wrap:!1}}),{c(){n=p("p"),n.innerHTML=d,r=s(),M(m.$$.fragment)},l(o){n=c(o,"P",{"data-svelte-h":!0}),h(n)!=="svelte-na5wyx"&&(n.innerHTML=d),r=i(o),f(m.$$.fragment,o)},m(o,U){a(o,n,U),a(o,r,U),w(m,o,U),u=!0},p:Gt,i(o){u||(y(m.$$.fragment,o),u=!0)},o(o){J(m.$$.fragment,o),u=!1},d(o){o&&(l(n),l(r)),T(m,o)}}}function Zl(j){let n,d;return n=new Lt({props:{$$slots:{default:[Wl]},$$scope:{ctx:j}}}),{c(){M(n.$$.fragment)},l(r){f(n.$$.fragment,r)},m(r,m){w(n,r,m),d=!0},p(r,m){const u={};m&2&&(u.$$scope={dirty:m,ctx:r}),n.$set(u)},i(r){d||(y(n.$$.fragment,r),d=!0)},o(r){J(n.$$.fragment,r),d=!1},d(r){T(n,r)}}}function xl(j){let n,d,r,m,u,o,U,Vt='Junto con los <a href="./notebooks">notebooks</a> de 馃 Transformers, tambi茅n hay scripts con ejemplos que muestran c贸mo entrenar un modelo para una tarea en <a href="https://github.com/huggingface/transformers/tree/main/examples/pytorch" rel="nofollow">PyTorch</a>, <a href="https://github.com/huggingface/transformers/tree/main/examples/tensorflow" rel="nofollow">TensorFlow</a>, o <a href="https://github.com/huggingface/transformers/tree/main/examples/flax" rel="nofollow">JAX/Flax</a>.',Ie,X,Bt='Tambi茅n encontrar谩s scripts que hemos usado en nuestros <a href="https://github.com/huggingface/transformers/tree/main/examples/research_projects" rel="nofollow">proyectos de investigaci贸n</a> y <a href="https://github.com/huggingface/transformers/tree/main/examples/legacy" rel="nofollow">ejemplos pasados</a> que en su mayor铆a son aportados por la comunidad. Estos scripts no se mantienen activamente y requieren una versi贸n espec铆fica de 馃 Transformers que probablemente sea incompatible con la 煤ltima versi贸n de la biblioteca.',We,v,Ft="No se espera que los scripts de ejemplo funcionen de inmediato en todos los problemas, y es posible que debas adaptar el script al problema que est谩s tratando de resolver. Para ayudarte con esto, la mayor铆a de los scripts exponen completamente c贸mo se preprocesan los datos, lo que te permite editarlos seg煤n sea necesario para tu caso de uso.",Ze,A,Yt='Para cualquier caracter铆stica que te gustar铆a implementar en un script de ejemplo, por favor disc煤telo en el <a href="https://discuss.huggingface.co/" rel="nofollow">foro</a> o con un <a href="https://github.com/huggingface/transformers/issues" rel="nofollow">issue</a> antes de enviar un Pull Request. Si bien agradecemos las correcciones de errores, es poco probable que fusionemos un Pull Request que agregue m谩s funcionalidad a costa de la legibilidad.',xe,I,Et='Esta gu铆a te mostrar谩 c贸mo ejecutar un ejemplo de un script de entrenamiento para resumir texto en <a href="https://github.com/huggingface/transformers/tree/main/examples/pytorch/summarization" rel="nofollow">PyTorch</a> y <a href="https://github.com/huggingface/transformers/tree/main/examples/tensorflow/summarization" rel="nofollow">TensorFlow</a>. Se espera que todos los ejemplos funcionen con ambos frameworks a menos que se especifique lo contrario.',Ge,W,Le,Z,St="Para ejecutar con 茅xito la 煤ltima versi贸n de los scripts de ejemplo debes <strong>instalar 馃 Transformers desde su fuente</strong> en un nuevo entorno virtual:",Re,x,ze,G,Ht="Para versiones anteriores de los scripts de ejemplo, haz clic en alguno de los siguientes links:",Ne,L,kt='<summary>Ejemplos de versiones anteriores de 馃 Transformers</summary> <ul><li><a href="https://github.com/huggingface/transformers/tree/v4.5.1/examples">v4.5.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v4.4.2/examples">v4.4.2</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v4.3.3/examples">v4.3.3</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v4.2.2/examples">v4.2.2</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v4.1.1/examples">v4.1.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v4.0.1/examples">v4.0.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.5.1/examples">v3.5.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.4.0/examples">v3.4.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.3.1/examples">v3.3.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.2.0/examples">v3.2.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.1.0/examples">v3.1.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v3.0.2/examples">v3.0.2</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.11.0/examples">v2.11.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.10.0/examples">v2.10.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.9.1/examples">v2.9.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.8.0/examples">v2.8.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.7.0/examples">v2.7.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.6.0/examples">v2.6.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.5.1/examples">v2.5.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.4.0/examples">v2.4.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.3.0/examples">v2.3.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.2.0/examples">v2.2.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.1.0/examples">v2.1.1</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v2.0.0/examples">v2.0.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v1.2.0/examples">v1.2.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v1.1.0/examples">v1.1.0</a></li> <li><a href="https://github.com/huggingface/transformers/tree/v1.0.0/examples">v1.0.0</a></li></ul>',Ve,R,Qt="Luego cambia tu clon actual de 馃 Transformers a una versi贸n espec铆fica, por ejemplo v3.5.1:",Be,z,Fe,N,qt="Una vez que hayas configurado la versi贸n correcta de la biblioteca, ve a la carpeta de ejemplo de tu elecci贸n e instala los requisitos espec铆ficos del ejemplo:",Ye,V,Ee,B,Se,b,He,F,ke,Y,Pt='<a href="https://huggingface.co/docs/transformers/main_classes/trainer" rel="nofollow">Trainer</a> admite un entrenamiento distribuido y de precisi贸n mixta, lo que significa que tambi茅n puedes usarlo en un script. Para habilitar ambas caracter铆sticas:',Qe,E,Dt="<li>Agrega el argumento <code>fp16</code> para habilitar la precisi贸n mixta.</li> <li>Establece la cantidad de GPU que se usar谩 con el argumento <code>nproc_per_node</code>.</li>",qe,S,Pe,H,Ot='Los scripts de TensorFlow utilizan <a href="https://www.tensorflow.org/guide/distributed_training#mirroredstrategy" rel="nofollow"><code>MirroredStrategy</code></a> para el entrenamiento distribuido, y no es necesario agregar argumentos adicionales al script de entrenamiento. El script de TensorFlow utilizar谩 m煤ltiples GPUs de forma predeterminada si est谩n disponibles.',De,k,Oe,$,Ke,Q,et,q,Kt='馃 <a href="https://huggingface.co/docs/accelerate" rel="nofollow">Accelerate</a> es una biblioteca exclusiva de PyTorch que ofrece un m茅todo unificado para entrenar un modelo en varios tipos de configuraciones (solo CPU, GPU m煤ltiples, TPU) mientras mantiene una visibilidad completa en el ciclo de entrenamiento de PyTorch. Aseg煤rate de tener 馃 Accelerate instalado si a煤n no lo tienes:',tt,C,ve,el="Nota: Como Accelerate se est谩 desarrollando r谩pidamente, debes instalar la versi贸n git de Accelerate para ejecutar los scripts",Rt,P,lt,D,tl="En lugar del script <code>run_summarization.py</code>, debes usar el script <code>run_summarization_no_trainer.py</code>. Los scripts compatibles con 馃 Accelerate tendr谩n un archivo <code>task_no_trainer.py</code> en la carpeta. Comienza ejecutando el siguiente comando para crear y guardar un archivo de configuraci贸n:",at,O,nt,K,ll="Prueba tu configuraci贸n para asegurarte que est谩 configurada correctamente:",rt,ee,st,te,al="Todo listo para iniciar el entrenamiento:",it,le,ot,ae,mt,ne,nl="El script de la tarea resumir admite conjuntos de datos personalizados siempre que sean un archivo CSV o JSON Line. Cuando uses tu propio conjunto de datos, necesitas especificar varios argumentos adicionales:",ut,re,rl="<li><code>train_file</code> y <code>validation_file</code> especifican la ruta a tus archivos de entrenamiento y validaci贸n.</li> <li><code>text_column</code> es el texto de entrada para resumir.</li> <li><code>summary_column</code> es el texto de destino para la salida.</li>",pt,se,sl="Un script para resumir que utiliza un conjunto de datos personalizado se vera as铆:",ct,ie,dt,oe,Mt,me,il="A veces, es una buena idea ejecutar tu secuencia de comandos en una cantidad menor de ejemplos para asegurarte de que todo funciona como se espera antes de comprometerte con un conjunto de datos completo, lo que puede demorar horas en completarse. Utiliza los siguientes argumentos para truncar el conjunto de datos a un n煤mero m谩ximo de muestras:",ft,ue,ol="<li><code>max_train_samples</code></li> <li><code>max_eval_samples</code></li> <li><code>max_predict_samples</code></li>",wt,pe,yt,ce,ml="No todos los scripts de ejemplo admiten el argumento <code>max_predict_samples</code>. Puede que desconozcas si la secuencia de comandos admite este argumento, agrega <code>-h</code> para verificar:",Jt,de,Tt,Me,ht,fe,ul="Otra opci贸n 煤til para habilitar es reanudar el entrenamiento desde un punto de control anterior. Esto asegurar谩 que puedas continuar donde lo dejaste sin comenzar de nuevo si tu entrenamiento se interrumpe. Hay dos m茅todos para reanudar el entrenamiento desde un punto de control.",Ut,we,pl="El primer m茅todo utiliza el argumento <code>output_dir previous_output_dir</code> para reanudar el entrenamiento desde el 煤ltimo punto de control almacenado en <code>output_dir</code>. En este caso, debes eliminar <code>overwrite_output_dir</code>:",gt,ye,jt,Je,cl="El segundo m茅todo utiliza el argumento <code>resume_from_checkpoint path_to_specific_checkpoint</code> para reanudar el entrenamiento desde una carpeta de punto de control espec铆fica.",_t,Te,bt,he,$t,Ue,dl='Todos los scripts pueden cargar tu modelo final en el <a href="https://huggingface.co/models" rel="nofollow">Model Hub</a>. Aseg煤rate de haber iniciado sesi贸n en Hugging Face antes de comenzar:',Ct,ge,Xt,je,Ml="Luego agrega el argumento <code>push_to_hub</code> al script. Este argumento crear谩 un repositorio con tu nombre de usuario Hugging Face y el nombre de la carpeta especificado en <code>output_dir</code>.",vt,_e,fl="Para darle a tu repositorio un nombre espec铆fico, usa el argumento <code>push_to_hub_model_id</code> para a帽adirlo. El repositorio se incluir谩 autom谩ticamente en tu namespace.",At,be,wl="El siguiente ejemplo muestra c贸mo cargar un modelo con un nombre de repositorio espec铆fico:",It,$e,Wt,Ce,Zt,Ae,xt;return u=new _({props:{title:"Entrenamiento con scripts",local:"entrenamiento-con-scripts",headingTag:"h1"}}),W=new _({props:{title:"Configuraci贸n",local:"configuraci贸n",headingTag:"h2"}}),x=new g({props:{code:"Z2l0JTIwY2xvbmUlMjBodHRwcyUzQSUyRiUyRmdpdGh1Yi5jb20lMkZodWdnaW5nZmFjZSUyRnRyYW5zZm9ybWVycyUwQWNkJTIwdHJhbnNmb3JtZXJzJTBBcGlwJTIwaW5zdGFsbCUyMC4=",highlighted:`git <span class="hljs-built_in">clone</span> https://github.com/huggingface/transformers | |
| <span class="hljs-built_in">cd</span> transformers | |
| pip install .`,wrap:!1}}),z=new g({props:{code:"Z2l0JTIwY2hlY2tvdXQlMjB0YWdzJTJGdjMuNS4x",highlighted:"git checkout tags/v3.5.1",wrap:!1}}),V=new g({props:{code:"cGlwJTIwaW5zdGFsbCUyMC1yJTIwcmVxdWlyZW1lbnRzLnR4dA==",highlighted:"pip install -r requirements.txt",wrap:!1}}),B=new _({props:{title:"Ejecutar un script",local:"ejecutar-un-script",headingTag:"h2"}}),b=new Tl({props:{pytorch:!0,tensorflow:!0,jax:!1,$$slots:{tensorflow:[vl],pytorch:[Cl]},$$scope:{ctx:j}}}),F=new _({props:{title:"Entrenamiento distribuido y de precisi贸n mixta",local:"entrenamiento-distribuido-y-de-precisi贸n-mixta",headingTag:"h2"}}),S=new g({props:{code:"dG9yY2hydW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLW5wcm9jX3Blcl9ub2RlJTIwOCUyMHB5dG9yY2glMkZzdW1tYXJpemF0aW9uJTJGcnVuX3N1bW1hcml6YXRpb24ucHklMjAlNUMlMEElMjAlMjAlMjAlMjAtLWZwMTYlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW1vZGVsX25hbWVfb3JfcGF0aCUyMGdvb2dsZS10NSUyRnQ1LXNtYWxsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kb190cmFpbiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fZXZhbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9uYW1lJTIwY25uX2RhaWx5bWFpbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZGF0YXNldF9jb25maWclMjAlMjIzLjAuMCUyMiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tc291cmNlX3ByZWZpeCUyMCUyMnN1bW1hcml6ZSUzQSUyMCUyMiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tb3V0cHV0X2RpciUyMCUyRnRtcCUyRnRzdC1zdW1tYXJpemF0aW9uJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX3RyYWluX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX2V2YWxfYmF0Y2hfc2l6ZSUzRDQlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW92ZXJ3cml0ZV9vdXRwdXRfZGlyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wcmVkaWN0X3dpdGhfZ2VuZXJhdGU=",highlighted:`torchrun \\ | |
| --nproc_per_node 8 pytorch/summarization/run_summarization.py \\ | |
| --fp16 \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),k=new _({props:{title:"Ejecutar un script en una TPU",local:"ejecutar-un-script-en-una-tpu",headingTag:"h2"}}),$=new Tl({props:{pytorch:!0,tensorflow:!0,jax:!1,$$slots:{tensorflow:[Zl],pytorch:[Il]},$$scope:{ctx:j}}}),Q=new _({props:{title:"Ejecutar un script con 馃 Accelerate",local:"ejecutar-un-script-con--accelerate",headingTag:"h2"}}),P=new g({props:{code:"cGlwJTIwaW5zdGFsbCUyMGdpdCUyQmh0dHBzJTNBJTJGJTJGZ2l0aHViLmNvbSUyRmh1Z2dpbmdmYWNlJTJGYWNjZWxlcmF0ZQ==",highlighted:"pip install git+https://github.com/huggingface/accelerate",wrap:!1}}),O=new g({props:{code:"YWNjZWxlcmF0ZSUyMGNvbmZpZw==",highlighted:"accelerate config",wrap:!1}}),ee=new g({props:{code:"YWNjZWxlcmF0ZSUyMHRlc3Q=",highlighted:'accelerate <span class="hljs-built_in">test</span>',wrap:!1}}),le=new g({props:{code:"YWNjZWxlcmF0ZSUyMGxhdW5jaCUyMHJ1bl9zdW1tYXJpemF0aW9uX25vX3RyYWluZXIucHklMjAlNUMlMEElMjAlMjAlMjAlMjAtLW1vZGVsX25hbWVfb3JfcGF0aCUyMGdvb2dsZS10NSUyRnQ1LXNtYWxsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kYXRhc2V0X25hbWUlMjBjbm5fZGFpbHltYWlsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kYXRhc2V0X2NvbmZpZyUyMCUyMjMuMC4wJTIyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1zb3VyY2VfcHJlZml4JTIwJTIyc3VtbWFyaXplJTNBJTIwJTIyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdXRwdXRfZGlyJTIwfiUyRnRtcCUyRnRzdC1zdW1tYXJpemF0aW9u",highlighted:`accelerate launch run_summarization_no_trainer.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir ~/tmp/tst-summarization`,wrap:!1}}),ae=new _({props:{title:"Usar un conjunto de datos personalizado",local:"usar-un-conjunto-de-datos-personalizado",headingTag:"h2"}}),ie=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXRyYWluX2ZpbGUlMjBwYXRoX3RvX2Nzdl9vcl9qc29ubGluZXNfZmlsZSUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tdmFsaWRhdGlvbl9maWxlJTIwcGF0aF90b19jc3Zfb3JfanNvbmxpbmVzX2ZpbGUlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXRleHRfY29sdW1uJTIwdGV4dF9jb2x1bW5fbmFtZSUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tc3VtbWFyeV9jb2x1bW4lMjBzdW1tYXJ5X2NvbHVtbl9uYW1lJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1zb3VyY2VfcHJlZml4JTIwJTIyc3VtbWFyaXplJTNBJTIwJTIyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdXRwdXRfZGlyJTIwJTJGdG1wJTJGdHN0LXN1bW1hcml6YXRpb24lMjAlNUMlMEElMjAlMjAlMjAlMjAtLW92ZXJ3cml0ZV9vdXRwdXRfZGlyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX3RyYWluX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wZXJfZGV2aWNlX2V2YWxfYmF0Y2hfc2l6ZSUzRDQlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXByZWRpY3Rfd2l0aF9nZW5lcmF0ZQ==",highlighted:`python examples/pytorch/summarization/run_summarization.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --train_file path_to_csv_or_jsonlines_file \\ | |
| --validation_file path_to_csv_or_jsonlines_file \\ | |
| --text_column text_column_name \\ | |
| --summary_column summary_column_name \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --overwrite_output_dir \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --predict_with_generate`,wrap:!1}}),oe=new _({props:{title:"Prueba un script",local:"prueba-un-script",headingTag:"h2"}}),pe=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tbWF4X3RyYWluX3NhbXBsZXMlMjA1MCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tbWF4X2V2YWxfc2FtcGxlcyUyMDUwJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1tYXhfcHJlZGljdF9zYW1wbGVzJTIwNTAlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX3RyYWluJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kb19ldmFsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kYXRhc2V0X25hbWUlMjBjbm5fZGFpbHltYWlsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1kYXRhc2V0X2NvbmZpZyUyMCUyMjMuMC4wJTIyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1zb3VyY2VfcHJlZml4JTIwJTIyc3VtbWFyaXplJTNBJTIwJTIyJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdXRwdXRfZGlyJTIwJTJGdG1wJTJGdHN0LXN1bW1hcml6YXRpb24lMjAlNUMlMEElMjAlMjAlMjAlMjAtLXBlcl9kZXZpY2VfdHJhaW5fYmF0Y2hfc2l6ZSUzRDQlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXBlcl9kZXZpY2VfZXZhbF9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tb3ZlcndyaXRlX291dHB1dF9kaXIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXByZWRpY3Rfd2l0aF9nZW5lcmF0ZQ==",highlighted:`python examples/pytorch/summarization/run_summarization.py \\ | |
| --model_name_or_path google-t5/t5-small \\ | |
| --max_train_samples 50 \\ | |
| --max_eval_samples 50 \\ | |
| --max_predict_samples 50 \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),de=new g({props:{code:"ZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTIwLWg=",highlighted:"examples/pytorch/summarization/run_summarization.py -h",wrap:!1}}),Me=new _({props:{title:"Reanudar el entrenamiento desde el punto de control",local:"reanudar-el-entrenamiento-desde-el-punto-de-control",headingTag:"h2"}}),ye=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfbmFtZSUyMGNubl9kYWlseW1haWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfY29uZmlnJTIwJTIyMy4wLjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXNvdXJjZV9wcmVmaXglMjAlMjJzdW1tYXJpemUlM0ElMjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW91dHB1dF9kaXIlMjAlMkZ0bXAlMkZ0c3Qtc3VtbWFyaXphdGlvbiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV90cmFpbl9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV9ldmFsX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdXRwdXRfZGlyJTIwcHJldmlvdXNfb3V0cHV0X2RpciUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcHJlZGljdF93aXRoX2dlbmVyYXRl",highlighted:`python examples/pytorch/summarization/run_summarization.py | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --output_dir previous_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),Te=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfbmFtZSUyMGNubl9kYWlseW1haWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfY29uZmlnJTIwJTIyMy4wLjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXNvdXJjZV9wcmVmaXglMjAlMjJzdW1tYXJpemUlM0ElMjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLW91dHB1dF9kaXIlMjAlMkZ0bXAlMkZ0c3Qtc3VtbWFyaXphdGlvbiUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV90cmFpbl9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcGVyX2RldmljZV9ldmFsX2JhdGNoX3NpemUlM0Q0JTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdmVyd3JpdGVfb3V0cHV0X2RpciUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcmVzdW1lX2Zyb21fY2hlY2twb2ludCUyMHBhdGhfdG9fc3BlY2lmaWNfY2hlY2twb2ludCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tcHJlZGljdF93aXRoX2dlbmVyYXRl",highlighted:`python examples/pytorch/summarization/run_summarization.py | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --resume_from_checkpoint path_to_specific_checkpoint \\ | |
| --predict_with_generate`,wrap:!1}}),he=new _({props:{title:"Comparte tu modelo",local:"comparte-tu-modelo",headingTag:"h2"}}),ge=new g({props:{code:"aHVnZ2luZ2ZhY2UtY2xpJTIwbG9naW4=",highlighted:"huggingface-cli login",wrap:!1}}),$e=new g({props:{code:"cHl0aG9uJTIwZXhhbXBsZXMlMkZweXRvcmNoJTJGc3VtbWFyaXphdGlvbiUyRnJ1bl9zdW1tYXJpemF0aW9uLnB5JTBBJTIwJTIwJTIwJTIwLS1tb2RlbF9uYW1lX29yX3BhdGglMjBnb29nbGUtdDUlMkZ0NS1zbWFsbCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tZG9fdHJhaW4lMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRvX2V2YWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfbmFtZSUyMGNubl9kYWlseW1haWwlMjAlNUMlMEElMjAlMjAlMjAlMjAtLWRhdGFzZXRfY29uZmlnJTIwJTIyMy4wLjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXNvdXJjZV9wcmVmaXglMjAlMjJzdW1tYXJpemUlM0ElMjAlMjIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXB1c2hfdG9faHViJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1wdXNoX3RvX2h1Yl9tb2RlbF9pZCUyMGZpbmV0dW5lZC10NS1jbm5fZGFpbHltYWlsJTIwJTVDJTBBJTIwJTIwJTIwJTIwLS1vdXRwdXRfZGlyJTIwJTJGdG1wJTJGdHN0LXN1bW1hcml6YXRpb24lMjAlNUMlMEElMjAlMjAlMjAlMjAtLXBlcl9kZXZpY2VfdHJhaW5fYmF0Y2hfc2l6ZSUzRDQlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXBlcl9kZXZpY2VfZXZhbF9iYXRjaF9zaXplJTNENCUyMCU1QyUwQSUyMCUyMCUyMCUyMC0tb3ZlcndyaXRlX291dHB1dF9kaXIlMjAlNUMlMEElMjAlMjAlMjAlMjAtLXByZWRpY3Rfd2l0aF9nZW5lcmF0ZQ==",highlighted:`python examples/pytorch/summarization/run_summarization.py | |
| --model_name_or_path google-t5/t5-small \\ | |
| --do_train \\ | |
| --do_eval \\ | |
| --dataset_name cnn_dailymail \\ | |
| --dataset_config <span class="hljs-string">"3.0.0"</span> \\ | |
| --source_prefix <span class="hljs-string">"summarize: "</span> \\ | |
| --push_to_hub \\ | |
| --push_to_hub_model_id finetuned-t5-cnn_dailymail \\ | |
| --output_dir /tmp/tst-summarization \\ | |
| --per_device_train_batch_size=4 \\ | |
| --per_device_eval_batch_size=4 \\ | |
| --overwrite_output_dir \\ | |
| --predict_with_generate`,wrap:!1}}),Ce=new bl({props:{source:"https://github.com/huggingface/transformers/blob/main/docs/source/es/run_scripts.md"}}),{c(){n=p("meta"),d=s(),r=p("p"),m=s(),M(u.$$.fragment),o=s(),U=p("p"),U.innerHTML=Vt,Ie=s(),X=p("p"),X.innerHTML=Bt,We=s(),v=p("p"),v.textContent=Ft,Ze=s(),A=p("p"),A.innerHTML=Yt,xe=s(),I=p("p"),I.innerHTML=Et,Ge=s(),M(W.$$.fragment),Le=s(),Z=p("p"),Z.innerHTML=St,Re=s(),M(x.$$.fragment),ze=s(),G=p("p"),G.textContent=Ht,Ne=s(),L=p("details"),L.innerHTML=kt,Ve=s(),R=p("p"),R.textContent=Qt,Be=s(),M(z.$$.fragment),Fe=s(),N=p("p"),N.textContent=qt,Ye=s(),M(V.$$.fragment),Ee=s(),M(B.$$.fragment),Se=s(),M(b.$$.fragment),He=s(),M(F.$$.fragment),ke=s(),Y=p("p"),Y.innerHTML=Pt,Qe=s(),E=p("ul"),E.innerHTML=Dt,qe=s(),M(S.$$.fragment),Pe=s(),H=p("p"),H.innerHTML=Ot,De=s(),M(k.$$.fragment),Oe=s(),M($.$$.fragment),Ke=s(),M(Q.$$.fragment),et=s(),q=p("p"),q.innerHTML=Kt,tt=s(),C=p("blockquote"),ve=p("p"),ve.textContent=el,Rt=s(),M(P.$$.fragment),lt=s(),D=p("p"),D.innerHTML=tl,at=s(),M(O.$$.fragment),nt=s(),K=p("p"),K.textContent=ll,rt=s(),M(ee.$$.fragment),st=s(),te=p("p"),te.textContent=al,it=s(),M(le.$$.fragment),ot=s(),M(ae.$$.fragment),mt=s(),ne=p("p"),ne.textContent=nl,ut=s(),re=p("ul"),re.innerHTML=rl,pt=s(),se=p("p"),se.textContent=sl,ct=s(),M(ie.$$.fragment),dt=s(),M(oe.$$.fragment),Mt=s(),me=p("p"),me.textContent=il,ft=s(),ue=p("ul"),ue.innerHTML=ol,wt=s(),M(pe.$$.fragment),yt=s(),ce=p("p"),ce.innerHTML=ml,Jt=s(),M(de.$$.fragment),Tt=s(),M(Me.$$.fragment),ht=s(),fe=p("p"),fe.textContent=ul,Ut=s(),we=p("p"),we.innerHTML=pl,gt=s(),M(ye.$$.fragment),jt=s(),Je=p("p"),Je.innerHTML=cl,_t=s(),M(Te.$$.fragment),bt=s(),M(he.$$.fragment),$t=s(),Ue=p("p"),Ue.innerHTML=dl,Ct=s(),M(ge.$$.fragment),Xt=s(),je=p("p"),je.innerHTML=Ml,vt=s(),_e=p("p"),_e.innerHTML=fl,At=s(),be=p("p"),be.textContent=wl,It=s(),M($e.$$.fragment),Wt=s(),M(Ce.$$.fragment),Zt=s(),Ae=p("p"),this.h()},l(e){const t=_l("svelte-u9bgzb",document.head);n=c(t,"META",{name:!0,content:!0}),t.forEach(l),d=i(e),r=c(e,"P",{}),zt(r).forEach(l),m=i(e),f(u.$$.fragment,e),o=i(e),U=c(e,"P",{"data-svelte-h":!0}),h(U)!=="svelte-d7jl06"&&(U.innerHTML=Vt),Ie=i(e),X=c(e,"P",{"data-svelte-h":!0}),h(X)!=="svelte-1eed7pp"&&(X.innerHTML=Bt),We=i(e),v=c(e,"P",{"data-svelte-h":!0}),h(v)!=="svelte-q7in0w"&&(v.textContent=Ft),Ze=i(e),A=c(e,"P",{"data-svelte-h":!0}),h(A)!=="svelte-qqx6xh"&&(A.innerHTML=Yt),xe=i(e),I=c(e,"P",{"data-svelte-h":!0}),h(I)!=="svelte-6nrxdl"&&(I.innerHTML=Et),Ge=i(e),f(W.$$.fragment,e),Le=i(e),Z=c(e,"P",{"data-svelte-h":!0}),h(Z)!=="svelte-urhg7w"&&(Z.innerHTML=St),Re=i(e),f(x.$$.fragment,e),ze=i(e),G=c(e,"P",{"data-svelte-h":!0}),h(G)!=="svelte-14qw7jd"&&(G.textContent=Ht),Ne=i(e),L=c(e,"DETAILS",{"data-svelte-h":!0}),h(L)!=="svelte-1x1s4dq"&&(L.innerHTML=kt),Ve=i(e),R=c(e,"P",{"data-svelte-h":!0}),h(R)!=="svelte-hmx73f"&&(R.textContent=Qt),Be=i(e),f(z.$$.fragment,e),Fe=i(e),N=c(e,"P",{"data-svelte-h":!0}),h(N)!=="svelte-1xjsan8"&&(N.textContent=qt),Ye=i(e),f(V.$$.fragment,e),Ee=i(e),f(B.$$.fragment,e),Se=i(e),f(b.$$.fragment,e),He=i(e),f(F.$$.fragment,e),ke=i(e),Y=c(e,"P",{"data-svelte-h":!0}),h(Y)!=="svelte-1vayda"&&(Y.innerHTML=Pt),Qe=i(e),E=c(e,"UL",{"data-svelte-h":!0}),h(E)!=="svelte-11wko64"&&(E.innerHTML=Dt),qe=i(e),f(S.$$.fragment,e),Pe=i(e),H=c(e,"P",{"data-svelte-h":!0}),h(H)!=="svelte-1pgxo6n"&&(H.innerHTML=Ot),De=i(e),f(k.$$.fragment,e),Oe=i(e),f($.$$.fragment,e),Ke=i(e),f(Q.$$.fragment,e),et=i(e),q=c(e,"P",{"data-svelte-h":!0}),h(q)!=="svelte-1ao8eb7"&&(q.innerHTML=Kt),tt=i(e),C=c(e,"BLOCKQUOTE",{});var Xe=zt(C);ve=c(Xe,"P",{"data-svelte-h":!0}),h(ve)!=="svelte-v6ptb5"&&(ve.textContent=el),Rt=i(Xe),f(P.$$.fragment,Xe),Xe.forEach(l),lt=i(e),D=c(e,"P",{"data-svelte-h":!0}),h(D)!=="svelte-f2qxdl"&&(D.innerHTML=tl),at=i(e),f(O.$$.fragment,e),nt=i(e),K=c(e,"P",{"data-svelte-h":!0}),h(K)!=="svelte-1lbiwlb"&&(K.textContent=ll),rt=i(e),f(ee.$$.fragment,e),st=i(e),te=c(e,"P",{"data-svelte-h":!0}),h(te)!=="svelte-1xir6jm"&&(te.textContent=al),it=i(e),f(le.$$.fragment,e),ot=i(e),f(ae.$$.fragment,e),mt=i(e),ne=c(e,"P",{"data-svelte-h":!0}),h(ne)!=="svelte-i0mu2i"&&(ne.textContent=nl),ut=i(e),re=c(e,"UL",{"data-svelte-h":!0}),h(re)!=="svelte-63p7gb"&&(re.innerHTML=rl),pt=i(e),se=c(e,"P",{"data-svelte-h":!0}),h(se)!=="svelte-9ewep"&&(se.textContent=sl),ct=i(e),f(ie.$$.fragment,e),dt=i(e),f(oe.$$.fragment,e),Mt=i(e),me=c(e,"P",{"data-svelte-h":!0}),h(me)!=="svelte-1mxinmq"&&(me.textContent=il),ft=i(e),ue=c(e,"UL",{"data-svelte-h":!0}),h(ue)!=="svelte-14g5f8g"&&(ue.innerHTML=ol),wt=i(e),f(pe.$$.fragment,e),yt=i(e),ce=c(e,"P",{"data-svelte-h":!0}),h(ce)!=="svelte-1cyxowy"&&(ce.innerHTML=ml),Jt=i(e),f(de.$$.fragment,e),Tt=i(e),f(Me.$$.fragment,e),ht=i(e),fe=c(e,"P",{"data-svelte-h":!0}),h(fe)!=="svelte-1o75lnb"&&(fe.textContent=ul),Ut=i(e),we=c(e,"P",{"data-svelte-h":!0}),h(we)!=="svelte-g1kea5"&&(we.innerHTML=pl),gt=i(e),f(ye.$$.fragment,e),jt=i(e),Je=c(e,"P",{"data-svelte-h":!0}),h(Je)!=="svelte-1y54z8s"&&(Je.innerHTML=cl),_t=i(e),f(Te.$$.fragment,e),bt=i(e),f(he.$$.fragment,e),$t=i(e),Ue=c(e,"P",{"data-svelte-h":!0}),h(Ue)!=="svelte-vngql6"&&(Ue.innerHTML=dl),Ct=i(e),f(ge.$$.fragment,e),Xt=i(e),je=c(e,"P",{"data-svelte-h":!0}),h(je)!=="svelte-9rxj66"&&(je.innerHTML=Ml),vt=i(e),_e=c(e,"P",{"data-svelte-h":!0}),h(_e)!=="svelte-1vjyl3c"&&(_e.innerHTML=fl),At=i(e),be=c(e,"P",{"data-svelte-h":!0}),h(be)!=="svelte-1451tku"&&(be.textContent=wl),It=i(e),f($e.$$.fragment,e),Wt=i(e),f(Ce.$$.fragment,e),Zt=i(e),Ae=c(e,"P",{}),zt(Ae).forEach(l),this.h()},h(){Jl(n,"name","hf:doc:metadata"),Jl(n,"content",Gl)},m(e,t){Nt(document.head,n),a(e,d,t),a(e,r,t),a(e,m,t),w(u,e,t),a(e,o,t),a(e,U,t),a(e,Ie,t),a(e,X,t),a(e,We,t),a(e,v,t),a(e,Ze,t),a(e,A,t),a(e,xe,t),a(e,I,t),a(e,Ge,t),w(W,e,t),a(e,Le,t),a(e,Z,t),a(e,Re,t),w(x,e,t),a(e,ze,t),a(e,G,t),a(e,Ne,t),a(e,L,t),a(e,Ve,t),a(e,R,t),a(e,Be,t),w(z,e,t),a(e,Fe,t),a(e,N,t),a(e,Ye,t),w(V,e,t),a(e,Ee,t),w(B,e,t),a(e,Se,t),w(b,e,t),a(e,He,t),w(F,e,t),a(e,ke,t),a(e,Y,t),a(e,Qe,t),a(e,E,t),a(e,qe,t),w(S,e,t),a(e,Pe,t),a(e,H,t),a(e,De,t),w(k,e,t),a(e,Oe,t),w($,e,t),a(e,Ke,t),w(Q,e,t),a(e,et,t),a(e,q,t),a(e,tt,t),a(e,C,t),Nt(C,ve),Nt(C,Rt),w(P,C,null),a(e,lt,t),a(e,D,t),a(e,at,t),w(O,e,t),a(e,nt,t),a(e,K,t),a(e,rt,t),w(ee,e,t),a(e,st,t),a(e,te,t),a(e,it,t),w(le,e,t),a(e,ot,t),w(ae,e,t),a(e,mt,t),a(e,ne,t),a(e,ut,t),a(e,re,t),a(e,pt,t),a(e,se,t),a(e,ct,t),w(ie,e,t),a(e,dt,t),w(oe,e,t),a(e,Mt,t),a(e,me,t),a(e,ft,t),a(e,ue,t),a(e,wt,t),w(pe,e,t),a(e,yt,t),a(e,ce,t),a(e,Jt,t),w(de,e,t),a(e,Tt,t),w(Me,e,t),a(e,ht,t),a(e,fe,t),a(e,Ut,t),a(e,we,t),a(e,gt,t),w(ye,e,t),a(e,jt,t),a(e,Je,t),a(e,_t,t),w(Te,e,t),a(e,bt,t),w(he,e,t),a(e,$t,t),a(e,Ue,t),a(e,Ct,t),w(ge,e,t),a(e,Xt,t),a(e,je,t),a(e,vt,t),a(e,_e,t),a(e,At,t),a(e,be,t),a(e,It,t),w($e,e,t),a(e,Wt,t),w(Ce,e,t),a(e,Zt,t),a(e,Ae,t),xt=!0},p(e,[t]){const Xe={};t&2&&(Xe.$$scope={dirty:t,ctx:e}),b.$set(Xe);const yl={};t&2&&(yl.$$scope={dirty:t,ctx:e}),$.$set(yl)},i(e){xt||(y(u.$$.fragment,e),y(W.$$.fragment,e),y(x.$$.fragment,e),y(z.$$.fragment,e),y(V.$$.fragment,e),y(B.$$.fragment,e),y(b.$$.fragment,e),y(F.$$.fragment,e),y(S.$$.fragment,e),y(k.$$.fragment,e),y($.$$.fragment,e),y(Q.$$.fragment,e),y(P.$$.fragment,e),y(O.$$.fragment,e),y(ee.$$.fragment,e),y(le.$$.fragment,e),y(ae.$$.fragment,e),y(ie.$$.fragment,e),y(oe.$$.fragment,e),y(pe.$$.fragment,e),y(de.$$.fragment,e),y(Me.$$.fragment,e),y(ye.$$.fragment,e),y(Te.$$.fragment,e),y(he.$$.fragment,e),y(ge.$$.fragment,e),y($e.$$.fragment,e),y(Ce.$$.fragment,e),xt=!0)},o(e){J(u.$$.fragment,e),J(W.$$.fragment,e),J(x.$$.fragment,e),J(z.$$.fragment,e),J(V.$$.fragment,e),J(B.$$.fragment,e),J(b.$$.fragment,e),J(F.$$.fragment,e),J(S.$$.fragment,e),J(k.$$.fragment,e),J($.$$.fragment,e),J(Q.$$.fragment,e),J(P.$$.fragment,e),J(O.$$.fragment,e),J(ee.$$.fragment,e),J(le.$$.fragment,e),J(ae.$$.fragment,e),J(ie.$$.fragment,e),J(oe.$$.fragment,e),J(pe.$$.fragment,e),J(de.$$.fragment,e),J(Me.$$.fragment,e),J(ye.$$.fragment,e),J(Te.$$.fragment,e),J(he.$$.fragment,e),J(ge.$$.fragment,e),J($e.$$.fragment,e),J(Ce.$$.fragment,e),xt=!1},d(e){e&&(l(d),l(r),l(m),l(o),l(U),l(Ie),l(X),l(We),l(v),l(Ze),l(A),l(xe),l(I),l(Ge),l(Le),l(Z),l(Re),l(ze),l(G),l(Ne),l(L),l(Ve),l(R),l(Be),l(Fe),l(N),l(Ye),l(Ee),l(Se),l(He),l(ke),l(Y),l(Qe),l(E),l(qe),l(Pe),l(H),l(De),l(Oe),l(Ke),l(et),l(q),l(tt),l(C),l(lt),l(D),l(at),l(nt),l(K),l(rt),l(st),l(te),l(it),l(ot),l(mt),l(ne),l(ut),l(re),l(pt),l(se),l(ct),l(dt),l(Mt),l(me),l(ft),l(ue),l(wt),l(yt),l(ce),l(Jt),l(Tt),l(ht),l(fe),l(Ut),l(we),l(gt),l(jt),l(Je),l(_t),l(bt),l($t),l(Ue),l(Ct),l(Xt),l(je),l(vt),l(_e),l(At),l(be),l(It),l(Wt),l(Zt),l(Ae)),l(n),T(u,e),T(W,e),T(x,e),T(z,e),T(V,e),T(B,e),T(b,e),T(F,e),T(S,e),T(k,e),T($,e),T(Q,e),T(P),T(O,e),T(ee,e),T(le,e),T(ae,e),T(ie,e),T(oe,e),T(pe,e),T(de,e),T(Me,e),T(ye,e),T(Te,e),T(he,e),T(ge,e),T($e,e),T(Ce,e)}}}const Gl='{"title":"Entrenamiento con scripts","local":"entrenamiento-con-scripts","sections":[{"title":"Configuraci贸n","local":"configuraci贸n","sections":[],"depth":2},{"title":"Ejecutar un script","local":"ejecutar-un-script","sections":[],"depth":2},{"title":"Entrenamiento distribuido y de precisi贸n mixta","local":"entrenamiento-distribuido-y-de-precisi贸n-mixta","sections":[],"depth":2},{"title":"Ejecutar un script en una TPU","local":"ejecutar-un-script-en-una-tpu","sections":[],"depth":2},{"title":"Ejecutar un script con 馃 Accelerate","local":"ejecutar-un-script-con--accelerate","sections":[],"depth":2},{"title":"Usar un conjunto de datos personalizado","local":"usar-un-conjunto-de-datos-personalizado","sections":[],"depth":2},{"title":"Prueba un script","local":"prueba-un-script","sections":[],"depth":2},{"title":"Reanudar el entrenamiento desde el punto de control","local":"reanudar-el-entrenamiento-desde-el-punto-de-control","sections":[],"depth":2},{"title":"Comparte tu modelo","local":"comparte-tu-modelo","sections":[],"depth":2}],"depth":1}';function Ll(j){return Ul(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class Fl extends gl{constructor(n){super(),jl(this,n,Ll,xl,hl,{})}}export{Fl as component}; | |
Xet Storage Details
- Size:
- 43.7 kB
- Xet hash:
- e65ffc1e31e6324e5e651a2e064adf36beed934f09c38c767435d42202e740e7
路
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.