Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / agents-course /pr_545 /es /unit1 /thoughts.html

rtrm

3 months ago

download

raw

11.2 kB

	<meta charset="utf-8" /><meta name="hf:doc:metadata" content="{"title":"Pensamiento: Razonamiento Interno y el Enfoque Re-Act","local":"pensamiento-razonamiento-interno-y-el-enfoque-re-act","sections":[{"title":"El Enfoque Re-Act","local":"el-enfoque-re-act","sections":[],"depth":2}],"depth":1}">
	<link href="/docs/agents-course/pr_545/es/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/entry/start.63ebcd5b.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/scheduler.37c15a92.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/singletons.4b25defb.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/index.18351ede.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/paths.6deaf1b7.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/entry/app.b37467ae.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/index.2bf4358c.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/nodes/0.147ec314.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/each.e59479a4.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/nodes/31.9ce0a01c.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/Tip.363c041f.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/Heading.8ada512a.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_545/es/_app/immutable/chunks/getInferenceSnippets.031140c2.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{"title":"Pensamiento: Razonamiento Interno y el Enfoque Re-Act","local":"pensamiento-razonamiento-interno-y-el-enfoque-re-act","sections":[{"title":"El Enfoque Re-Act","local":"el-enfoque-re-act","sections":[],"depth":2}],"depth":1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <h1 class="relative group"><a id="pensamiento-razonamiento-interno-y-el-enfoque-re-act" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#pensamiento-razonamiento-interno-y-el-enfoque-re-act"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Pensamiento: Razonamiento Interno y el Enfoque Re-Act</span></h1> <div class="course-tip bg-gradient-to-br dark:bg-gradient-to-r before:border-green-500 dark:before:border-green-800 from-green-50 dark:from-gray-900 to-white dark:to-gray-950 border border-green-50 text-green-700 dark:text-gray-400">En esta sección, profundizamos en el funcionamiento interno de un agente de IA—su capacidad para razonar y planificar. Exploraremos cómo el agente aprovecha su diálogo interno para analizar información, desglosar problemas complejos en pasos manejables y decidir qué acción tomar a continuación. Además, presentamos el enfoque Re-Act, una técnica de prompting que anima al modelo a pensar "paso a paso" antes de actuar.</div> <p data-svelte-h="svelte-1y2ywl0">Los pensamientos representan los <strong>procesos internos de razonamiento y planificación del Agente</strong> para resolver la tarea.</p> <p data-svelte-h="svelte-19ob4i4">Esto utiliza la capacidad del Modelo de Lenguaje Grande (LLM) del agente <strong>para analizar información cuando se presenta en su prompt</strong>.</p> <p data-svelte-h="svelte-g8ib6g">Piensalo como el diálogo interno del agente, donde considera la tarea en cuestión y forma la estrategia de su enfoque.</p> <p data-svelte-h="svelte-dj1286">Los pensamientos del Agente son responsables de acceder a las observaciones actuales y decidir cuál(es) debería(n) ser la(s) siguiente(s) acción(es).</p> <p data-svelte-h="svelte-1a73isk">A través de este proceso, el agente puede <strong>desglosar problemas complejos en pasos más pequeños y manejables</strong>, reflexionar sobre experiencias pasadas y ajustar continuamente sus planes basándose en nueva información.</p> <p data-svelte-h="svelte-14h14td">Aquí hay algunos ejemplos de pensamientos comunes:</p> <table data-svelte-h="svelte-1wq6xma"><thead><tr><th>Tipo de Pensamiento</th> <th>Ejemplo</th></tr></thead> <tbody><tr><td>Planificación</td> <td>“Necesito dividir esta tarea en tres pasos: 1) recopilar datos, 2) analizar tendencias, 3) generar informe”</td></tr> <tr><td>Análisis</td> <td>“Basado en el mensaje de error, el problema parece estar en los parámetros de conexión de la base de datos”</td></tr> <tr><td>Toma de Decisiones</td> <td>“Dadas las restricciones presupuestarias del usuario, debería recomendar la opción de nivel medio”</td></tr> <tr><td>Resolución de Problemas</td> <td>“Para optimizar este código, primero debería perfilarlo para identificar cuellos de botella”</td></tr> <tr><td>Integración de Memoria</td> <td>“El usuario mencionó su preferencia por Python anteriormente, así que proporcionaré ejemplos en Python”</td></tr> <tr><td>Auto-reflexión</td> <td>“Mi último enfoque no funcionó bien, debería probar una estrategia diferente”</td></tr> <tr><td>Establecimiento de Objetivos</td> <td>“Para completar esta tarea, primero necesito establecer los criterios de aceptación”</td></tr> <tr><td>Priorización</td> <td>“La vulnerabilidad de seguridad debe abordarse antes de agregar nuevas características”</td></tr></tbody></table> <blockquote data-svelte-h="svelte-xtvu7"><p><strong>Nota:</strong> En el caso de LLMs afinados para llamadas a funciones, el proceso de pensamiento es opcional.
	<em>En caso de que no estés familiarizado con las llamadas a funciones, habrá más detalles en la sección de Acciones.</em></p></blockquote> <h2 class="relative group"><a id="el-enfoque-re-act" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#el-enfoque-re-act"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>El Enfoque Re-Act</span></h2> <p data-svelte-h="svelte-bdo8zt">Un método clave es el <strong>enfoque ReAct</strong>, que es la concatenación de “Razonamiento” (Think) con “Actuar” (Act).</p> <p data-svelte-h="svelte-dcmx2n">ReAct es una técnica de prompting simple que añade “Pensemos paso a paso” antes de permitir que el LLM decodifique los siguientes tokens.</p> <p data-svelte-h="svelte-cwen9f">De hecho, indicar al modelo que piense “paso a paso” fomenta el proceso de decodificación hacia los siguientes tokens <strong>que generan un plan</strong>, en lugar de una solución final, ya que se anima al modelo a <strong>descomponer</strong> el problema en <em>sub-tareas</em>.</p> <p data-svelte-h="svelte-13tn2zv">Esto permite que el modelo considere los sub-pasos con más detalle, lo que en general conduce a menos errores que intentar generar la solución final directamente.</p> <figure data-svelte-h="svelte-1u51tua"><img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/ReAct.png" alt="ReAct"> <figcaption>El (d) es un ejemplo del enfoque Re-Act donde indicamos "Pensemos paso a paso"</figcaption></figure> <div class="course-tip bg-gradient-to-br dark:bg-gradient-to-r before:border-green-500 dark:before:border-green-800 from-green-50 dark:from-gray-900 to-white dark:to-gray-950 border border-green-50 text-green-700 dark:text-gray-400">Recientemente hemos visto mucho interés por las estrategias de razonamiento. Esto es lo que está detrás de modelos como Deepseek R1 o o1 de OpenAI, que han sido afinados para "pensar antes de responder".
	<p data-svelte-h="svelte-t5vnca">Estos modelos han sido entrenados para incluir siempre secciones específicas de <em>pensamiento</em> (encerradas entre tokens especiales <code><think></code> y <code></think></code>). Esto no es solo una técnica de prompting como ReAct, sino un método de entrenamiento donde el modelo aprende a generar estas secciones después de analizar miles de ejemplos que muestran lo que esperamos que haga.</p></div> <hr> <p data-svelte-h="svelte-7lk6d8">Ahora que entendemos mejor el proceso de Pensamiento, profundicemos en la segunda parte del proceso: Actuar.</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/agents-course/blob/main/units/es/unit1/thoughts.mdx" target="_blank"><span data-svelte-h="svelte-1kd6by1"><</span> <span data-svelte-h="svelte-x0xyl0">></span> <span data-svelte-h="svelte-1dajgef"><span class="underline ml-1.5">Update</span> on GitHub</span></a> <p></p>

	<script>
	{
	__sveltekit_1k0olmh = {
	assets: "/docs/agents-course/pr_545/es",
	base: "/docs/agents-course/pr_545/es",
	env: {}
	};

	const element = document.currentScript.parentElement;

	const data = [null,null];

	Promise.all([
	import("/docs/agents-course/pr_545/es/_app/immutable/entry/start.63ebcd5b.js"),
	import("/docs/agents-course/pr_545/es/_app/immutable/entry/app.b37467ae.js")
	]).then(([kit, app]) => {
	kit.start(app, element, {
	node_ids: [0, 31],
	data,
	form: null,
	error: null
	});
	});
	}
	</script>

Xet Storage Details

Size:: 11.2 kB
Xet hash:: 406fe1283796c0b76cfcea2d9efe39c18c5a0c5e5f3d4051e1453aa591bd9783

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.