Spaces:

VortexIntelligence
/

VLM-Doc

Running

App Files Files Community

VLM-Doc / index.html

PingVortex

Update index.html

2722da6 verified 7 months ago

raw

history blame

3.4 kB

	<!DOCTYPE html>
	<html lang="en">
	<head>
	<meta charset="UTF-8">
	<meta name="viewport" content="width=device-width, initial-scale=1.0">
	<title>Vortex Language Model (VLM) Documentation</title>
	<style>
	body {
	background-color: #121212;
	color: #e0e0e0;
	font-family: Arial, sans-serif;
	line-height: 1.6;
	padding: 2rem;
	}
	h1, h2, h3 {
	color: #ffffff;
	}
	code {
	background-color: #1e1e1e;
	padding: 2px 4px;
	border-radius: 4px;
	color: #c0caf5;
	}
	.section {
	margin-bottom: 2rem;
	}
	a {
	color: #82aaff;
	}
	</style>
	</head>
	<body>
	<h1>Vortex Language Model (VLM) Documentation</h1>

	<div class="section">
	<h2>Overview</h2>
	<p><strong>VLM</strong> stands for <strong>Vortex Language Model</strong>, a series of transformer-based models developed by <strong>PingVortex</strong>. The models are designed for tasks such as text generation, reasoning, and instruction following. Each version of VLM is structured in three training stages for progressive refinement.</p>
	</div>

	<div class="section">
	<h2>Model Structure</h2>
	<p>Each VLM version follows a three-stage pipeline:</p>
	<ul>
	<li><strong>K1</strong>: Trained from scratch (base model)</li>
	<li><strong>K2</strong>: Fine-tuned on broader/general-purpose data</li>
	<li><strong>K3</strong>: Fine-tuned for clarity and simplicity</li>
	</ul>
	<p>K stands for <em>Knowledge</em>, with higher numbers representing more advanced training stages.</p>
	</div>

	<div class="section">
	<h2>Versions and Training Details</h2>

	<h3>VLM 1</h3>
	<ul>
	<li>Parameters: <code>124M</code></li>
	<li>Training Time: ~4 hours per stage</li>
	<li>Final Loss (all stages): ~<code>3.0</code></li>
	<li><strong>K1</strong>: Trained on <code>tatsu-lab/alpaca</code> and a small custom dataset</li>
	<li><strong>K2</strong>: Fine-tuned K1 on <code>Elriggs/openwebtext-100k</code></li>
	<li><strong>K3</strong>: Fine-tuned K2 on <code>rahular/simple-wikipedia</code></li>
	</ul>

	<h3>VLM 1.1</h3>
	<ul>
	<li>Parameters: <code>418M</code></li>
	<li>Training Time: ~4 hours per stage</li>
	<li>Target Final Loss: ~<code>1.0</code></li>
	<li><strong>K1</strong>: Currently training on <code>ssbuild/alpaca_gpt4</code> and <code>effectiveML/ArXiv-10</code></li>
	</ul>
	</div>

	<div class="section">
	<h2>Training Objectives</h2>
	<p>All models aim to reach a target training loss that signifies strong generalization ability. Training is monitored using:</p>
	<ul>
	<li>Loss convergence</li>
	<li>Gradient norms</li>
	<li>Learning rate schedules</li>
	<li>Evaluation tasks (math, logic, generation)</li>
	</ul>
	</div>

	<div class="section">
	<h2>Applications</h2>
	<p>VLM models are suitable for integration in various AI applications, including:</p>
	<ul>
	<li>Conversational assistants</li>
	<li>Search and knowledge retrieval</li>
	<li>Code generation and analysis</li>
	<li>Educational tutoring and summarization</li>
	</ul>
	</div>

	<div class="section">
	<h2>Contact & More</h2>
	<p>Developed and maintained by <strong>PingVortex</strong>.</p>
	<p>Website: <a href="https://pingvortex.xyz" target="_blank">pingvortex.xyz</a></p>
	</div>
	</body>
	</html>