Spaces:

matt1847
/

will

Sleeping

App Files Files Community

will / src /models /gpt_neo.py

matt1847

リファクタ: srcディレクトリ構造への移行とDocker対応

d1033d4 3 months ago

raw

history blame contribute delete

2.11 kB

	"""
	GPT-Neo モデル実装

	EleutherAI GPT-Neo 125Mの実装を提供する
	"""
	from typing import List, Tuple

	import torch
	from transformers import GPTNeoForCausalLM, GPT2Tokenizer

	from .base import BaseLanguageModel, ModelConfig


	# GPT-Neo 125M設定
	GPT_NEO_125M_CONFIG = ModelConfig(
	name="GPT-Neo 125M",
	model_id="EleutherAI/gpt-neo-125M",
	embedding_dim=768,
	vocab_size=50257,
	)


	class GPTNeoModel(BaseLanguageModel):
	"""
	GPT-Neoモデルの実装

	EleutherAI GPT-NeoをラップしBaseLanguageModelインターフェースを実装
	"""

	# 出力ノイズの倍率
	LOGITS_NOISE_SCALE = 10.0

	def load(self) -> None:
	"""モデルとトークナイザーをロード"""
	if self._is_loaded:
	return

	try:
	self._model = GPTNeoForCausalLM.from_pretrained(self._config.model_id)
	# GPT-Neoは GPT-2互換のトークナイザーを使用
	self._tokenizer = GPT2Tokenizer.from_pretrained(self._config.model_id)
	self._model.eval()
	self._is_loaded = True
	except Exception as e:
	raise RuntimeError(f"Failed to load model {self._config.model_id}: {e}")

	def forward_with_noise(
	self, noise: torch.Tensor
	) -> Tuple[torch.Tensor, torch.Tensor]:
	"""ノイズを入力として順伝播を実行"""
	if not self._is_loaded:
	raise RuntimeError("Model not loaded. Call load() first.")

	with torch.no_grad():
	outputs = self._model(inputs_embeds=noise)
	logits = outputs.logits

	logits_noise = (
	torch.randn_like(logits) * logits.std() * self.LOGITS_NOISE_SCALE
	)
	corrupted_logits = logits + logits_noise

	return logits, corrupted_logits

	def decode_indices(self, indices: List[int]) -> List[str]:
	"""トークンインデックスをデコード"""
	if not self._is_loaded:
	raise RuntimeError("Model not loaded. Call load() first.")

	return [self._tokenizer.decode([i]) for i in indices]