Spaces:

matt1847
/

will

Sleeping

App Files Files Community

will / src /models /bloom.py

matt1847

機能追加: モデルラインナップ拡張とGradio UI移行

f94169f 6 days ago

raw

history blame contribute delete

2.45 kB

	"""
	BLOOM モデル実装

	BigScienceによる完全オープンソースモデル
	多言語対応、ALiBi位置埋め込みを採用
	"""
	from typing import List, Tuple

	import torch
	from transformers import BloomForCausalLM, AutoTokenizer

	from .base import BaseLanguageModel, ModelConfig


	# BLOOM 560M設定
	BLOOM_560M_CONFIG = ModelConfig(
	name="BLOOM 560M",
	model_id="bigscience/bloom-560m",
	embedding_dim=1024,
	vocab_size=250880,
	)


	class BLOOMModel(BaseLanguageModel):
	"""
	BLOOMモデルの実装

	BigScienceが公開した完全オープンソースモデル。
	多言語対応、ALiBi位置埋め込みを採用。
	"""

	# 出力ノイズの倍率（学習バイアス破壊用）
	LOGITS_NOISE_SCALE = 10.0

	def load(self) -> None:
	"""モデルとトークナイザーをロード"""
	if self._is_loaded:
	return

	try:
	self._model = BloomForCausalLM.from_pretrained(self._config.model_id)
	self._tokenizer = AutoTokenizer.from_pretrained(self._config.model_id)
	self._model.eval()
	self._is_loaded = True
	except Exception as e:
	raise RuntimeError(f"Failed to load model {self._config.model_id}: {e}")

	def forward_with_noise(
	self, noise: torch.Tensor
	) -> Tuple[torch.Tensor, torch.Tensor]:
	"""
	ノイズを入力として順伝播を実行し、出力にもノイズを加算

	Args:
	noise: 入力ノイズテンソル [batch, seq_len, embedding_dim]

	Returns:
	Tuple[logits, corrupted_logits]
	"""
	if not self._is_loaded:
	raise RuntimeError("Model not loaded. Call load() first.")

	with torch.no_grad():
	outputs = self._model(inputs_embeds=noise)
	logits = outputs.logits

	# 出力logitsにノイズを加算して学習バイアスを破壊
	logits_noise = (
	torch.randn_like(logits) * logits.std() * self.LOGITS_NOISE_SCALE
	)
	corrupted_logits = logits + logits_noise

	return logits, corrupted_logits

	def decode_indices(self, indices: List[int]) -> List[str]:
	"""トークンインデックスをデコード"""
	if not self._is_loaded:
	raise RuntimeError("Model not loaded. Call load() first.")

	return [self._tokenizer.decode([i]) for i in indices]