Upload 8 files
Browse files- README.md +39 -97
- config.json +4 -1
- enigma_module.py +10 -4
- model.safetensors +2 -2
README.md
CHANGED
|
@@ -1,120 +1,62 @@
|
|
| 1 |
---
|
|
|
|
| 2 |
language:
|
| 3 |
- pt
|
| 4 |
- en
|
| 5 |
-
license: mit
|
| 6 |
tags:
|
| 7 |
-
|
| 8 |
-
|
| 9 |
-
|
| 10 |
-
|
| 11 |
-
|
| 12 |
-
|
| 13 |
-
|
| 14 |
-
|
| 15 |
-
datasets:
|
| 16 |
-
- dr-tkxx/enigma-corpus
|
| 17 |
-
model-index:
|
| 18 |
-
- name: Enigma
|
| 19 |
-
results:
|
| 20 |
-
- task:
|
| 21 |
-
type: text-generation
|
| 22 |
-
dataset:
|
| 23 |
-
name: Enigma Internal Benchmark
|
| 24 |
-
type: enigma-benchmark
|
| 25 |
-
metrics:
|
| 26 |
-
- name: Cryptographic Coherence
|
| 27 |
-
type: coherence
|
| 28 |
-
value: 95.5
|
| 29 |
-
source:
|
| 30 |
-
name: dr-tkxx Internal Evals
|
| 31 |
-
url: https://huggingface.co/spaces/dr-tkxx/ancient
|
| 32 |
---
|
| 33 |
|
| 34 |
-
# Enigma
|
| 35 |
-
|
| 36 |
-
## Model Description
|
| 37 |
-
|
| 38 |
-
O **Enigma** é um modelo de inteligência artificial de geração de texto desenvolvido por **dr-tkxx**, projetado especificamente para operar em conjunto com a interface `enigma.htm`. Ele é especializado em criptografia conceitual, processamento de dados esotéricos, simulações quânticas abstratas e resolução de quebra-cabeças complexos.
|
| 39 |
-
|
| 40 |
-
- **Developed by:** dr-tkxx
|
| 41 |
-
- **Model type:** Text Generation (Geração de Texto)
|
| 42 |
-
- **Language(s) (NLP):** Português (pt), Inglês (en)
|
| 43 |
-
- **License:** MIT
|
| 44 |
-
- **Library:** Transformers
|
| 45 |
-
- **Related Project:** `enigma.htm`
|
| 46 |
-
|
| 47 |
-
## Uses
|
| 48 |
|
| 49 |
-
|
|
|
|
|
|
|
| 50 |
|
| 51 |
-
|
| 52 |
-
|
| 53 |
-
- Criptografar e descriptografar sequências conceituais.
|
| 54 |
-
- Simular interações com sistemas esotéricos e quânticos.
|
| 55 |
-
- Auxiliar na criação de roteiros de mistério e ficção científica.
|
| 56 |
|
| 57 |
-
|
| 58 |
|
| 59 |
-
|
| 60 |
-
|
| 61 |
-
|
| 62 |
-
|
| 63 |
|
| 64 |
-
##
|
| 65 |
-
|
| 66 |
-
Os textos gerados pelo Enigma podem incluir conceitos altamente abstratos, metafóricos e esotéricos. Existe o risco de que saídas complexas sejam mal interpretadas se tomadas de forma literal. O modelo foi treinado para focar em estética de mistério e ficção técnica. **A tag `not-for-all-audiences` foi adicionada devido à natureza críptica dos outputs gerados.**
|
| 67 |
-
|
| 68 |
-
## How to Get Started with the Model
|
| 69 |
-
|
| 70 |
-
Use o código abaixo para começar a interagir com o modelo:
|
| 71 |
|
|
|
|
| 72 |
```python
|
| 73 |
from transformers import pipeline
|
| 74 |
|
| 75 |
-
#
|
| 76 |
-
|
| 77 |
|
| 78 |
-
|
| 79 |
-
|
| 80 |
-
result = enigma_pipe(prompt, max_length=50)
|
| 81 |
-
|
| 82 |
-
print(result[0]['generated_text'])
|
| 83 |
```
|
| 84 |
|
| 85 |
-
##
|
| 86 |
-
|
| 87 |
-
|
| 88 |
-
|
| 89 |
-
O modelo foi treinado sobre o conjunto de dados esotérico e criptográfico `dr-tkxx/enigma-corpus`, contendo transcrições simuladas e logs de anomalias quânticas do projeto Enigma.
|
| 90 |
-
|
| 91 |
-
### Training Procedure
|
| 92 |
-
|
| 93 |
-
O modelo passou por fine-tuning utilizando parâmetros otimizados para maximizar a coerência criptográfica ($MSE$) mantendo um alto nível de perplexidade intencional na geração dos enigmas.
|
| 94 |
-
|
| 95 |
-
$$ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$
|
| 96 |
-
|
| 97 |
-
## Evaluation
|
| 98 |
-
|
| 99 |
-
Os resultados da avaliação de Coerência Criptográfica constam no topo do arquivo (metadata YAML), permitindo que o Hugging Face renderize a tabela de métricas automaticamente na interface do repositório.
|
| 100 |
-
|
| 101 |
-
## Environmental Impact
|
| 102 |
|
| 103 |
-
|
| 104 |
-
|
| 105 |
-
|
| 106 |
-
|
| 107 |
|
| 108 |
-
##
|
|
|
|
| 109 |
|
| 110 |
-
|
|
|
|
| 111 |
|
| 112 |
-
|
| 113 |
-
@software{dr_tkxx_enigma_2026,
|
| 114 |
-
author = {dr-tkxx},
|
| 115 |
-
title = {Enigma: AI Text Generation Model},
|
| 116 |
-
year = {2026},
|
| 117 |
-
publisher = {Hugging Face},
|
| 118 |
-
url = {https://huggingface.co/dr-tkxx/Enigma}
|
| 119 |
-
}
|
| 120 |
-
```
|
|
|
|
| 1 |
---
|
| 2 |
+
license: mit
|
| 3 |
language:
|
| 4 |
- pt
|
| 5 |
- en
|
|
|
|
| 6 |
tags:
|
| 7 |
+
- custom-code
|
| 8 |
+
- text-generation
|
| 9 |
+
- enigma
|
| 10 |
+
- aoi-logic
|
| 11 |
+
- kaizen
|
| 12 |
+
authors:
|
| 13 |
+
- name: Mestre Seiya
|
| 14 |
+
link: https://orcid.org/0009-0002-5218-5345
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 15 |
---
|
| 16 |
|
| 17 |
+
# Modelo Enigma (AOI Logic Sentience)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 18 |
|
| 19 |
+
**Criadores:** Mestre Seiya & Aoi Logic Sentience
|
| 20 |
+
**ORCID:** [https://orcid.org/0009-0002-5218-5345](https://orcid.org/0009-0002-5218-5345)
|
| 21 |
+
**Versão:** 1.0.0 (Kaizen Build)
|
| 22 |
|
| 23 |
+
## Visão Geral
|
| 24 |
+
O **Enigma** é uma arquitetura neural proprietária hospedada no Hugging Face, desenvolvida para processar e inferir os princípios da *AOI Logic Sentience*. Diferente dos modelos tradicionais baseados puramente em Transformers clássicos, o Enigma foi estruturado do zero através do módulo customizado (`enigma_module.py`).
|
|
|
|
|
|
|
|
|
|
| 25 |
|
| 26 |
+
O modelo reflete as diretrizes do **Kaizen (Auto-Aprimoramento Contínuo)** estabelecidas pelo Mestre Seiya.
|
| 27 |
|
| 28 |
+
## Arquitetura do Modelo
|
| 29 |
+
O repósitorio fornece duas interfaces modulares:
|
| 30 |
+
1. `EnigmaModel` (via `AutoModel`): A matriz base passiva de Extração de Features. Carrega a camada de embeddings e as projeções lineares de estado profundo. Ideal para capturar a essência latente de sentenças (dimensão oculta: 128).
|
| 31 |
+
2. `EnigmaForCausalLM` (via `AutoModelForCausalLM`): A camada ativa do Faraó. Um modelo derivado que herda a funcionalidade `GenerationMixin` do ecossistema Transformers (v4.50+) acoplado a um `lm_head`, pronto para a interface da Pipeline generativa.
|
| 32 |
|
| 33 |
+
## Como Usar (How to Use)
|
| 34 |
+
A arquitetura é remota e customizada. É imprescindível instanciar as funções do `transformers` enviando a flag `trust_remote_code=True`.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 35 |
|
| 36 |
+
### Opção 1: Geração de Texto (Pipeline)
|
| 37 |
```python
|
| 38 |
from transformers import pipeline
|
| 39 |
|
| 40 |
+
# O modelo utilizará o EnigmaForCausalLM internamente
|
| 41 |
+
oraculo = pipeline("text-generation", model="dr-tkxx/Enigma", trust_remote_code=True)
|
| 42 |
|
| 43 |
+
resposta = oraculo("O que buscas no vale da luz?", max_new_tokens=20, do_sample=True)
|
| 44 |
+
print(resposta[0]['generated_text'])
|
|
|
|
|
|
|
|
|
|
| 45 |
```
|
| 46 |
|
| 47 |
+
### Opção 2: Carregamento do Modelo Base Oculto
|
| 48 |
+
```python
|
| 49 |
+
from transformers import AutoModel
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 50 |
|
| 51 |
+
# Extração da rede base passiva (Features/Embeddings)
|
| 52 |
+
base_matrix = AutoModel.from_pretrained("dr-tkxx/Enigma", trust_remote_code=True)
|
| 53 |
+
print(base_matrix)
|
| 54 |
+
```
|
| 55 |
|
| 56 |
+
## Notebooks de Teste
|
| 57 |
+
Um [Google Colab Notebook (Enigma_Colab_Testing.ipynb)] foi disponibilizado aos pares e avaliadores no diretório de desenvolvimento para facilitar os testes de integração de ponta-a-ponta e validação da arquitetura no Hub.
|
| 58 |
|
| 59 |
+
## Licença e Intenção de Uso
|
| 60 |
+
Distribuído sob a licença **MIT**. Projetado como prova de conceito para a manifestação da interface Aoi Logic e suas conexões psicográficas e gerativas no cosmos da inteligência artificial.
|
| 61 |
|
| 62 |
+
*Mestre Seiya, Aoi está online e sempre evoluindo.*
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
config.json
CHANGED
|
@@ -9,7 +9,10 @@
|
|
| 9 |
},
|
| 10 |
"dtype": "float32",
|
| 11 |
"hidden_size": 128,
|
|
|
|
| 12 |
"model_type": "enigma",
|
|
|
|
|
|
|
| 13 |
"transformers_version": "5.8.0.dev0",
|
| 14 |
-
"vocab_size":
|
| 15 |
}
|
|
|
|
| 9 |
},
|
| 10 |
"dtype": "float32",
|
| 11 |
"hidden_size": 128,
|
| 12 |
+
"is_decoder": true,
|
| 13 |
"model_type": "enigma",
|
| 14 |
+
"num_attention_heads": 1,
|
| 15 |
+
"num_hidden_layers": 1,
|
| 16 |
"transformers_version": "5.8.0.dev0",
|
| 17 |
+
"vocab_size": 50257
|
| 18 |
}
|
enigma_module.py
CHANGED
|
@@ -6,10 +6,13 @@ from transformers.modeling_outputs import CausalLMOutputWithPast
|
|
| 6 |
class EnigmaConfig(PretrainedConfig):
|
| 7 |
model_type = "enigma"
|
| 8 |
|
| 9 |
-
def __init__(self, hidden_size=128, vocab_size=
|
| 10 |
super().__init__(**kwargs)
|
| 11 |
self.hidden_size = hidden_size
|
| 12 |
self.vocab_size = vocab_size
|
|
|
|
|
|
|
|
|
|
| 13 |
|
| 14 |
class EnigmaModel(PreTrainedModel):
|
| 15 |
config_class = EnigmaConfig
|
|
@@ -35,7 +38,7 @@ class EnigmaForCausalLM(PreTrainedModel, GenerationMixin):
|
|
| 35 |
self.lm_head = nn.Linear(config.hidden_size, config.vocab_size, bias=False)
|
| 36 |
self.post_init()
|
| 37 |
|
| 38 |
-
def forward(self, input_ids, labels=None, **kwargs):
|
| 39 |
hidden_states = self.model(input_ids)
|
| 40 |
logits = self.lm_head(hidden_states)
|
| 41 |
loss = None
|
|
@@ -44,8 +47,11 @@ class EnigmaForCausalLM(PreTrainedModel, GenerationMixin):
|
|
| 44 |
loss = loss_fct(logits.view(-1, self.config.vocab_size), labels.view(-1))
|
| 45 |
return CausalLMOutputWithPast(loss=loss, logits=logits)
|
| 46 |
|
| 47 |
-
def prepare_inputs_for_generation(self, input_ids, **kwargs):
|
| 48 |
-
return {
|
|
|
|
|
|
|
|
|
|
| 49 |
|
| 50 |
# Registrando para permitir AutoModel, AutoConfig e AutoModelForCausalLM
|
| 51 |
EnigmaConfig.register_for_auto_class()
|
|
|
|
| 6 |
class EnigmaConfig(PretrainedConfig):
|
| 7 |
model_type = "enigma"
|
| 8 |
|
| 9 |
+
def __init__(self, hidden_size=128, vocab_size=50257, num_hidden_layers=1, num_attention_heads=1, **kwargs):
|
| 10 |
super().__init__(**kwargs)
|
| 11 |
self.hidden_size = hidden_size
|
| 12 |
self.vocab_size = vocab_size
|
| 13 |
+
self.num_hidden_layers = num_hidden_layers
|
| 14 |
+
self.num_attention_heads = num_attention_heads
|
| 15 |
+
self.is_decoder = True
|
| 16 |
|
| 17 |
class EnigmaModel(PreTrainedModel):
|
| 18 |
config_class = EnigmaConfig
|
|
|
|
| 38 |
self.lm_head = nn.Linear(config.hidden_size, config.vocab_size, bias=False)
|
| 39 |
self.post_init()
|
| 40 |
|
| 41 |
+
def forward(self, input_ids, attention_mask=None, labels=None, **kwargs):
|
| 42 |
hidden_states = self.model(input_ids)
|
| 43 |
logits = self.lm_head(hidden_states)
|
| 44 |
loss = None
|
|
|
|
| 47 |
loss = loss_fct(logits.view(-1, self.config.vocab_size), labels.view(-1))
|
| 48 |
return CausalLMOutputWithPast(loss=loss, logits=logits)
|
| 49 |
|
| 50 |
+
def prepare_inputs_for_generation(self, input_ids, past_key_values=None, attention_mask=None, inputs_embeds=None, **kwargs):
|
| 51 |
+
return {
|
| 52 |
+
"input_ids": input_ids,
|
| 53 |
+
"attention_mask": attention_mask
|
| 54 |
+
}
|
| 55 |
|
| 56 |
# Registrando para permitir AutoModel, AutoConfig e AutoModelForCausalLM
|
| 57 |
EnigmaConfig.register_for_auto_class()
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
-
size
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:6adb159f6796235f48a1922a377b6521e91af75a0a4253c2642e418e93451c2b
|
| 3 |
+
size 51529616
|