lxcorp
/

WNL468M

@@ -1,202 +1,134 @@
 ---
 base_model: nicholasKluge/TeenyTinyLlama-460m
-library_name: peft
 ---
-# Model Card for Model ID
-<!-- Provide a quick summary of what the model is/does. -->
-## Model Details
-### Model Description
-<!-- Provide a longer summary of what this model is. -->
-- **Developed by:** [More Information Needed]
-- **Funded by [optional]:** [More Information Needed]
-- **Shared by [optional]:** [More Information Needed]
-- **Model type:** [More Information Needed]
-- **Language(s) (NLP):** [More Information Needed]
-- **License:** [More Information Needed]
-- **Finetuned from model [optional]:** [More Information Needed]
-### Model Sources [optional]
-<!-- Provide the basic links for the model. -->
-- **Repository:** [More Information Needed]
-- **Paper [optional]:** [More Information Needed]
-- **Demo [optional]:** [More Information Needed]
-## Uses
-<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
-### Direct Use
-<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
-[More Information Needed]
-### Downstream Use [optional]
-<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
-[More Information Needed]
-### Out-of-Scope Use
-<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
-[More Information Needed]
-## Bias, Risks, and Limitations
-<!-- This section is meant to convey both technical and sociotechnical limitations. -->
-[More Information Needed]
-### Recommendations
-<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
-Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
-## How to Get Started with the Model
-Use the code below to get started with the model.
-[More Information Needed]
-## Training Details
-### Training Data
-<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
-[More Information Needed]
-### Training Procedure
-<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
-#### Preprocessing [optional]
-[More Information Needed]
-#### Training Hyperparameters
-- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
-#### Speeds, Sizes, Times [optional]
-<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
-[More Information Needed]
-## Evaluation
-<!-- This section describes the evaluation protocols and provides the results. -->
-### Testing Data, Factors & Metrics
-#### Testing Data
-<!-- This should link to a Dataset Card if possible. -->
-[More Information Needed]
-#### Factors
-<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
-[More Information Needed]
-#### Metrics
-<!-- These are the evaluation metrics being used, ideally with a description of why. -->
-[More Information Needed]
-### Results
-[More Information Needed]
-#### Summary
-## Model Examination [optional]
-<!-- Relevant interpretability work for the model goes here -->
-[More Information Needed]
-## Environmental Impact
-<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
-Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
-- **Hardware Type:** [More Information Needed]
-- **Hours used:** [More Information Needed]
-- **Cloud Provider:** [More Information Needed]
-- **Compute Region:** [More Information Needed]
-- **Carbon Emitted:** [More Information Needed]
-## Technical Specifications [optional]
-### Model Architecture and Objective
-[More Information Needed]
-### Compute Infrastructure
-[More Information Needed]
-#### Hardware
-[More Information Needed]
-#### Software
-[More Information Needed]
-## Citation [optional]
-<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
-**BibTeX:**
-[More Information Needed]
-**APA:**
-[More Information Needed]
-## Glossary [optional]
-<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
-[More Information Needed]
-## More Information [optional]
-[More Information Needed]
-## Model Card Authors [optional]
-[More Information Needed]
-## Model Card Contact
-[More Information Needed]
-### Framework versions
-- PEFT 0.15.2

 ---
 base_model: nicholasKluge/TeenyTinyLlama-460m
+library_name: transformers
+license: cc-by-nc-nd-4.0
+language:
+- pt
+pipeline_tag: text-generation
+datasets:
+- cnmoro/LogicReasoningEnglishPortuguese
+metrics:
+- accuracy
 ---
+# 🧠 WNL468M — Modelo de Raciocínio Lógico em Português para Ensino e Educação
+**WNL268M** é um modelo de linguagem com aproximadamente **268 milhões de parâmetros**, desenvolvido especialmente para tarefas de **raciocínio lógico** e compreensão em **português**, com foco em **ensino, educação e suporte acadêmico**. Este projeto foi inspirado e criado para um **projeto acadêmico** de destaque em uma **feira de ciências**, com o objetivo de contribuir para o avanço do ensino de inteligência artificial aplicada ao idioma português.
+## ✨ Origem do Nome
+**WNL** é uma homenagem a três colegas que foram a inspiração inicial para o projeto:
+- **W** — Weia
+- **N** — Nauria
+- **L** — Leonilda
+Embora elas não participem diretamente, seus nomes simbolizam a motivação que deu origem ao desenvolvimento do modelo.
+## 👥 Equipe Fundadora
+- Marius Jabami – Desenvolvedor principal, integração com modelo, lógica central e liderança técnica
+- Ilson Lopes – Apoio geral ao desenvolvimento e testes técnicos
+- Délcio Pro – Interface visual (Kivy), processamento de texto, usabilidade
+- José Bukete – Lógica do chat em Kivy, controle de eventos e exibição de mensagens
+- Fernando Queta – Integração com modelo Transformers, geração de respostas
+- Inácio Oicani – Histórico de conversa, normalização de texto, refinamento de UI/UX
+- Daniel Raimundo – Estilo visual, fontes, cores, animações e experiência do usuário
+- Celsio Simplício – Testes, simulações, depuração e melhoria de desempenho
+- Arsênio Afonso – Suporte em testes e revisão técnica
+- Cristiano Jomba – Testes diversos, análise de comportamento do chatbot
+## 🧩 Dataset Utilizado
+O modelo foi finamente ajustado utilizando o dataset:
+📚 [`cnmoro/LogicReasoningEnglishPortuguese`](https://huggingface.co/datasets/cnmoro/LogicReasoningEnglishPortuguese)
+Este conjunto bilíngue contém pares de perguntas e respostas que exigem **raciocínio lógico**, proporcionando uma base robusta para treinar o modelo em tarefas de compreensão, dedução e resposta estruturada, essenciais para aplicações educacionais.
+## 🔍 Informações Técnicas Detalhadas
+- **Parâmetros:** ~468 milhões
+- **Arquitetura Base:** Adaptada do LLaMA, conhecida pela eficiência em tarefas de linguagem natural
+- **Tokenizador:** SentencePiece (formato LLaMA)
+- **Método de Treinamento:** Fine-tuning com LoRA, seguido de mesclagem dos pesos para otimização
+- **Framework:** PyTorch com Hugging Face Transformers
+- **Tipo de Modelo:** Causal Language Model (modelo generativo para texto)
+- **Idiomas:** Português (principal), com suporte a dados em inglês do dataset bilíngue
+- **Uso:** Aplicações educacionais, chatbots acadêmicos, ferramentas de ensino e suporte ao raciocínio lógico
+## 🎯 Propósito e Aplicações
+O **WNL268M** foi desenvolvido com foco pedagógico, visando:
+- Facilitar o aprendizado e o ensino de lógica e raciocínio no idioma português
+- Servir como base para projetos acadêmicos e feiras de ciências, mostrando a viabilidade de modelos customizados para educação
+- Criar ferramentas interativas que ajudem estudantes e educadores a explorarem conceitos complexos de forma acessível e inteligente
+- Demonstrar que projetos de IA podem ser desenvolvidos colaborativamente em ambientes educacionais
+## 💻 Como Usar o Modelo
+```python
+from transformers import AutoTokenizer, AutoModelForCausalLM, TextStreamer
+import torch
+repo_id = "lambdaindie/WNL468M"
+tokenizer = AutoTokenizer.from_pretrained(repo_id)
+model = AutoModelForCausalLM.from_pretrained(repo_id, device_map="auto", torch_dtype=torch.float16)
+model.eval()
+streamer = TextStreamer(tokenizer)
+while True:
+    prompt = input("Você: ")
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    _ = model.generate(**inputs, max_new_tokens=100, streamer=streamer)
+```
+🚀 Próximos Passos
+Ampliação do dataset com mais exemplos em português
+Desenvolvimento de versões maiores com foco em domínio acadêmico específico
+Integração com plataformas educacionais para testes reais em sala de aula
+---
+Criado com dedicação, conhecimento e fé no futuro da educação.
+Equipe fundadora empenhada em transformar aprendizado através da inteligência artificial.
+---
+## 🔒 Licença
+Este modelo está licenciado sob:
+**[CC BY-NC-ND 4.0 (Creative Commons Attribution-NonCommercial-NoDerivatives 4.0)](https://creativecommons.org/licenses/by-nc-nd/4.0/deed.pt)**
+Você é livre para:
+- Compartilhar — copiar e redistribuir o material em qualquer meio ou formato
+Desde que siga os termos:
+- **Atribuição** — Deve creditar os autores (ver seção "Equipe Fundadora").
+- **Não Comercial** — Não pode usar o material para fins comerciais.
+- **Sem Derivações** — Não pode remixar, transformar ou criar a partir do material.
+Este modelo é exclusivo para fins **acadêmicos e educacionais**.
+---