Ateeqq
/

product-description-generator

Text Generation

text2text-generation

text-generation-inference

Model card Files Files and versions

Ateeqq commited on Jul 5, 2024

Commit

15da904

·

verified ·

1 Parent(s): 3a8cadd

Update README.md

Files changed (1) hide show

README.md +4 -11

README.md CHANGED Viewed

@@ -27,9 +27,7 @@ datasets:
 ## Overview
-This repository contains a fine-tuned model for generating high-quality product descriptions. The model is based on the `t5-base` and has 223 million parameters. It has been fine-tuned on the Amazon Product Dataset, which contains 10 million examples, with the cleaned version having 0.5 million examples. This is a test version trained on 0.1 million examples, and it will be updated to the latest 0.5 million cleaned examples soon.
-Developed by team at https://exnrt.com
 ## Usage
@@ -91,12 +89,7 @@ generate_description(title)
 ## Features
 - **Architecture**: t5-base (223M parameters)
-- **Dataset**: Amazon Product Dataset
-  - **Original**: 10 million examples
-  - **Cleaned**: 0.5 million examples
-- **Training**:
-  - **Current Version**: Trained on 0.1 million cleaned examples
-  - **Upcoming Update**: Will be trained on 0.5 million cleaned examples
 - **Training Time**:
   - **Hardware**: Colab T4 GPU
   - **Speed**: 4.91 iterations/second
@@ -110,8 +103,8 @@ generate_description(title)
 ## Data Preparation
-- **Training Data**: First 100,000 examples from `train`
-- **Evaluation Data**: First 10,000 examples from `test`
 - **Source Max Token Length**: 50
 - **Target Max Token Length**: 300
 - **Batch Size**: 1

 ## Overview
+This repository contains a fine-tuned model for generating high-quality product descriptions. The model is based on the `t5-base` and has 223 million parameters. It has been fine-tuned on the Amazon Product Dataset, which contains 10 million examples, with the cleaned version having 0.5 million examples.
 ## Usage
 ## Features
 - **Architecture**: t5-base (223M parameters)
+- **Training Dataset**: Trained on 0.5 million cleaned examples
 - **Training Time**:
   - **Hardware**: Colab T4 GPU
   - **Speed**: 4.91 iterations/second
 ## Data Preparation
+- **Training Data**: First 250,000 examples for `train`
+- **Validation Data**: First 40,000 examples for `validation`
 - **Source Max Token Length**: 50
 - **Target Max Token Length**: 300
 - **Batch Size**: 1