Syed-Hasan-8503
/

phi-2-ORPO

Text Generation

text-generation-inference

Model card Files Files and versions

Syed-Hasan-8503 commited on Mar 17, 2024

Commit

53a21a8

·

verified ·

1 Parent(s): 2309c24

Update README.md

Files changed (1) hide show

README.md +4 -3

README.md CHANGED Viewed

@@ -7,13 +7,14 @@ datasets:
 # Phi-2-ORPO
-**phi2-pro** is a fine-tuned version of **[microsoft/phi-2](https://huggingface.co/microsoft/phi-2)** on **[argilla/dpo-mix-7k](https://huggingface.co/datasets/argilla/dpo-mix-7k)**
 preference dataset using **Odds Ratio Preference Optimization (ORPO)**. The model has been trained for 1 epoch.
 ## LazyORPO
 This model has been trained using **[LazyORPO](https://colab.research.google.com/drive/19ci5XIcJDxDVPY2xC1ftZ5z1kc2ah_rx?usp=sharing)**. A colab notebook that makes the training
-process much easier. Based on [ORPO paper](https://colab.research.google.com/corgiredirector?site=https%3A%2F%2Fhuggingface.co%2Fpapers%2F2403.07691)
 #### What is ORPO?
@@ -37,7 +38,7 @@ torch.set_default_device("cuda")
 model = AutoModelForCausalLM.from_pretrained("abideen/phi2-pro", torch_dtype="auto", trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained("abideen/phi2-pro", trust_remote_code=True)
-inputs = tokenizer('''def print_prime(n):
    """
    Write a detailed analogy between mathematics and a lighthouse.
    """''', return_tensors="pt", return_attention_mask=False)

 # Phi-2-ORPO
+**Phi-2-ORPO** is a fine-tuned version of **[microsoft/phi-2](https://huggingface.co/microsoft/phi-2)** on **[argilla/dpo-mix-7k](https://huggingface.co/datasets/argilla/dpo-mix-7k)**
 preference dataset using **Odds Ratio Preference Optimization (ORPO)**. The model has been trained for 1 epoch.
 ## LazyORPO
 This model has been trained using **[LazyORPO](https://colab.research.google.com/drive/19ci5XIcJDxDVPY2xC1ftZ5z1kc2ah_rx?usp=sharing)**. A colab notebook that makes the training
+process much easier. Based on [ORPO paper](https://colab.research.google.com/corgiredirector?site=https%3A%2F%2Fhuggingface.co%2Fpapers%2F2403.07691). This notebook has been created by
+**[Zain Ul Abideen](https://huggingface.co/abideen)**
 #### What is ORPO?
 model = AutoModelForCausalLM.from_pretrained("abideen/phi2-pro", torch_dtype="auto", trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained("abideen/phi2-pro", trust_remote_code=True)
+inputs = tokenizer('''
    """
    Write a detailed analogy between mathematics and a lighthouse.
    """''', return_tensors="pt", return_attention_mask=False)