Spaces:

harvesthealth
/

secondme-api

Sleeping

File size: 20,650 Bytes

01d5a5d

#!/usr/bin/env python3

import unittest
from pathlib import Path
import os
import sys

# Necessary to load the local gguf package
if (
    "NO_LOCAL_GGUF" not in os.environ
    and (Path(__file__).parent.parent.parent / "gguf-py").exists()
):
    sys.path.insert(0, str(Path(__file__).parent.parent))

import gguf


class TestMetadataMethod(unittest.TestCase):
    def test_id_to_title(self):
        self.assertEqual(
            gguf.Metadata.id_to_title("Mixtral-8x7B-Instruct-v0.1"),
            "Mixtral 8x7B Instruct v0.1",
        )
        self.assertEqual(
            gguf.Metadata.id_to_title("Meta-Llama-3-8B"), "Meta Llama 3 8B"
        )
        self.assertEqual(
            gguf.Metadata.id_to_title("hermes-2-pro-llama-3-8b-DPO"),
            "Hermes 2 Pro Llama 3 8b DPO",
        )

    def test_get_model_id_components(self):
        # This is the basic standard form with organization marker
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mistral/Mixtral-8x7B-Instruct-v0.1"),
            (
                "Mixtral-8x7B-Instruct-v0.1",
                "Mistral",
                "Mixtral",
                "Instruct",
                "v0.1",
                "8x7B",
            ),
        )

        # Similar to basic standard form but without organization marker
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral-8x7B-Instruct-v0.1"),
            ("Mixtral-8x7B-Instruct-v0.1", None, "Mixtral", "Instruct", "v0.1", "8x7B"),
        )

        # Missing version
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral-8x7B-Instruct"),
            ("Mixtral-8x7B-Instruct", None, "Mixtral", "Instruct", None, "8x7B"),
        )

        # Missing finetune
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral-8x7B-v0.1"),
            ("Mixtral-8x7B-v0.1", None, "Mixtral", None, "v0.1", "8x7B"),
        )

        # Base name and size label only
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral-8x7B"),
            ("Mixtral-8x7B", None, "Mixtral", None, None, "8x7B"),
        )

        # Base name and version only
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral-v0.1"),
            ("Mixtral-v0.1", None, "Mixtral", None, "v0.1", None),
        )

        ## Edge Cases ##

        # This is too ambiguous... best to err on caution and output nothing
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Mixtral"),
            ("Mixtral", None, None, None, None, None),
        )

        # Basename has numbers mixed in and also size label provided. Must avoid capturing number in basename
        self.assertEqual(
            gguf.Metadata.get_model_id_components("NousResearch/Meta-Llama-3-8B"),
            ("Meta-Llama-3-8B", "NousResearch", "Meta-Llama-3", None, None, "8B"),
        )

        # Non standard naming
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Qwen1.5-MoE-A2.7B-Chat"),
            ("Qwen1.5-MoE-A2.7B-Chat", None, "Qwen1.5-MoE", "Chat", None, "A2.7B"),
        )

        # Capture 'sub size labels' e.g. A14B in '57B-A14B' usually refers to activated params/weight count
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Qwen2-57B-A14B-Instruct"),
            ("Qwen2-57B-A14B-Instruct", None, "Qwen2", "Instruct", None, "57B-A14B"),
        )

        # Check that it can handle a real model id with no version code
        # Note that 4k in this string is non standard and microsoft were referring to context length rather than weight count
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "microsoft/Phi-3-mini-4k-instruct", 4 * 10**9
            ),
            (
                "Phi-3-mini-4k-instruct",
                "microsoft",
                "Phi-3",
                "4k-instruct",
                None,
                "mini",
            ),
        )

        # There is some legitimate models with only thousands of parameters
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "delphi-suite/stories-llama2-50k", 50 * 10**3
            ),
            ("stories-llama2-50k", "delphi-suite", "stories-llama2", None, None, "50K"),
        )

        # Non standard and not easy to disambiguate
        self.assertEqual(
            gguf.Metadata.get_model_id_components("DeepSeek-Coder-V2-Lite-Instruct"),
            (
                "DeepSeek-Coder-V2-Lite-Instruct",
                None,
                "DeepSeek-Coder-V2-Lite",
                "Instruct",
                None,
                None,
            ),
        )

        # This is a real model_id where they append 2DPO to refer to Direct Preference Optimization
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "crestf411/daybreak-kunoichi-2dpo-7b"
            ),
            (
                "daybreak-kunoichi-2dpo-7b",
                "crestf411",
                "daybreak-kunoichi",
                "2dpo",
                None,
                "7B",
            ),
        )

        # This is a real model id where the weight size has a decimal point
        self.assertEqual(
            gguf.Metadata.get_model_id_components("Qwen2-0.5B-Instruct"),
            ("Qwen2-0.5B-Instruct", None, "Qwen2", "Instruct", None, "0.5B"),
        )

        # Uses an underscore in the size label
        self.assertEqual(
            gguf.Metadata.get_model_id_components("smallcloudai/Refact-1_6B-fim"),
            ("Refact-1_6B-fim", "smallcloudai", "Refact", "fim", None, "1.6B"),
        )

        # Uses Iter3 for the version
        self.assertEqual(
            gguf.Metadata.get_model_id_components("UCLA-AGI/Gemma-2-9B-It-SPPO-Iter3"),
            (
                "Gemma-2-9B-It-SPPO-Iter3",
                "UCLA-AGI",
                "Gemma-2",
                "It-SPPO",
                "Iter3",
                "9B",
            ),
        )

        # Has two potential versions in the basename
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "NousResearch/Hermes-2-Theta-Llama-3-8B"
            ),
            (
                "Hermes-2-Theta-Llama-3-8B",
                "NousResearch",
                "Hermes-2-Theta-Llama-3",
                None,
                None,
                "8B",
            ),
        )

        # Potential version in the basename
        self.assertEqual(
            gguf.Metadata.get_model_id_components("SeaLLMs/SeaLLMs-v3-7B-Chat"),
            ("SeaLLMs-v3-7B-Chat", "SeaLLMs", "SeaLLMs-v3", "Chat", None, "7B"),
        )

        # Underscore in the basename, and 1m for the context size
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "internlm/internlm2_5-7b-chat-1m", 7 * 10**9
            ),
            (
                "internlm2_5-7b-chat-1m",
                "internlm",
                "internlm2_5",
                "chat-1m",
                None,
                "7B",
            ),
        )

        # Version before the finetune name
        self.assertEqual(
            gguf.Metadata.get_model_id_components("pszemraj/jamba-900M-v0.13-KIx2"),
            ("jamba-900M-v0.13-KIx2", "pszemraj", "jamba", "KIx2", "v0.13", "900M"),
        )

        # TODO: hf suffix which could be ignored but isn't
        self.assertEqual(
            gguf.Metadata.get_model_id_components("state-spaces/mamba-2.8b-hf"),
            ("mamba-2.8b-hf", "state-spaces", "mamba", "hf", None, "2.8B"),
        )

        # Two sizes, don't merge them, the other is the number of tokens on which it was trained
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "abacaj/llama-161M-100B", 161 * 10**6
            ),
            ("llama-161M-100B", "abacaj", "llama", "100b", None, "161M"),
        )

        # It's a trap, there is no size label
        self.assertEqual(
            gguf.Metadata.get_model_id_components("SparseLLM/relu-100B", 1340 * 10**6),
            ("relu-100B", "SparseLLM", "relu", "100b", None, None),
        )

        # Weird size notation
        self.assertEqual(
            gguf.Metadata.get_model_id_components("bigscience/bloom-7b1-petals"),
            ("bloom-7b1-petals", "bigscience", "bloom", "petals", None, "7.1B"),
        )

        # Ignore full-text size labels when there are number-based ones, and deduplicate size labels
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "MaziyarPanahi/GreenNode-mini-7B-multilingual-v1olet-Mistral-7B-Instruct-v0.1"
            ),
            (
                "GreenNode-mini-7B-multilingual-v1olet-Mistral-7B-Instruct-v0.1",
                "MaziyarPanahi",
                "GreenNode-mini",
                "multilingual-v1olet-Mistral-Instruct",
                "v0.1",
                "7B",
            ),
        )

        # Instruct in a name without a size label
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "mistralai/Mistral-Nemo-Instruct-2407"
            ),
            (
                "Mistral-Nemo-Instruct-2407",
                "mistralai",
                "Mistral-Nemo",
                "Instruct",
                "2407",
                None,
            ),
        )

        # Non-obvious splitting relying on 'chat' keyword
        self.assertEqual(
            gguf.Metadata.get_model_id_components("deepseek-ai/DeepSeek-V2-Chat-0628"),
            (
                "DeepSeek-V2-Chat-0628",
                "deepseek-ai",
                "DeepSeek-V2",
                "Chat",
                "0628",
                None,
            ),
        )

        # Multiple versions
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "OpenGVLab/Mini-InternVL-Chat-2B-V1-5"
            ),
            (
                "Mini-InternVL-Chat-2B-V1-5",
                "OpenGVLab",
                "Mini-InternVL",
                "Chat",
                "V1-5",
                "2B",
            ),
        )

        # TODO: DPO in the name
        self.assertEqual(
            gguf.Metadata.get_model_id_components("jondurbin/bagel-dpo-2.8b-v0.2"),
            ("bagel-dpo-2.8b-v0.2", "jondurbin", "bagel-dpo", None, "v0.2", "2.8B"),
        )

        # DPO in name, but can't be used for the finetune to keep 'LLaMA-3' in the basename
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "voxmenthe/SFR-Iterative-DPO-LLaMA-3-8B-R-unquantized"
            ),
            (
                "SFR-Iterative-DPO-LLaMA-3-8B-R-unquantized",
                "voxmenthe",
                "SFR-Iterative-DPO-LLaMA-3",
                "R-unquantized",
                None,
                "8B",
            ),
        )

        # Too ambiguous
        # TODO: should "base" be a 'finetune' or 'size_label'?
        # (in this case it should be a size label, but other models use it to signal that they are not finetuned)
        self.assertEqual(
            gguf.Metadata.get_model_id_components("microsoft/Florence-2-base"),
            ("Florence-2-base", "microsoft", None, None, None, None),
        )

        ## Invalid cases ##

        # Start with a dash and has dashes in rows
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "mistralai/-Mistral--Nemo-Base-2407-"
            ),
            (
                "-Mistral--Nemo-Base-2407-",
                "mistralai",
                "Mistral-Nemo-Base",
                None,
                "2407",
                None,
            ),
        )

        ## LoRA ##

        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "Llama-3-Instruct-abliteration-LoRA-8B"
            ),
            (
                "Llama-3-Instruct-abliteration-LoRA-8B",
                None,
                "Llama-3",
                "Instruct-abliteration-LoRA",
                None,
                "8B",
            ),
        )

        # Negative size --> output is a LoRA adaper --> prune "LoRA" out of the name to avoid redundancy with the suffix
        self.assertEqual(
            gguf.Metadata.get_model_id_components(
                "Llama-3-Instruct-abliteration-LoRA-8B", -1234
            ),
            (
                "Llama-3-Instruct-abliteration-LoRA-8B",
                None,
                "Llama-3",
                "Instruct-abliteration",
                None,
                "8B",
            ),
        )

    def test_apply_metadata_heuristic_from_model_card(self):
        model_card = {
            "tags": [
                "Llama-3",
                "instruct",
                "finetune",
                "chatml",
                "DPO",
                "RLHF",
                "gpt4",
                "synthetic data",
                "distillation",
                "function calling",
                "json mode",
                "axolotl",
            ],
            "model-index": [{"name": "Mixtral-8x7B-Instruct-v0.1", "results": []}],
            "language": ["en"],
            "datasets": ["teknium/OpenHermes-2.5"],
            "widget": [
                {
                    "example_title": "Hermes 2 Pro",
                    "messages": [
                        {
                            "role": "system",
                            "content": "You are a sentient, superintelligent artificial general intelligence, here to teach and assist me.",
                        },
                        {
                            "role": "user",
                            "content": "Write a short story about Goku discovering kirby has teamed up with Majin Buu to destroy the world.",
                        },
                    ],
                }
            ],
            "base_model": ["EmbeddedLLM/Mistral-7B-Merge-14-v0", "janai-hq/trinity-v1"],
        }
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        expect = gguf.Metadata()
        expect.base_models = [
            {
                "name": "Mistral 7B Merge 14 v0",
                "organization": "EmbeddedLLM",
                "version": "14-v0",
                "repo_url": "https://huggingface.co/EmbeddedLLM/Mistral-7B-Merge-14-v0",
            },
            {
                "name": "Trinity v1",
                "organization": "Janai Hq",
                "version": "v1",
                "repo_url": "https://huggingface.co/janai-hq/trinity-v1",
            },
        ]
        expect.tags = [
            "Llama-3",
            "instruct",
            "finetune",
            "chatml",
            "DPO",
            "RLHF",
            "gpt4",
            "synthetic data",
            "distillation",
            "function calling",
            "json mode",
            "axolotl",
        ]
        expect.languages = ["en"]
        expect.datasets = [
            {
                "name": "OpenHermes 2.5",
                "organization": "Teknium",
                "version": "2.5",
                "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
            }
        ]
        self.assertEqual(got, expect)

        # Base Model spec is inferred from model id
        model_card = {"base_models": "teknium/OpenHermes-2.5"}
        expect = gguf.Metadata(
            base_models=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

        # Base Model spec is only url
        model_card = {"base_models": ["https://huggingface.co/teknium/OpenHermes-2.5"]}
        expect = gguf.Metadata(
            base_models=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

        # Base Model spec is given directly
        model_card = {
            "base_models": [
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        }
        expect = gguf.Metadata(
            base_models=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

        # Dataset spec is inferred from model id
        model_card = {"datasets": "teknium/OpenHermes-2.5"}
        expect = gguf.Metadata(
            datasets=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

        # Dataset spec is only url
        model_card = {"datasets": ["https://huggingface.co/teknium/OpenHermes-2.5"]}
        expect = gguf.Metadata(
            datasets=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

        # Dataset spec is given directly
        model_card = {
            "datasets": [
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        }
        expect = gguf.Metadata(
            datasets=[
                {
                    "name": "OpenHermes 2.5",
                    "organization": "Teknium",
                    "version": "2.5",
                    "repo_url": "https://huggingface.co/teknium/OpenHermes-2.5",
                }
            ]
        )
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card, None, None
        )
        self.assertEqual(got, expect)

    def test_apply_metadata_heuristic_from_hf_parameters(self):
        hf_params = {"_name_or_path": "./hermes-2-pro-llama-3-8b-DPO"}
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card=None, hf_params=hf_params, model_path=None
        )
        expect = gguf.Metadata(
            name="Hermes 2 Pro Llama 3 8b DPO",
            finetune="DPO",
            basename="hermes-2-pro-llama-3",
            size_label="8B",
        )
        self.assertEqual(got, expect)

    def test_apply_metadata_heuristic_from_model_dir(self):
        model_dir_path = Path("./hermes-2-pro-llama-3-8b-DPO")
        got = gguf.Metadata.apply_metadata_heuristic(
            gguf.Metadata(), model_card=None, hf_params=None, model_path=model_dir_path
        )
        expect = gguf.Metadata(
            name="Hermes 2 Pro Llama 3 8b DPO",
            finetune="DPO",
            basename="hermes-2-pro-llama-3",
            size_label="8B",
        )
        self.assertEqual(got, expect)


if __name__ == "__main__":
    unittest.main()