Spaces:

MCP-1st-Birthday
/

ragmint-mcp-server

Running

File size: 5,145 Bytes

59e6760

from typing import Optional, List, Dict, Any
from pydantic import BaseModel, Field



# Models
class OptimizeRequest(BaseModel):
    """
    🔧 Explicit optimization request: user provides all pipeline configs manually.
    """
    docs_path: Optional[str] = Field(
        default="data/docs",
        description="📂 Folder containing your documents for RAG optimization. Example: 'data/docs'"
    )
    retriever: Optional[List[str]] = Field(
        description="🔍 Retriever type to use. Example: 'bm25', 'faiss', 'chroma'",
        default=['faiss']
    )
    embedding_model: Optional[List[str]] = Field(
        description="🧠 Embedding model name or path. Example: 'sentence-transformers/all-MiniLM-L6-v2'",
        default=['sentence-transformers/all-MiniLM-L6-v2']
    )
    strategy: Optional[List[str]] = Field(
        description="🎯 RAG strategy name. Example: 'fixed', 'token', 'sentence'",
        default=['fixed']
    )
    chunk_sizes: Optional[List[int]] = Field(
        description="📏 List of chunk sizes to evaluate. Example: [200, 400, 600]",
        default=[200, 400, 600]
    )
    overlaps: Optional[List[int]] = Field(
        description="🔁 List of overlap values to test. Example: [50, 100, 200]",
        default = [50, 100, 200]
    )
    rerankers: Optional[List[str]] = Field(
        default=["mmr"],
        description="⚖️ Rerankers to apply after retrieval. Default: ['mmr']"
    )
    search_type: Optional[str] = Field(
        default="grid",
        description="🔍 Search method to explore parameter space. Options: 'grid', 'random', 'bayesian'"
    )
    trials: Optional[int] = Field(
        default=5,
        description="🧪 Number of optimization trials to run."
    )
    metric: Optional[str] = Field(
        default="faithfulness",
        description="📈 Evaluation metric for optimization. Options: 'faithfulness'"
    )
    validation_choice: Optional[str] = Field(
        default='generate',
        description=(
            "✅ Validation data source. Options:\n"
            "  - Leave blank → use default 'validation_qa.json' if available\n"
            "  - 'generate' → auto-generate a validation QA file from your docs\n"
            "  - Path to a local JSON file (e.g. 'data/validation_qa.json')\n"
            "  - Hugging Face dataset ID (e.g. 'squad')"
        )
    )
    llm_model: Optional[str] = Field(
        default="gemini-2.5-flash-lite",
        description="🤖 LLM used to generate QA dataset when validation_choice='generate'. Example: 'gemini-pro', 'gpt-4o-mini'"
    )



class AutotuneRequest(BaseModel):
    docs_path: Optional[str] = Field(
        default="data/docs",
        description="📂 Folder containing your documents for RAG optimization. Example: 'data/docs'"
    )
    embedding_model: Optional[str] = Field(
        default="sentence-transformers/all-MiniLM-L6-v2",
        description="🧠 Embedding model name or path. Example: 'sentence-transformers/all-MiniLM-L6-v2'"
    )
    num_chunk_pairs: Optional[int] = Field(
        default=5,
        description="🔢 Number of chunk pairs to analyze for tuning."
    )
    metric: Optional[str] = Field(
        default="faithfulness",
        description="📈 Evaluation metric for optimization. Options: 'faithfulness'"
    )
    search_type: Optional[str] = Field(
        default="grid",
        description="🔍 Search method to explore parameter space. Options: 'grid', 'random', 'bayesian'"
    )
    trials: Optional[int] = Field(
        default=5,
        description="🧪 Number of optimization trials to run."
    )
    validation_choice: Optional[str] = Field(
        default='generate',
        description=(
            "✅ Validation data source. Options:\n"
            "  - Leave blank → use default 'validation_qa.jsonl' if available\n"
            "  - 'generate' → auto-generate a validation QA file from your docs\n"
            "  - Path to a local JSON file (e.g. 'data/validation_qa.json')\n"
            "  - Hugging Face dataset ID (e.g. 'squad')"
        )
    )
    llm_model: Optional[str] = Field(
        default="gemini-2.5-flash-lite",
        description="🤖 LLM used to generate QA dataset when validation_choice='generate'. Example: 'gemini-pro', 'gpt-4o-mini'"
    )


class QARequest(BaseModel):
    """
    🧩 Generates a validation QA dataset for RAG evaluation.
    """
    docs_path: str = Field(
        description="📂 Folder containing your documents to generate QA pairs from. Example: 'data/docs'",
        default='data/docs'
    )
    llm_model: str = Field(
        default="gemini-2.5-flash-lite",
        description="🤖 LLM model used for question generation. Example: 'gemini-2.5-flash-lite', 'gpt-4o-mini'"
    )
    batch_size: int = Field(
        default=5,
        description="📦 Number of documents processed per generation batch."
    )
    min_q: int = Field(
        default=3,
        description="❓ Minimum number of questions per document."
    )
    max_q: int = Field(
        default=25,
        description="❓ Maximum number of questions per document."
    )