Spaces:

Athmabhiram1
/

nodeaudit-openenv

Sleeping

File size: 5,737 Bytes

from __future__ import annotations

from datetime import UTC, datetime
from enum import StrEnum
from typing import Optional

from sqlmodel import Field, SQLModel


class EdgeType(StrEnum):
    EXPLICIT_IMPORT = "explicit_import"
    IMPLICIT_DEPENDENCY = "implicit_dependency"
    INTRA_FILE = "intra_file"
    CIRCULAR = "circular"


class ReviewStatus(StrEnum):
    PENDING = "pending"
    IN_PROGRESS = "in_progress"
    REVIEWED = "reviewed"


class Severity(StrEnum):
    LOW = "low"
    MEDIUM = "medium"
    HIGH = "high"


class AnalyzerStatus(StrEnum):
    OK = "ok"
    TIMEOUT = "timeout"
    MISSING = "missing"
    PARSE_ERROR = "parse-error"
    NO_OUTPUT = "no-output"


class ModuleNode(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    module_id: str = Field(index=True)
    name: Optional[str] = None
    raw_code: str
    ast_summary: str
    summary: Optional[str] = None
    linter_flags: str = "[]"
    parent_module_id: Optional[str] = Field(default=None, index=True)
    is_chunk: bool = False
    dependency_reason: str = ""
    review_annotation: Optional[str] = None
    review_status: ReviewStatus = Field(default=ReviewStatus.PENDING)
    review_summary: Optional[str] = None
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
    updated_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class ModuleEdge(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    source_module_id: str = Field(index=True)
    target_module_id: str = Field(index=True)
    edge_type: EdgeType = Field(default=EdgeType.EXPLICIT_IMPORT)
    import_line: str
    weight: float = 1.0
    connection_summary: str = ""


class LinterFinding(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    module_id: str = Field(index=True)
    tool: str = Field(index=True)
    line: int
    severity: Severity
    code: str
    message: str


class ReviewAnnotation(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    module_id: str = Field(index=True)
    episode_id: str = Field(index=True)
    task_id: Optional[str] = Field(default=None, index=True)
    step_number: int
    action_type: str
    note: str
    reward_given: float = 0.0
    attributed_to: Optional[str] = Field(default=None, index=True)
    is_amendment: bool = False
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class EpisodeRecord(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    episode_id: str = Field(index=True)
    task_id: str = Field(index=True)
    module_id: str = Field(index=True)
    total_steps: int
    cumulative_reward: float = 0.0
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class TaskDefinition(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    task_id: str = Field(index=True)
    task_level: str = Field(index=True)
    target_module_id: str = Field(index=True)
    description: str
    ground_truth_ref: str


class SeedMeta(SQLModel, table=True):
    key: str = Field(primary_key=True)
    value: str


class AnalyzerRun(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    analyzer: str = Field(index=True)
    analyzer_version: str = ""
    status: AnalyzerStatus = Field(default=AnalyzerStatus.OK)
    findings_count: int = 0
    command: str = ""
    command_hash: str = ""
    error_message: Optional[str] = None
    started_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
    finished_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class AnalyzerFinding(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    analyzer_run_id: int = Field(index=True)
    analyzer: str = Field(index=True)
    module_id: str = Field(index=True)
    line: int
    severity: Severity = Field(default=Severity.MEDIUM)
    rule_id: str = Field(index=True)
    message: str
    evidence: str = ""
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class TrainingRun(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    run_id: str = Field(index=True)
    model_name: str = Field(index=True)
    model_sha256: str = ""
    deterministic_findings: int = 0
    agent_findings: int = 0
    true_positives: int = 0
    false_positives: int = 0
    false_negatives: int = 0
    precision: float = 0.0
    recall: float = 0.0
    passed_non_regression: bool = True
    output_path: str = ""
    run_config_json: str = "{}"
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


class TrainingAnnotation(SQLModel, table=True):
    id: Optional[int] = Field(default=None, primary_key=True)
    source_root: str = Field(index=True)
    run_id: str = Field(index=True)
    module_id: str = Field(index=True)
    task_id: str = Field(index=True)
    judge_verdict: str = ""
    avg_reward: float = 0.0
    correct_attributions_json: str = "[]"
    wrong_attributions_json: str = "[]"
    action_counts_json: str = "{}"
    action_type: str = ""
    action_payload: str = "{}"
    thinking_quality: float = 0.0
    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))