Spaces:

Athmabhiram1
/

nodeaudit-openenv

Sleeping

App Files Files Community

nodeaudit-openenv / code-review-env /db /schema.py

shreyas-joshi

Add training scripts and utilities for NodeAudit and GraphReview

902cd29 about 1 month ago

raw

history blame contribute delete

5.74 kB

	from __future__ import annotations

	from datetime import UTC, datetime
	from enum import StrEnum
	from typing import Optional

	from sqlmodel import Field, SQLModel


	class EdgeType(StrEnum):
	EXPLICIT_IMPORT = "explicit_import"
	IMPLICIT_DEPENDENCY = "implicit_dependency"
	INTRA_FILE = "intra_file"
	CIRCULAR = "circular"


	class ReviewStatus(StrEnum):
	PENDING = "pending"
	IN_PROGRESS = "in_progress"
	REVIEWED = "reviewed"


	class Severity(StrEnum):
	LOW = "low"
	MEDIUM = "medium"
	HIGH = "high"


	class AnalyzerStatus(StrEnum):
	OK = "ok"
	TIMEOUT = "timeout"
	MISSING = "missing"
	PARSE_ERROR = "parse-error"
	NO_OUTPUT = "no-output"


	class ModuleNode(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	module_id: str = Field(index=True)
	name: Optional[str] = None
	raw_code: str
	ast_summary: str
	summary: Optional[str] = None
	linter_flags: str = "[]"
	parent_module_id: Optional[str] = Field(default=None, index=True)
	is_chunk: bool = False
	dependency_reason: str = ""
	review_annotation: Optional[str] = None
	review_status: ReviewStatus = Field(default=ReviewStatus.PENDING)
	review_summary: Optional[str] = None
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
	updated_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class ModuleEdge(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	source_module_id: str = Field(index=True)
	target_module_id: str = Field(index=True)
	edge_type: EdgeType = Field(default=EdgeType.EXPLICIT_IMPORT)
	import_line: str
	weight: float = 1.0
	connection_summary: str = ""


	class LinterFinding(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	module_id: str = Field(index=True)
	tool: str = Field(index=True)
	line: int
	severity: Severity
	code: str
	message: str


	class ReviewAnnotation(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	module_id: str = Field(index=True)
	episode_id: str = Field(index=True)
	task_id: Optional[str] = Field(default=None, index=True)
	step_number: int
	action_type: str
	note: str
	reward_given: float = 0.0
	attributed_to: Optional[str] = Field(default=None, index=True)
	is_amendment: bool = False
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class EpisodeRecord(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	episode_id: str = Field(index=True)
	task_id: str = Field(index=True)
	module_id: str = Field(index=True)
	total_steps: int
	cumulative_reward: float = 0.0
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class TaskDefinition(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	task_id: str = Field(index=True)
	task_level: str = Field(index=True)
	target_module_id: str = Field(index=True)
	description: str
	ground_truth_ref: str


	class SeedMeta(SQLModel, table=True):
	key: str = Field(primary_key=True)
	value: str


	class AnalyzerRun(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	analyzer: str = Field(index=True)
	analyzer_version: str = ""
	status: AnalyzerStatus = Field(default=AnalyzerStatus.OK)
	findings_count: int = 0
	command: str = ""
	command_hash: str = ""
	error_message: Optional[str] = None
	started_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
	finished_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class AnalyzerFinding(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	analyzer_run_id: int = Field(index=True)
	analyzer: str = Field(index=True)
	module_id: str = Field(index=True)
	line: int
	severity: Severity = Field(default=Severity.MEDIUM)
	rule_id: str = Field(index=True)
	message: str
	evidence: str = ""
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class TrainingRun(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	run_id: str = Field(index=True)
	model_name: str = Field(index=True)
	model_sha256: str = ""
	deterministic_findings: int = 0
	agent_findings: int = 0
	true_positives: int = 0
	false_positives: int = 0
	false_negatives: int = 0
	precision: float = 0.0
	recall: float = 0.0
	passed_non_regression: bool = True
	output_path: str = ""
	run_config_json: str = "{}"
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))


	class TrainingAnnotation(SQLModel, table=True):
	id: Optional[int] = Field(default=None, primary_key=True)
	source_root: str = Field(index=True)
	run_id: str = Field(index=True)
	module_id: str = Field(index=True)
	task_id: str = Field(index=True)
	judge_verdict: str = ""
	avg_reward: float = 0.0
	correct_attributions_json: str = "[]"
	wrong_attributions_json: str = "[]"
	action_counts_json: str = "{}"
	action_type: str = ""
	action_payload: str = "{}"
	thinking_quality: float = 0.0
	created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))