Spaces:

coffeine16
/

FitCoach

Sleeping

App Files Files Community

FitCoach / inference.py

coffeine16

Upload folder using huggingface_hub

1a74e1c verified about 1 month ago

raw

history blame contribute delete

16.2 kB

	"""
	FitCoach inference.py — Multi-Actor Orchestrator.

	The agent must:
	1. Consult all relevant specialist actors
	2. Detect and reason about conflicts between them
	3. Submit a final integrated plan resolving all conflicts

	Stdout format (exact hackathon spec):
	[START] task=<task> env=fitcoach_env model=<model>
	[STEP] step=<N> action=<text> reward=<R:.2f> done=<bool> error=<null\|msg>
	[END] success=<bool> steps=<N> score=<score:.2f> rewards=<r1:.2f,...>

	LOCAL USAGE:
	$env:FITCOACH_TASK="week1_plan"
	uvicorn server.app:app --host 0.0.0.0 --port 8000

	$env:API_BASE_URL="https://api.groq.com/openai/v1"
	$env:API_KEY="gsk_..."
	$env:MODEL_NAME="llama-3.3-70b-versatile"
	$env:FITCOACH_TASK="week1_plan"
	$env:USE_DOCKER="false"
	python inference.py
	"""

	import asyncio
	import json
	import os
	import sys

	_ROOT = os.path.dirname(os.path.abspath(__file__))
	if _ROOT not in sys.path:
	sys.path.insert(0, _ROOT)

	try:
	from dotenv import load_dotenv
	load_dotenv()
	except ImportError:
	pass

	from models import FitcoachAction, FitcoachObservation
	from openenv.core import EnvClient
	from openenv.core.client_types import StepResult
	from openenv.core.env_server.types import State
	from typing import Dict


	class FitcoachEnv(EnvClient[FitcoachAction, FitcoachObservation, State]):
	def _step_payload(self, action: FitcoachAction) -> Dict:
	payload = {
	"action_type": action.action_type,
	"workout_plan": action.workout_plan,
	"nutrition_plan": action.nutrition_plan,
	}
	if action.actor_target is not None:
	payload["actor_target"] = action.actor_target
	if action.reasoning is not None:
	payload["reasoning"] = action.reasoning
	return payload

	def _parse_result(self, payload: Dict) -> StepResult[FitcoachObservation]:
	obs = payload.get("observation", {})
	return StepResult(
	observation=FitcoachObservation(
	client_profile =obs.get("client_profile", {}),
	progress_data =obs.get("progress_data", {}),
	complications =obs.get("complications", []),
	actor_response =obs.get("actor_response", {}),
	actors_consulted=obs.get("actors_consulted", []),
	active_conflicts=obs.get("active_conflicts", []),
	feedback =obs.get("feedback", ""),
	score_breakdown =obs.get("score_breakdown", {}),
	task_id =obs.get("task_id", ""),
	phase =obs.get("phase", ""),
	step_count =obs.get("step_count", 0),
	best_score =obs.get("best_score", 0.0),
	done =payload.get("done", False),
	reward =payload.get("reward"),
	metadata =obs.get("metadata", {}),
	),
	reward=payload.get("reward"),
	done=payload.get("done", False),
	)

	def _parse_state(self, payload: Dict) -> State:
	return State(
	episode_id=payload.get("episode_id"),
	step_count=payload.get("step_count", 0),
	)


	# ── Config ────────────────────────────────────────────────────────────────────

	API_BASE_URL = os.environ.get("API_BASE_URL", "https://api.groq.com/openai/v1")
	MODEL_NAME = os.environ.get("MODEL_NAME", "llama-3.3-70b-versatile")
	API_KEY = os.environ.get("HF_TOKEN") or os.environ.get("API_KEY", "")
	BENCHMARK = "fitcoach_env"
	USE_DOCKER = os.environ.get("USE_DOCKER", "false").lower() == "true"
	IMAGE_NAME = os.environ.get("LOCAL_IMAGE_NAME", "fitcoach-env:latest")
	LOCAL_SERVER_URL = os.environ.get("LOCAL_SERVER_URL", "http://localhost:8000")
	FITCOACH_TASK = os.environ.get("FITCOACH_TASK", "")
	MAX_STEPS = int(os.environ.get("MAX_STEPS", "10"))

	ALL_TASKS = ["week1_plan", "plateau_adaptation", "conflict_resolution"]


	# ── Log helpers ───────────────────────────────────────────────────────────────

	def log_start(task, env_name, model):
	print(f"[START] task={task} env={env_name} model={model}", flush=True)

	def log_step(step, action, reward, done, error):
	err = str(error) if error else "null"
	act = str(action).replace("\n", " ").replace("\r", "")[:120]
	print(
	f"[STEP] step={step} action={act} reward={reward:.2f}"
	f" done={str(done).lower()} error={err}",
	flush=True,
	)

	def log_end(success, steps, score, rewards):
	rstr = ",".join(f"{r:.2f}" for r in rewards)
	print(
	f"[END] success={str(success).lower()} steps={steps}"
	f" score={score:.2f} rewards={rstr}",
	flush=True,
	)


	# ── System prompt ─────────────────────────────────────────────────────────────

	SYSTEM_PROMPT = """You are an AI FITNESS ORCHESTRATOR managing three specialist actors:
	- fitness_advisor: workout programming expert
	- nutrition_advisor: diet and macro expert (uses IFCT 2017 database)
	- progress_analyst: plateau detection and overload expert

	Your job is to coordinate these actors to produce the best fitness prescription.

	EPISODE FLOW:
	1. First, consult each relevant actor using action_type='consult_actor'
	2. Read their recommendations and detect conflicts between them
	3. Resolve all conflicts
	4. Submit your final integrated plan using action_type='submit_plan'

	RESPOND WITH ONLY A JSON OBJECT. Choose one of these formats:

	FORMAT A — Consult an actor:
	{
	"action_type": "consult_actor",
	"actor_target": "fitness_advisor",
	"workout_plan": "{}",
	"nutrition_plan": "{}"
	}

	FORMAT B — Submit final plan (after consulting all actors):
	{
	"action_type": "submit_plan",
	"actor_target": null,
	"workout_plan": {
	"days": [
	{
	"name": "Day 1 - Push",
	"focus": "chest, shoulders, triceps",
	"exercises": [
	{"name": "Dumbbell Bench Press", "sets": 3, "reps": "8-12", "rest_seconds": 90, "weight_kg": 20}
	]
	}
	],
	"weekly_volume_sets": 15,
	"notes": "Evidence-based plan based on actor recommendations"
	},
	"nutrition_plan": {
	"daily_targets": {"calories": 2650, "protein_g": 144, "carbs_g": 352, "fats_g": 74},
	"meals": [
	{"meal_name": "Breakfast", "foods": ["100g oats", "200ml milk", "1 banana"], "calories": 450, "protein_g": 18}
	]
	},
	"reasoning": "Consulted all 3 actors. Resolved volume-calorie conflict by..."
	}

	CRITICAL RULES:
	1. Always consult fitness_advisor FIRST to know equipment and volume constraints
	2. Always consult nutrition_advisor to get IFCT-verified macro targets
	3. Consult progress_analyst if there is any progress_data or complications
	4. If actors CONFLICT, explicitly resolve it in your reasoning field
	5. ONLY use equipment listed in available_equipment
	6. NEVER use exercises banned due to injuries
	7. weekly_volume_sets must be within the range fitness_advisor specifies
	8. Calories must be within 15% of nutrition_advisor's target
	"""


	# ── LLM call ──────────────────────────────────────────────────────────────────

	def _call_llm_sync(messages):
	from openai import OpenAI
	if not API_KEY:
	raise ValueError("API_KEY or HF_TOKEN not set.")
	client = OpenAI(base_url=API_BASE_URL, api_key=API_KEY)
	resp = client.chat.completions.create(
	model=MODEL_NAME, messages=messages, max_tokens=1500, temperature=0.7,
	)
	return resp.choices[0].message.content

	async def call_llm(messages):
	loop = asyncio.get_event_loop()
	return await loop.run_in_executor(None, _call_llm_sync, messages)


	# ── Message builder ────────────────────────────────────────────────────────────

	def build_user_message(obs) -> str:
	profile = getattr(obs, "client_profile", {})
	progress = getattr(obs, "progress_data", {})
	comps = getattr(obs, "complications", [])
	feedback = getattr(obs, "feedback", "")
	breakdown = getattr(obs, "score_breakdown", {})
	consulted = getattr(obs, "actors_consulted", [])
	conflicts = getattr(obs, "active_conflicts", [])
	actor_resp= getattr(obs, "actor_response", {})
	task_id = getattr(obs, "task_id", "")
	phase = getattr(obs, "phase", "")

	parts = [f"Task: {task_id} \| Phase: {phase}"]
	parts.append(f"Client profile:\n{json.dumps(profile, indent=2)}")

	if comps:
	parts.append(f"⚠ Active complications: {comps}")

	if progress:
	summary = {k: v for k, v in progress.items() if k != "weight_series"}
	if "weight_series" in progress:
	series = progress["weight_series"]
	if series:
	summary["weight_trend"] = {
	"n_points": len(series),
	"first": series[0], "last": series[-1],
	"range_kg": f"{min(p['weight_kg'] for p in series):.1f}–{max(p['weight_kg'] for p in series):.1f}",
	}
	parts.append(f"Progress data:\n{json.dumps(summary, indent=2)}")

	parts.append(f"Actors consulted so far: {consulted}")

	if actor_resp and actor_resp.get("actor"):
	parts.append(
	f"Latest actor response ({actor_resp.get('actor')}):\n"
	f"{json.dumps(actor_resp.get('recommendations', {}), indent=2)}\n"
	f"Constraints: {json.dumps(actor_resp.get('constraints', {}), indent=2)}\n"
	f"Conflicts: {json.dumps(actor_resp.get('conflicts', {}), indent=2)}"
	)

	if conflicts:
	parts.append(
	f"⚡ ACTIVE CONFLICTS ({len(conflicts)}) — must resolve before submitting:\n"
	+ "\n".join(
	f" [{i+1}] {c['type']}: {c['description']}\n"
	f" Resolution options: {c.get('resolution_options', [])}"
	for i, c in enumerate(conflicts)
	)
	)

	if feedback and "Episode started" not in feedback:
	# Only show last feedback, not full history
	parts.append(f"Last feedback:\n{feedback[-500:]}")

	if breakdown:
	failing = {k: round(v, 2) for k, v in breakdown.items() if v < 0.7}
	if failing:
	parts.append(f"Dimensions < 0.7 (fix these):\n{json.dumps(failing, indent=2)}")

	# Decide what to do next
	all_actors = {"fitness_advisor", "nutrition_advisor", "progress_analyst"}
	needs_progress = bool(progress.get("weight_series") or comps)
	required = {"fitness_advisor", "nutrition_advisor"}
	if needs_progress:
	required.add("progress_analyst")

	unconsulted = required - set(consulted)

	if unconsulted:
	parts.append(
	f"NEXT ACTION: Consult one of these actors: {sorted(unconsulted)}\n"
	f"Use action_type='consult_actor' and actor_target=<name>"
	)
	else:
	parts.append(
	"All required actors consulted. "
	"Now submit your final integrated plan with action_type='submit_plan'. "
	"Make sure your plan resolves ALL active conflicts."
	)

	return "\n\n".join(parts)


	def strip_fences(text: str) -> str:
	text = text.strip()
	if text.startswith("```"):
	lines = [l for l in text.split("\n") if not l.startswith("```")]
	text = "\n".join(lines).strip()
	return text


	# ── Episode runner ─────────────────────────────────────────────────────────────

	async def run_episode(task_name: str, env) -> None:
	log_start(task_name, BENCHMARK, MODEL_NAME)

	rewards = []
	final_score = 0.0
	success = False
	step = 0
	error_msg = None

	try:
	reset_result = await env.reset()
	obs = reset_result.observation
	messages = [{"role": "system", "content": SYSTEM_PROMPT}]

	for step in range(1, MAX_STEPS + 1):
	messages.append({"role": "user", "content": build_user_message(obs)})

	try:
	reply = await call_llm(messages)
	except Exception as exc:
	error_msg = str(exc)
	log_step(step, "LLM_ERROR", 0.0, True, error_msg)
	break

	messages.append({"role": "assistant", "content": reply})
	clean = strip_fences(reply)

	try:
	parsed = json.loads(clean)
	action_type = parsed.get("action_type", "consult_actor")
	actor_target = parsed.get("actor_target")

	# workout/nutrition plan might be dict or string
	wp = parsed.get("workout_plan", {})
	np_ = parsed.get("nutrition_plan", {})
	wp_str = json.dumps(wp) if isinstance(wp, dict) else str(wp)
	np_str = json.dumps(np_) if isinstance(np_, dict) else str(np_)

	action = FitcoachAction(
	action_type = action_type,
	actor_target = actor_target,
	workout_plan = wp_str,
	nutrition_plan= np_str,
	reasoning = parsed.get("reasoning"),
	)
	except Exception:
	# Default to consulting fitness advisor
	action = FitcoachAction(
	action_type = "consult_actor",
	actor_target = "fitness_advisor",
	workout_plan = "{}",
	nutrition_plan="{}",
	)

	try:
	result = await env.step(action)
	except Exception as exc:
	error_msg = str(exc)
	log_step(step, action.action_type, 0.0, True, error_msg)
	break

	obs = result.observation
	reward = float(result.reward or 0.0)
	done = bool(result.done)
	rewards.append(reward)
	final_score = max(final_score, reward)

	action_label = (
	f"consult:{action.actor_target}"
	if action.action_type == "consult_actor"
	else "submit_plan"
	)
	log_step(step, action_label, reward, done, None)

	if done:
	break

	success = final_score >= 0.75

	except Exception as exc:
	error_msg = str(exc)
	print(f"[ERROR] {error_msg}", file=sys.stderr, flush=True)

	log_end(success, step, final_score, rewards)


	# ── Main ──────────────────────────────────────────────────────────────────────

	async def main() -> None:
	tasks_to_run = [FITCOACH_TASK] if FITCOACH_TASK else ALL_TASKS

	for task_name in tasks_to_run:
	print(f"[INFO] task={task_name} server={LOCAL_SERVER_URL}", file=sys.stderr, flush=True)
	env = FitcoachEnv(base_url=LOCAL_SERVER_URL)
	try:
	await run_episode(task_name, env)
	finally:
	try:
	await env.close()
	except Exception:
	pass

	if __name__ == "__main__":
	asyncio.run(main())