Spaces:

Allanatrix
/

Nexa_Labs

Paused

App Files Files Community

Nexa_Labs / SETUP.md

Allanatrix

Upload 57 files

d8328bf verified 5 months ago

preview code

raw

history blame contribute delete

1.96 kB

A newer version of the Gradio SDK is available: 6.13.0

Upgrade

Setup Instructions

Initial Setup

Clone the repository:
```
git clone <your-repo-url>
cd Agent_kit
```
Install dependencies:
```
pip install -r requirements.txt
```

Merge the model (one-time):

python scripts/merge_model.py \
  --base-model "Allanatrix/Nexa_Sci_distilled_Falcon-10B" \
  --adapter-path models/adapter_model.safetensors \
  --output-dir models/merged \
  --torch-dtype bfloat16

Note: If you don't have the adapter weights, the model will load directly from HuggingFace.

Running with Docker

Prerequisites

Docker and Docker Compose
NVIDIA Container Toolkit for GPU support

Quick Start

docker-compose up --build

This starts:

Model server (port 8001)
Tool server (port 8000)

Run Agent

docker-compose run --rm agent python examples/demo_agent.py \
  --prompt "Your prompt here"

Running Manually

Three Terminal Setup

Terminal 1 - Model Server:

cd Agent_kit
source .venv/bin/activate
uvicorn agent.model_server:app --host 0.0.0.0 --port 8001

Terminal 2 - Tool Server:

cd Agent_kit
source .venv/bin/activate
uvicorn tools.server:app --host 0.0.0.0 --port 8000

Terminal 3 - Agent:

cd Agent_kit
source .venv/bin/activate

# Enable remote model in config.yaml
# Set: model_server.enabled: true

python examples/demo_agent.py --prompt "Your prompt here"

Configuration

Edit agent/config.yaml:

model_server.enabled: Set to true to use remote model server
model_server.base_url: Model server URL (default: http://127.0.0.1:8001)
tool_server.base_url: Tool server URL (default: http://127.0.0.1:8000)

Testing

Test model server connection:

python examples/test_model_server.py

Test simple generation:

python examples/simple_test.py

Troubleshooting

See README.md for troubleshooting tips.