Instructions to use PipableAI/pip-sql-1.3b with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use PipableAI/pip-sql-1.3b with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="PipableAI/pip-sql-1.3b")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("PipableAI/pip-sql-1.3b")
model = AutoModelForCausalLM.from_pretrained("PipableAI/pip-sql-1.3b")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use PipableAI/pip-sql-1.3b with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "PipableAI/pip-sql-1.3b"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "PipableAI/pip-sql-1.3b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/PipableAI/pip-sql-1.3b

SGLang

How to use PipableAI/pip-sql-1.3b with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "PipableAI/pip-sql-1.3b" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "PipableAI/pip-sql-1.3b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "PipableAI/pip-sql-1.3b" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "PipableAI/pip-sql-1.3b",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use PipableAI/pip-sql-1.3b with Docker Model Runner:
```
docker model run hf.co/PipableAI/pip-sql-1.3b
```

Update README.md

by timbossm - opened Jan 31, 2025

base: refs/heads/main

←

from: refs/pr/5

Discussion Files changed

+87

-21

Files changed (1) hide show

README.md +87 -21

README.md CHANGED Viewed

@@ -32,22 +32,91 @@ widget:
 [colab_notebook](https://colab.research.google.com/drive/1insSxvc3jjAXe0zmdIjmbG3ttb5mpRgQ?usp=sharing)
-## What have we built?
-A 1.3 bn SQL model that outperforms most SQL expert models and chatgpt on popular benchmarks.
-This is a distilled model built on the deepseek base model.
-Please refer to https://huggingface.co/PipableAI/pip-library-etl-1.3b for our state of the art model.
-## How we built it?
-We used softmax cross entropy and a modified form of policy grad along with Q loss, optimized in an EM set up.
-Loss behaviour in the set up mentioned above -
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/658d8095a2a6a6e0da8bb8a6/I80Ru1r4thoYrLagIWALa.png)
-## Benchmarking :
-For benchmarking purposes we are using Semantic Evaluation for Text-to-SQL with
-Distilled Test Suites, an officially accepted evaluation framework for Spider, SParC, and CoSQL which was proposed by a research team of Yale and Berkeley.
-The benchmark contains 2200 test data points
-Here is the link to run the evaluation:
 [Test Suite SQL Eval](https://github.com/taoyds/test-suite-sql-eval)
@@ -60,18 +129,18 @@ Here is the link to run the evaluation:
 |sqlcoder-7b|60.6|48.2|28.3|20.4|
 |gpt-3.5|58.8|44.7|31.0|28.4|
-We have also benchmarked it on defog eval.
-It contains 200 test data points handpicked by defog team.
-Here is the link to it:
 [Defog SQL-Eval](https://github.com/defog-ai/sql-eval)
-These are the results -
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/64d32c6b921678fdc9de3302/fFeLSEYBNpQk_JWjFsF5M.png)
 ## License
-The model is open source under apache 2.0. License
 ## Usage
@@ -188,6 +257,3 @@ Which customers did not make any orders? List the first name, middle initial and
 ```sql
 SELECT T1.customer_first_name ,  T1.customer_middle_initial ,  T1.customer_last_name FROM Customers AS T1 WHERE T1.customer_id NOT IN (SELECT T2.customer_id FROM Orders AS T2)
 ```
-### Team
-Avi Kothari, Pratham Gupta, Ritvik Aryan Kalra, Rohan Bhatial, Soham Acharya

 [colab_notebook](https://colab.research.google.com/drive/1insSxvc3jjAXe0zmdIjmbG3ttb5mpRgQ?usp=sharing)
+## Основная информация
+ Основа для файнтюна (FT).
+<antArtifact identifier="sql-model-analysis" type="text/markdown" title="Анализ SQL-модели для файнтюнинга в бизнес-информатике">
+# Анализ базовой модели PipableAI/pip-library-etl-1.3b
+## Основные характеристики модели
+- Размер: 1.3 миллиарда параметров
+- Базовая архитектура: DeepSeek
+- Специализация: ETL (Extract, Transform, Load) и SQL-операции
+- Доступность: открытый доступ через Hugging Face
+- Превосходит ChatGPT в SQL-ориентированных бенчмарках
+## Преимущества для бизнес-информатики МГПУ
+### 1. Техническая оптимальность
+- Оптимальный размер для файнтюнинга (1.3B параметров)
+- Возможность запуска на доступном оборудовании
+- Эффективное использование вычислительных ресурсов
+### 2. Образовательные преимущества
+- Специализация на SQL подходит для курсов по базам данных
+- Поддержка ETL-процессов актуальна для бизнес-аналитики
+- Возможность интеграции в учебные проекты
+### 3. Направления файнтюнинга для МГПУ
+- Адаптация под специфику учебных задач
+- Настройка на корпоративные кейсы
+- Интеграция российских бизнес-практик
+## Рекомендации по файнтюнингу
+### 1. Приоритетные области настройки
+- Работа с российскими СУБД
+- Интеграция отраслевой специфики
+- Адаптация под образовательные задачи
+### 2. Технические аспекты
+- Использование LoRA для эффективной настройки
+- Подготовка специализированных датасетов
+- Валидация на реальных бизнес-кейсах
+### 3. Образовательные компоненты
+- Создание учебных примеров
+- Разработка практических заданий
+- Интеграция в существующие курсы
+## Потенциальные применения
+1. Учебный процесс:
+   - Автоматическая проверка SQL-запросов студентов
+   - Генерация учебных примеров
+   - Поддержка практических занятий
+2. Исследовательская работа:
+   - Анализ больших наборов данных
+   - Поддержка научных исследований
+   - Обработка результатов экспериментов
+3. Практические проекты:
+   - Работа с реальными бизнес-задачами
+   - Создание прототипов решений
+   - Анализ бизнес-процессов
+</antArtifact>
+Эта модель представляет особую ценность для направления бизнес-информатики благодаря своей специализации на SQL и ETL-процессах.
+## Процесс обучения модели
+Реализован через комбинированную функцию потерь, включающую:
+1. Softmax cross entropy (перекрёстная энтропия с софтмакс нормализацией) для оптимизации веро��тностного распределения предсказаний
+2. Модифицированный вариант policy gradient для оптимизации стратегии принятия решений
+3. Q-loss для оценки качества действий
+Оптимизация производилась в рамках EM-фреймворка (Expectation-Maximization), что обеспечивает итеративное улучшение параметров модели через чередование шагов оценки ожидания и максимизации вероятности.
+Такая архитектура потерь позволяет эффективно оптимизировать как точность генерации SQL-запросов, так и стратегическое качество принимаемых моделью решений.
+## Бенчмаркинг :
+ Оценка производительности модели выполнена на основе Semantic Evaluation for Text-to-SQL with Distilled Test Suites - официального фреймворка оценки, разработанного исследовательской группой Yale и Berkeley для бенчмарков Spider, SParC и CoSQL.
+Тестовый набор данных включает 2200 примеров, что обеспечивает статистически значимую оценку качества генерации SQL-запросов и семантической точности модели.
 [Test Suite SQL Eval](https://github.com/taoyds/test-suite-sql-eval)
 |sqlcoder-7b|60.6|48.2|28.3|20.4|
 |gpt-3.5|58.8|44.7|31.0|28.4|
+Мы также протестировали его на defog eval.
+Он содержит 200 точек тестовых данных, отобранных вручную командой defog.
+Вот ссылка на него:
 [Defog SQL-Eval](https://github.com/defog-ai/sql-eval)
+Вот результаты -
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/64d32c6b921678fdc9de3302/fFeLSEYBNpQk_JWjFsF5M.png)
 ## License
+Модель имеет открытый исходный код под лицензией Apache 2.0.
 ## Usage
 ```sql
 SELECT T1.customer_first_name ,  T1.customer_middle_initial ,  T1.customer_last_name FROM Customers AS T1 WHERE T1.customer_id NOT IN (SELECT T2.customer_id FROM Orders AS T2)
 ```