Buckets:
| # Text-to-SQL[[text-to-sql]] | |
| 이 튜토리얼에서는 `smolagents`를 사용해 SQL을 다루는 에이전트를 구현해보겠습니다. | |
| > 먼저 중요한 질문 하나로 시작하겠습니다. 그냥 간단하게 일반적인 text-to-SQL 파이프라인을 쓰면 안 될까요? | |
| 표준 text-to-SQL 파이프라인은 안정성이 떨어지는 경우가 많습니다. 쿼리가 잘못 생성될 수 있고, 심지어는 오류 없이 틀리거나 쓸모없는 결과를 반환할 수도 있습니다. | |
| 👉 반면, 에이전트 시스템은 출력 결과를 비판적으로 점검할 수 있고 쿼리를 수정할 필요가 있는지 스스로 결정할 수 있이 성능이 크게 향상됩니다. | |
| 이제 이 에이전트를 직접 만들어봅시다! 💪 | |
| 아래 명령어를 실행해 필요한 의존성을 설치하세요: | |
| ```bash | |
| !pip install smolagents python-dotenv sqlalchemy --upgrade -q | |
| ``` | |
| 추론 프로바이더를 호출하려면 환경 변수 `HF_TOKEN`에 유효한 토큰이 설정되어 있어야 합니다. | |
| python-dotenv를 이용해 환경 변수를 불러오겠습니다. | |
| ```py | |
| from dotenv import load_dotenv | |
| load_dotenv() | |
| ``` | |
| 다음으로, SQL 환경을 구성하겠습니다: | |
| ```py | |
| from sqlalchemy import ( | |
| create_engine, | |
| MetaData, | |
| Table, | |
| Column, | |
| String, | |
| Integer, | |
| Float, | |
| insert, | |
| inspect, | |
| text, | |
| ) | |
| engine = create_engine("sqlite:///:memory:") | |
| metadata_obj = MetaData() | |
| def insert_rows_into_table(rows, table, engine=engine): | |
| for row in rows: | |
| stmt = insert(table).values(**row) | |
| with engine.begin() as connection: | |
| connection.execute(stmt) | |
| table_name = "receipts" | |
| receipts = Table( | |
| table_name, | |
| metadata_obj, | |
| Column("receipt_id", Integer, primary_key=True), | |
| Column("customer_name", String(16), primary_key=True), | |
| Column("price", Float), | |
| Column("tip", Float), | |
| ) | |
| metadata_obj.create_all(engine) | |
| rows = [ | |
| {"receipt_id": 1, "customer_name": "Alan Payne", "price": 12.06, "tip": 1.20}, | |
| {"receipt_id": 2, "customer_name": "Alex Mason", "price": 23.86, "tip": 0.24}, | |
| {"receipt_id": 3, "customer_name": "Woodrow Wilson", "price": 53.43, "tip": 5.43}, | |
| {"receipt_id": 4, "customer_name": "Margaret James", "price": 21.11, "tip": 1.00}, | |
| ] | |
| insert_rows_into_table(rows, receipts) | |
| ``` | |
| ### 에이전트 만들기[[build-our-agent]] | |
| 이제 도구를 활용해 SQL 테이블을 조회할 수 있도록 만들어봅시다. | |
| 툴의 설명 속성은 에이전트 시스템에 의해 LLM 프롬프트에 포함되는 부분으로, LLM이 해당 도구를 어떻게 사용할 수 있는지에 대한 정보를 제공합니다. 바로 이 부분에 우리가 정의한 SQL 테이블의 설명을 작성하면 됩니다. | |
| ```py | |
| inspector = inspect(engine) | |
| columns_info = [(col["name"], col["type"]) for col in inspector.get_columns("receipts")] | |
| table_description = "Columns:\n" + "\n".join([f" - {name}: {col_type}" for name, col_type in columns_info]) | |
| print(table_description) | |
| ``` | |
| ```text | |
| Columns: | |
| - receipt_id: INTEGER | |
| - customer_name: VARCHAR(16) | |
| - price: FLOAT | |
| - tip: FLOAT | |
| ``` | |
| 이제 우리만의 툴을 만들어봅시다. 도구은 아래와 같은 요소를 필요로 합니다. (자세한 내용은 [도구 문서](../tutorials/tools)를 참고하세요) | |
| - 인자(`Args:`) 목록이 포함된 docstring | |
| - 입력과 출력에 대한 타입 힌트 | |
| ```py | |
| from smolagents import tool | |
| @tool | |
| def sql_engine(query: str) -> str: | |
| """ | |
| 테이블에 SQL 쿼리를 수행할 수 있습니다. 결과를 문자열로 반환합니다. | |
| 테이블 이름은 'receipts'이며, 설명은 다음과 같습니다: | |
| Columns: | |
| - receipt_id: INTEGER | |
| - customer_name: VARCHAR(16) | |
| - price: FLOAT | |
| - tip: FLOAT | |
| Args: | |
| query: 수행할 쿼리입니다. 올바른 SQL이어야 합니다. | |
| """ | |
| output = "" | |
| with engine.connect() as con: | |
| rows = con.execute(text(query)) | |
| for row in rows: | |
| output += "\n" + str(row) | |
| return output | |
| ``` | |
| 이제 이 도구를 사용하는 에이전트를 만들어보겠습니다. | |
| 여기서는 smolagent의 메인 에이전트 클래스인 `CodeAgent`를 사용합니다. `CodeAgent`는 코드로 액션을 작성하고 ReAct 프레임워크에 따라 이전 출력 결과를 반복적으로 개선할 수 있습니다. | |
| 모델은 에이전트 시스템을 구동하는 LLM을 의미합니다. `InferenceClientModel`을 사용하면 허깅페이스의 Inference API를 통해 서버리스 또는 Dedicated 엔드포인트 방식으로 LLM을 호출할 수 있으며, 필요에 따라 다른 사설 API를 사용할 수도 있습니다. | |
| ```py | |
| from smolagents import CodeAgent, InferenceClientModel | |
| agent = CodeAgent( | |
| tools=[sql_engine], | |
| model=InferenceClientModel(model_id="meta-llama/Llama-3.1-8B-Instruct"), | |
| ) | |
| agent.run("Can you give me the name of the client who got the most expensive receipt?") | |
| ``` | |
| ### 레벨 업: 테이블 조인[[level-2-table-joins]] | |
| 이제 좀 더 어려운 과제를 해결해 볼까요? 에이전트가 여러 테이블에 걸친 조인을 처리하도록 만들어 보겠습니다. | |
| 이를 위해 각 `receipt_id`에 해당하는 웨이터의 이름을 기록하는 두 번째 테이블을 만들어 보겠습니다. | |
| ```py | |
| table_name = "waiters" | |
| waiters = Table( | |
| table_name, | |
| metadata_obj, | |
| Column("receipt_id", Integer, primary_key=True), | |
| Column("waiter_name", String(16), primary_key=True), | |
| ) | |
| metadata_obj.create_all(engine) | |
| rows = [ | |
| {"receipt_id": 1, "waiter_name": "Corey Johnson"}, | |
| {"receipt_id": 2, "waiter_name": "Michael Watts"}, | |
| {"receipt_id": 3, "waiter_name": "Michael Watts"}, | |
| {"receipt_id": 4, "waiter_name": "Margaret James"}, | |
| ] | |
| insert_rows_into_table(rows, waiters) | |
| ``` | |
| 테이블이 변경되었기 때문에 LLM이 테이블 정보를 올바르게 활용할 수 있도록 `sql_engine`의 설명을 업데이트하겠습니다. | |
| ```py | |
| updated_description = """Allows you to perform SQL queries on the table. Beware that this tool's output is a string representation of the execution output. | |
| It can use the following tables:""" | |
| inspector = inspect(engine) | |
| for table in ["receipts", "waiters"]: | |
| columns_info = [(col["name"], col["type"]) for col in inspector.get_columns(table)] | |
| table_description = f"Table '{table}':\n" | |
| table_description += "Columns:\n" + "\n".join([f" - {name}: {col_type}" for name, col_type in columns_info]) | |
| updated_description += "\n\n" + table_description | |
| print(updated_description) | |
| ``` | |
| 이번 요청은 이전보다 조금 더 어려우므로, 더 강력한 [Qwen/Qwen3-Next-80B-A3B-Thinking](https://huggingface.co/Qwen/Qwen3-Next-80B-A3B-Thinking) 모델을 사용하도록 LLM 엔진을 바꾸겠습니다! | |
| ```py | |
| sql_engine.description = updated_description | |
| agent = CodeAgent( | |
| tools=[sql_engine], | |
| model=InferenceClientModel(model_id="Qwen/Qwen3-Next-80B-A3B-Thinking"), | |
| ) | |
| agent.run("Which waiter got more total money from tips?") | |
| ``` | |
| 바로 성공입니다! 놀라울 만큼 간단하게 설정되지 않았나요? | |
| 이번 예제는 여기까지입니다! 지금까지 다음과 같은 개념들을 살펴보았습니다. | |
| - 새로운 도구 만들기 | |
| - 도구 설명 업데이트하기 | |
| - 더 강력한 LLM으로 에이전트 추론 능력 향상시키기 | |
| ✅ 이제 여러분이 꿈꿔왔던 text-to-SQL 시스템을 직접 만들어 보세요! ✨ | |
Xet Storage Details
- Size:
- 7.44 kB
- Xet hash:
- 836677d33eb01cb2a2f8dc0f4d4b64b65aaaced856a221e931dc2650e18747d2
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.