|
|
--- |
|
|
tags: |
|
|
- text-to-image |
|
|
- stable-diffusion |
|
|
- lora |
|
|
- diffusers |
|
|
- template:sd-lora |
|
|
|
|
|
base_model: hfl/llama-3-chinese-8b-instruct-v2 |
|
|
instance_prompt: null |
|
|
license: apache-2.0 |
|
|
--- |
|
|
# llama-3-8B-Instruct-text2sql-lora |
|
|
|
|
|
<Gallery /> |
|
|
|
|
|
## Model description |
|
|
|
|
|
基于llama-3-chinese-8b-instruct-v2进行的lora微调 |
|
|
|
|
|
- 本项目微调用到的数据集 |
|
|
- [Spider](https://yale-lily.github.io/spider): 一个跨域的复杂text2sql数据集,包含了10,181条自然语言问句、分布在200个独立数据库中的5,693条SQL,内容覆盖了138个不同的领域。 |
|
|
- [CHASE](https://xjtu-intsoft.github.io/chase/): 一个跨领域多轮交互text2sql中文数据集,包含5459个多轮问题组成的列表,一共17940个<query, SQL>二元组,涉及280个不同领域的数据库。 |
|
|
- [BIRD-SQL:](https://bird-bench.github.io/)数据集是一个英文的大规模跨领域文本到SQL基准测试,特别关注大型数据库内容。该数据集包含12,751对文本到SQL数据对和95个数据库,总大小为33.4GB,跨越37个职业领域。BIRD-SQL数据集通过探索三个额外的挑战,即处理大规模和混乱的数据库值、外部知识推理和优化SQL执行效率,缩小了文本到SQL研究与实际应用之间的差距。 |
|
|
- [CSpider:](https://drive.google.com/drive/folders/1TxCUq1ydPuBdDdHF3MkHT-8zixluQuLa?usp=sharing)2019年9月,西湖大学提出了一个大型中文数据集CSpider,用于复杂和跨领域的语义解析和Text-to-SQL任务,由2位NLP研究人员和1位计算机专业学生从数据集Spider翻译而来,其中包含200个数据库上的10181个问题和5693个独特的复杂SQL查询,具有涵盖138个不同领域的多个表的数据库。 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## Download model |
|
|
|
|
|
Weights for this model are available in Safetensors format. |
|
|
|
|
|
[Download](/dusensen/llama-3-8B-Instruct-text2sql-lora/tree/main) them in the Files & versions tab. |
|
|
|