RAG.axera / README.md
yongqiang
Initialize the repository
1ed9a31
metadata
license: mit

RAG.AXERA DEMO

rag_demo

้กน็›ฎ่ฏดๆ˜Ž

(hf) โžœ  rag.axera git:(main) โœ— tree -L 2
.
โ”œโ”€โ”€ assets
โ”‚   โ””โ”€โ”€ demo.png
โ”œโ”€โ”€ config.py     # ้…็ฝฎ axmodel, tokenizer ๆ–‡ไปถ่ทฏๅพ„
โ”œโ”€โ”€ data
โ”œโ”€โ”€ gui.py        # RAG ไบคไบ’ๅผ็จ‹ๅบ 
โ”œโ”€โ”€ index         # ๆ–‡ๆกฃ็ผ–็ ๅ‘้‡็ดขๅผ•ไฟๅญ˜ไฝ็ฝฎ
โ”‚   โ”œโ”€โ”€ docs.index
โ”‚   โ””โ”€โ”€ docs.pkl
โ”œโ”€โ”€ llm_api.py    # llm ไธป็จ‹ๅบ 
โ”œโ”€โ”€ models        # axmodel ๆจกๅž‹ๅญ˜ๅ‚จไฝ็ฝฎ
โ”‚   โ”œโ”€โ”€ Qwen2.5-1.5B-Instruct_axmodel
โ”‚   โ””โ”€โ”€ Qwen3-Embedding-0.6B_axmodel
โ”œโ”€โ”€ pdf_sample    # ็คบไพ‹ pdf ๆ–‡ไปถ
โ”‚   โ””โ”€โ”€ introduction.pdf
โ”œโ”€โ”€ rag_engine.py # ๆ–‡ๆกฃๅ‘้‡็ผ–็ ็จ‹ๅบ 
โ”œโ”€โ”€ README.md
โ”œโ”€โ”€ requirements.txt
โ”œโ”€โ”€ tokenizer
โ”‚   โ”œโ”€โ”€ Qwen2.5-1.5B-Instruct
โ”‚   โ””โ”€โ”€ Qwen3-Embedding-0.6B
โ””โ”€โ”€ utils
    โ””โ”€โ”€ infer_func.py

11 directories, 11 files

่ฟ่กŒ

ๅœจ AXCL ๆœบๅ™จๆˆ– AX650 ๅผ€ๅ‘ๆฟไธŠๅฏๅŠจไธคไธช็ปˆ็ซฏ็•Œ้ข, ๅˆ†ๅˆซ่ฟ่กŒไธ‹้ข็š„ๅ‘ฝไปค:

python3 llm_api.py # ๅœจ AX650 ๆˆ– AXCL ๅผ€ๅ‘ๆฟๅฏๅŠจ llm ๆœๅŠก
python3 gui.py     # ๅฏๅŠจไบคไบ’ๅผ็•Œ้ข