future-html

Sleeping

App Files Files Community

future-html / gemmademo

Commit History

fix

3328c8a

aadya1762 commited on Mar 17, 2025

Stream LLM responses

d24a753

aadya1762 commited on Mar 17, 2025

fix

e4ef2eb

aadya1762 commited on Mar 17, 2025

fix

4ffa911

aadya1762 commited on Mar 17, 2025

fix

0adab94

aadya1762 commited on Mar 17, 2025

fix

1719ee5

aadya1762 commited on Mar 17, 2025

fixes

6aec7fd

aadya1762 commited on Mar 17, 2025

fix

1dde7c7

aadya1762 commited on Mar 17, 2025

fix

a37bbcd

aadya1762 commited on Mar 17, 2025

fix

2fb6248

aadya1762 commited on Mar 17, 2025

port to gradio

8cc5c82

aadya1762 commited on Mar 17, 2025

use 4 bit quantized models for faster inference

5ca1c38

aadya1762 commited on Mar 17, 2025

fix

8200fa2

aadya1762 commited on Mar 17, 2025

Add model config sliders

c1e7456

aadya1762 commited on Mar 17, 2025

Update _model.py

bc32324
unverified

Aadya Chinubhai commited on Mar 16, 2025

fix

6ea3b45

aadya1762 commited on Mar 16, 2025

use llama.cpp

bdca525

aadya1762 commited on Mar 16, 2025

increase cache limit -> fewer recompilations by pytorch

5160420

aadya1762 commited on Mar 16, 2025

fix

51cf9c8

aadya1762 commited on Mar 11, 2025

remove torch.compile

9038c58

aadya1762 commited on Mar 10, 2025

fix

cff4a94

aadya1762 commited on Mar 10, 2025

initial commit

b4ecb60

aadya1762 commited on Mar 10, 2025

Commit History

fix 3328c8a

Stream LLM responses d24a753

fix e4ef2eb

fix 4ffa911

fix 0adab94

fix 1719ee5

fixes 6aec7fd

fix 1dde7c7

fix a37bbcd

fix 2fb6248

port to gradio 8cc5c82

use 4 bit quantized models for faster inference 5ca1c38

fix 8200fa2

Add model config sliders c1e7456

Update _model.py bc32324 unverified

fix 6ea3b45

use llama.cpp bdca525

increase cache limit -> fewer recompilations by pytorch 5160420

fix 51cf9c8

remove torch.compile 9038c58

fix cff4a94

initial commit b4ecb60

fix

3328c8a

Stream LLM responses

d24a753

fix

e4ef2eb

fix

4ffa911

fix

0adab94

fix

1719ee5

fixes

6aec7fd

fix

1dde7c7

fix

a37bbcd

fix

2fb6248

port to gradio

8cc5c82

use 4 bit quantized models for faster inference

5ca1c38

fix

8200fa2

Add model config sliders

c1e7456

Update _model.py

bc32324
unverified

fix

6ea3b45

use llama.cpp

bdca525

increase cache limit -> fewer recompilations by pytorch

5160420

fix

51cf9c8

remove torch.compile

9038c58

fix

cff4a94

initial commit

b4ecb60