Spaces:

Duplicated from aadya1762/GemmaDemoSt2

youmakeai
/

future-html

Sleeping

App Files Files Community

future-html / gemmademo /_model.py

Commit History

bug fixes

e96d38d

aadya1762 commited on Mar 22, 2025

bug fixes

d99243b

aadya1762 commited on Mar 22, 2025

add sliders

e9e9e0c

aadya1762 commited on Mar 22, 2025

fix

95a5c0b

aadya1762 commited on Mar 20, 2025

fix

95c7e5d

aadya1762 commited on Mar 20, 2025

fix

250f389

aadya1762 commited on Mar 20, 2025

add examples functionality

3a14fb3

aadya1762 commited on Mar 20, 2025

remove unuseful model imports and comments

a251128

aadya1762 commited on Mar 19, 2025

remove unnecessary models

7f1341d

aadya1762 commited on Mar 19, 2025

fixes

6d99216

aadya1762 commited on Mar 19, 2025

remove unnecessary model

827ddeb

aadya1762 commited on Mar 19, 2025

bug fixes

581c860

aadya1762 commited on Mar 17, 2025

fix

5f43529

aadya1762 commited on Mar 17, 2025

Add Gemma3-1B Quantized Model

0304bfe

aadya1762 commited on Mar 17, 2025

handle batched response for inference

28295c6

aadya1762 commited on Mar 17, 2025

handle streaming properly

b709bb5

aadya1762 commited on Mar 17, 2025

fix

3328c8a

aadya1762 commited on Mar 17, 2025

Stream LLM responses

d24a753

aadya1762 commited on Mar 17, 2025

port to gradio

8cc5c82

aadya1762 commited on Mar 17, 2025

use 4 bit quantized models for faster inference

5ca1c38

aadya1762 commited on Mar 17, 2025

fix

8200fa2

aadya1762 commited on Mar 17, 2025

Add model config sliders

c1e7456

aadya1762 commited on Mar 17, 2025

Update _model.py

bc32324
unverified

Aadya Chinubhai commited on Mar 16, 2025

use llama.cpp

bdca525

aadya1762 commited on Mar 16, 2025

increase cache limit -> fewer recompilations by pytorch

5160420

aadya1762 commited on Mar 16, 2025

fix

51cf9c8

aadya1762 commited on Mar 11, 2025

remove torch.compile

9038c58

aadya1762 commited on Mar 10, 2025

fix

cff4a94

aadya1762 commited on Mar 10, 2025

initial commit

b4ecb60

aadya1762 commited on Mar 10, 2025