Spaces:

UCODE
/

agent

Sleeping

abenkbp commited on Aug 18, 2024

Commit

79277ca

1 Parent(s): e4fea54

debug

Files changed (1) hide show

data/models/llama3-1-70b.py CHANGED Viewed

@@ -1,7 +1,6 @@
 from flask import Flask, request, jsonify
 from huggingface_hub import login
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from threading import Thread
 import spaces
 import torch
 import os
@@ -35,8 +34,6 @@ def chat_completion():
     try:
         input_ids = tokenizer.apply_chat_template(user_input, tokenize=False, add_generation_prompt=True)
         inputs = tokenizer(input_ids, return_tensors="pt").to(0)
-        streamer = TextIteratorStreamer(tokenizer, timeout=10., skip_prompt=True, skip_special_tokens=True)
         generate_kwargs = dict(
             inputs,

 from flask import Flask, request, jsonify
 from huggingface_hub import login
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import spaces
 import torch
 import os
     try:
         input_ids = tokenizer.apply_chat_template(user_input, tokenize=False, add_generation_prompt=True)
         inputs = tokenizer(input_ids, return_tensors="pt").to(0)
         generate_kwargs = dict(
             inputs,