Spaces:

mosheofer1
/

multi_beam_text_streamer

Sleeping

App Files Files Community

Moshe Ofer commited on Dec 26, 2024

Commit

da278a5

1 Parent(s): 8c41f13

Initial commit for Hugging Face Space

Browse files

Files changed (5) hide show

Dockerfile +15 -2
__pycache__/app.cpython-312.pyc +0 -0
app.py +14 -4
temp.py +0 -175
templates/index.html +5 -3

Dockerfile CHANGED Viewed

@@ -2,29 +2,42 @@ FROM python:3.9-slim
 WORKDIR /app
 RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential \
-    git && \
-    rm -rf /var/lib/apt/lists/*
 RUN mkdir -p /app/cache && chmod -R 777 /app/cache
 ENV HF_HOME=/app/cache
 ENV PYTHONUNBUFFERED=1
 ENV EVENTLET_NO_GREENDNS=yes
 ENV EVENTLET_THREADPOOL_SIZE=32
 ENV EVENTLET_WEBSOCKET_MONITOR_TIMEOUT=60
 COPY . /app
 RUN pip install --no-cache-dir --upgrade pip
 RUN pip install --no-cache-dir -r requirements.txt
 EXPOSE 7860
 CMD ["gunicorn", \
      "--worker-class", "eventlet", \
      "--workers", "1", \
      "--timeout", "300", \
      "--bind", "0.0.0.0:7860", \
      "app:app"]

 WORKDIR /app
+# Install system dependencies
 RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential \
+    git \
+    && rm -rf /var/lib/apt/lists/*
+# Set up cache directory
 RUN mkdir -p /app/cache && chmod -R 777 /app/cache
 ENV HF_HOME=/app/cache
+# Set environment variables for proper eventlet operation
 ENV PYTHONUNBUFFERED=1
 ENV EVENTLET_NO_GREENDNS=yes
 ENV EVENTLET_THREADPOOL_SIZE=32
 ENV EVENTLET_WEBSOCKET_MONITOR_TIMEOUT=60
+ENV GUNICORN_CMD_ARGS="--worker-class eventlet --workers 1 --timeout 300 --keep-alive 65 --log-level debug --access-logfile - --error-logfile -"
+# Copy application files
 COPY . /app
+# Install Python dependencies
 RUN pip install --no-cache-dir --upgrade pip
 RUN pip install --no-cache-dir -r requirements.txt
+# Expose port
 EXPOSE 7860
+# Modified command to use explicit configuration
 CMD ["gunicorn", \
      "--worker-class", "eventlet", \
      "--workers", "1", \
+     "--worker-connections", "1000", \
      "--timeout", "300", \
+     "--keep-alive", "65", \
      "--bind", "0.0.0.0:7860", \
+     "--log-level", "debug", \
+     "--access-logfile", "-", \
+     "--error-logfile", "-", \
      "app:app"]

__pycache__/app.cpython-312.pyc ADDED Viewed

Binary file (5 kB). View file

app.py CHANGED Viewed

@@ -1,5 +1,8 @@
 import eventlet
-eventlet.monkey_patch()
 from flask import Flask, render_template
 from flask_socketio import SocketIO
 from transformers import MultiBeamTextStreamer, AutoTokenizer, AutoModelForCausalLM
@@ -7,8 +10,14 @@ import torch
 import time
 app = Flask(__name__)
-socketio = SocketIO(app, ping_timeout=60)
 # Initialize model and tokenizer
 MODEL_NAME = "Qwen/Qwen2.5-0.5B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
@@ -38,10 +47,11 @@ class WebSocketBeamStreamer(MultiBeamTextStreamer):
         self.beam_texts[beam_idx] = new_text
         if self.sleep_time > 0:
             eventlet.sleep(self.sleep_time / 1000)  # Convert milliseconds to seconds
         socketio.emit('beam_update', {
             'beam_idx': beam_idx,
             'text': new_text
-        })
     def on_beam_finished(self, final_text: str):
         """Send completion notification through websocket"""

 import eventlet
+eventlet.monkey_patch(socket=True, select=True)
+import eventlet.wsgi
 from flask import Flask, render_template
 from flask_socketio import SocketIO
 from transformers import MultiBeamTextStreamer, AutoTokenizer, AutoModelForCausalLM
 import time
 app = Flask(__name__)
+socketio = SocketIO(
+    app,
+    ping_timeout=60,
+    async_mode='eventlet',
+    cors_allowed_origins="*",
+    logger=True,
+    engineio_logger=True
+)
 # Initialize model and tokenizer
 MODEL_NAME = "Qwen/Qwen2.5-0.5B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
         self.beam_texts[beam_idx] = new_text
         if self.sleep_time > 0:
             eventlet.sleep(self.sleep_time / 1000)  # Convert milliseconds to seconds
+        # Force immediate emit and wait for confirmation
         socketio.emit('beam_update', {
             'beam_idx': beam_idx,
             'text': new_text
+        }, callback=lambda: eventlet.sleep(0))
     def on_beam_finished(self, final_text: str):
         """Send completion notification through websocket"""

temp.py DELETED Viewed

@@ -1,175 +0,0 @@
-import argparse
-import os
-from transformers import MultiBeamTextStreamer, AutoTokenizer, AutoModelForCausalLM
-class BeamOutputManager:
-    """Manages file handlers for beam outputs"""
-    def __init__(self, output_dir: str, num_beams: int):
-        self.output_dir = output_dir
-        self.num_beams = num_beams
-        self.counter = 0
-        # Create main output directory and closed beams directory
-        os.makedirs(output_dir, exist_ok=True)
-        self.closed_beams_dir = os.path.join(output_dir, "closed_beams")
-        os.makedirs(self.closed_beams_dir, exist_ok=True)
-        # Store complete text for each beam
-        self.beam_texts = {i: "" for i in range(num_beams)}
-        self.active_beams = set(range(num_beams))
-        # Initialize empty files
-        for beam_idx in range(num_beams):
-            filename = os.path.join(output_dir, f'beam_{beam_idx}.txt')
-            with open(filename, 'w', encoding='utf-8') as f:
-                f.write('')
-    def write_to_beam(self, beam_idx: int, text: str):
-        """Write text to the specified beam's file"""
-        if 0 <= beam_idx < self.num_beams and beam_idx in self.active_beams:
-            # Update stored text
-            self.beam_texts[beam_idx] = text
-            # Write complete text to file
-            filename = os.path.join(self.output_dir, f'beam_{beam_idx}.txt')
-            with open(filename, 'w', encoding='utf-8') as f:
-                f.write(self.beam_texts[beam_idx])
-    def finalize_beam(self, final_text: str):
-        """
-        Handle a completed beam by creating a new file in the closed_beams directory.
-        Args:
-            final_text (str): The complete text generated by the finished beam
-        """
-        # Create a timestamp-based filename to ensure uniqueness
-        self.counter += 1
-        filename = os.path.join(self.closed_beams_dir, f'completed_beam_{self.counter}.txt')
-        # Write the final text to the completed beam file
-        with open(filename, 'w', encoding='utf-8') as f:
-            f.write(final_text)
-        return filename
-def setup_model_and_tokenizer(model_name):
-    """
-    Initialize the model and tokenizer.
-    Args:
-        model_name (str): Name of the model to use
-    Returns:
-        tuple: (model, tokenizer)
-    """
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForCausalLM.from_pretrained(
-        model_name,
-        torch_dtype="auto",
-        device_map="auto"
-    )
-    return model, tokenizer
-def generate_with_beam_search(model, tokenizer, user_prompt, output_dir, num_beams=5, max_new_tokens=512):
-    """
-    Generate responses using beam search and write results to files.
-    Args:
-        model: The language model
-        tokenizer: The tokenizer
-        user_prompt (str): Input prompt
-        output_dir (str): Directory to save beam outputs
-        num_beams (int): Number of beams to use
-        max_new_tokens (int): Maximum number of new tokens to generate
-    """
-    # Initialize the output manager
-    output_manager = BeamOutputManager(output_dir, num_beams)
-    def on_beam_update(beam_idx: int, new_text: str):
-        """Handler for beam updates - write new text to file"""
-        output_manager.write_to_beam(beam_idx, new_text)
-    def on_beam_finished(final_text: str):
-        """Handler for completed beams - create final output file"""
-        final_path = output_manager.finalize_beam(final_text)
-        print(f"\nCompleted beam saved to: {final_path}")
-    # Create messages format
-    messages = [
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": user_prompt}
-    ]
-    # Apply chat template
-    text = tokenizer.apply_chat_template(
-        messages,
-        tokenize=False,
-        add_generation_prompt=True
-    )
-    # Prepare inputs
-    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
-    # Initialize streamer with handlers
-    streamer = MultiBeamTextStreamer(
-        tokenizer=tokenizer,
-        num_beams=num_beams,
-        on_beam_update=on_beam_update,
-        on_beam_finished=on_beam_finished,
-        skip_prompt=True
-    )
-    # Generate with beam search
-    model.generate(
-        **model_inputs,
-        num_beams=num_beams,
-        num_return_sequences=num_beams,
-        max_new_tokens=max_new_tokens,
-        output_scores=True,
-        return_dict_in_generate=True,
-        early_stopping=True,
-        streamer=streamer
-    )
-def main():
-    # Setup command line arguments
-    parser = argparse.ArgumentParser(description='Language Model Text Generation with Beam Search')
-    parser.add_argument('--model', type=str, default='Qwen/Qwen2.5-0.5B-Instruct',
-                        help='Name of the model to use')
-    parser.add_argument('--num_beams', type=int, default=5,
-                        help='Number of beams for beam search')
-    parser.add_argument('--max_tokens', type=int, default=512,
-                        help='Maximum number of new tokens to generate')
-    parser.add_argument('--output_dir', type=str, default='beam_outputs',
-                        help='Directory to save beam outputs')
-    args = parser.parse_args()
-    # Initialize model and tokenizer
-    model, tokenizer = setup_model_and_tokenizer(args.model)
-    # Interactive loop
-    while True:
-        prompt = input("\nEnter your prompt (or 'quit' to exit): ")
-        if prompt.lower() == 'quit':
-            break
-        generate_with_beam_search(
-            model,
-            tokenizer,
-            prompt,
-            args.output_dir,
-            num_beams=args.num_beams,
-            max_new_tokens=args.max_tokens
-        )
-        print(f"\nOutputs written to: {args.output_dir}/beam_*.txt")
-if __name__ == "__main__":
-    main()

templates/index.html CHANGED Viewed

@@ -396,14 +396,16 @@
     </div>
     <script>
-        // Replace the socket initialization with:
         let socket = io({
             transports: ['websocket'],
             reconnection: true,
             reconnectionAttempts: 5,
             reconnectionDelay: 1000,
-            path: '/socket.io/', // Explicitly set the path
-            upgrade: false // Disable transport upgrades
         });
         let beams = {};
         let completedBeams = [];

     </div>
     <script>
         let socket = io({
             transports: ['websocket'],
             reconnection: true,
             reconnectionAttempts: 5,
             reconnectionDelay: 1000,
+            path: '/socket.io/',
+            upgrade: false,
+            forceNew: true,
+            pingTimeout: 60000,
+            pingInterval: 25000
         });
         let beams = {};
         let completedBeams = [];