ThomasSimonini
/

Moondream2-streaming

Image-Text-to-Text

text-generation

Model card Files Files and versions

ThomasSimonini commited on Jul 30, 2024

Commit

2a3e8ee

·

verified ·

1 Parent(s): c22676d

Upload moondream.py

Files changed (1) hide show

moondream.py +5 -2

moondream.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import torch
 from .vision_encoder import VisionEncoder
 from .configuration_moondream import MoondreamConfig
-from transformers import PreTrainedModel, TextStreamer
 from .modeling_phi import PhiForCausalLM
 from .configuration_moondream import PhiConfig
@@ -62,6 +62,7 @@ class Moondream(PreTrainedModel):
     def get_input_embeddings(self):
         return self.text_model.get_input_embeddings()
     def generate(
         self,
         image_embeds,
@@ -80,13 +81,15 @@ class Moondream(PreTrainedModel):
         with torch.no_grad():
             inputs_embeds = self.input_embeds(prompt, image_embeds, tokenizer)
-            streamer = TextStreamer(tokenizer)
             output_ids = self.text_model.generate(
                 inputs_embeds=inputs_embeds, streamer=streamer, **generate_config
             )
         return tokenizer.batch_decode(output_ids, skip_special_tokens=True)
     def answer_question(
         self,
         image_embeds,

 import torch
 from .vision_encoder import VisionEncoder
 from .configuration_moondream import MoondreamConfig
+from transformers import PreTrainedModel, TextIteratorStreamer
 from .modeling_phi import PhiForCausalLM
 from .configuration_moondream import PhiConfig
     def get_input_embeddings(self):
         return self.text_model.get_input_embeddings()
     def generate(
         self,
         image_embeds,
         with torch.no_grad():
             inputs_embeds = self.input_embeds(prompt, image_embeds, tokenizer)
+            streamer = TextIteratorStreamer(tokenizer)
             output_ids = self.text_model.generate(
                 inputs_embeds=inputs_embeds, streamer=streamer, **generate_config
             )
         return tokenizer.batch_decode(output_ids, skip_special_tokens=True)
     def answer_question(
         self,
         image_embeds,