CanerDedeoglu
/

Rapid_ECG

@@ -1,14 +1,19 @@
 # -*- coding: utf-8 -*-
 """
-PULSE ECG Handler — Demo Parity + Style Hint
 - Demo app.py ile aynı üretim ayarları:
   do_sample=True, temperature=0.05, top_p=1.0, max_new_tokens=4096
 - Stopping: konuşma ayırıcıda (conv.sep/sep2) güvenli token-eşleşmeli kriter
 - Görsel tensörü: .half() ve model cihazında
 - Streamer: TextIteratorStreamer (demo gibi), thread ile generate
 - Seed/deterministic KAPALI (göndermezseniz); demo gibi stokastik
-- STYLE_HINT: demo üslubuna (narratif + sonda tek satır structured impression) yaklaşmak için
-- Post-process: YALNIZCA whitespace/biçim normalizasyonu (yönetim/öneri cümleleri korunur)
 """
 import os
@@ -19,37 +24,46 @@ import hashlib
 import datetime
 from io import BytesIO
 from threading import Thread
-from typing import Optional, Union
 import torch
 from PIL import Image
 import requests
 # ====== LLaVA & Transformers ======
 try:
-    from llava.constants import (
-        IMAGE_TOKEN_INDEX,
-        DEFAULT_IMAGE_TOKEN,
-    )
     from llava.conversation import conv_templates, SeparatorStyle
     from llava.model.builder import load_pretrained_model
-    from llava.mm_utils import (
-        tokenizer_image_token,
-        process_images,
-        get_model_name_from_path,
-    )
     from llava.utils import disable_torch_init
     LLAVA_AVAILABLE = True
 except Exception as e:
     LLAVA_AVAILABLE = False
-    print(f"[WARN] LLaVA not available: {e}")
 try:
     from transformers import TextIteratorStreamer, StoppingCriteria
     TRANSFORMERS_AVAILABLE = True
 except Exception as e:
     TRANSFORMERS_AVAILABLE = False
-    print(f"[WARN] transformers not available: {e}")
 # ====== HF Hub logging (opsiyonel) ======
 try:
@@ -66,7 +80,7 @@ if HF_HUB_AVAILABLE and "HF_TOKEN" in os.environ:
         api = HfApi()
         repo_name = os.environ.get("LOG_REPO", "")
     except Exception as e:
-        print(f"[HF Hub] init failed: {e}")
         api = None
         repo_name = ""
@@ -91,7 +105,6 @@ STYLE_HINT = (
 )
 # ===================== Utilities =====================
 def _safe_upload(path: str):
     if api and repo_name and path and os.path.isfile(path):
         try:
@@ -102,7 +115,7 @@ def _safe_upload(path: str):
                 repo_type="dataset",
             )
         except Exception as e:
-            print(f"[upload] failed for {path}: {e}")
 def _conv_log_path() -> str:
     t = datetime.datetime.now()
@@ -136,12 +149,6 @@ def load_image_any(image_input: Union[str, dict]) -> Image.Image:
     raise ValueError("Unsupported image input format")
 def _normalize_whitespace(text: str) -> str:
-    """
-    Gereksiz boşluk/boş satırları toparlar:
-    - Satır başı/sonu boşluklarını siler
-    - Birden çok boşluğu tek boşluğa indirger
-    - 3+ boş satırı 1 boş satıra indirger
-    """
     text = text.replace("\r\n", "\n").replace("\r", "\n")
     lines = [re.sub(r"[ \t]+", " ", ln.strip()) for ln in text.split("\n")]
     text = "\n".join(lines).strip()
@@ -149,14 +156,10 @@ def _normalize_whitespace(text: str) -> str:
     return text
 def _postprocess_min(text: str) -> str:
-    # Yalnızca whitespace/biçim temizliği
     return _normalize_whitespace(text)
 # ====== Güvenli Stop Kriteri (conv separator) ======
 class SafeKeywordsStoppingCriteria(StoppingCriteria):
-    """
-    conv.sep/sep2 bazlı token eşleşmesi; tensör → bool hatası yok.
-    """
     def __init__(self, keyword: str, tokenizer):
         self.tokenizer = tokenizer
         tok = tokenizer(keyword, add_special_tokens=False, return_tensors="pt").input_ids[0]
@@ -174,7 +177,6 @@ class SafeKeywordsStoppingCriteria(StoppingCriteria):
         return torch.equal(tail, kw)
 # ===================== Core Generation =====================
 class InferenceDemo:
     def __init__(self, args, model_path, tokenizer_, model_, image_processor_, context_len_):
         if not LLAVA_AVAILABLE:
@@ -183,7 +185,6 @@ class InferenceDemo:
         self.tokenizer, self.model, self.image_processor, self.context_len = (
             tokenizer_, model_, image_processor_, context_len_
         )
-        # Parite için sabit şablon
         self.conv_mode = "llava_v1"
         self.conversation = conv_templates[self.conv_mode].copy()
         self.num_frames = getattr(args, "num_frames", 16)
@@ -200,19 +201,16 @@ class ChatSessionManager:
             self.chatbot = InferenceDemo(args, model_path, tokenizer, model, image_processor, context_len)
     def get_chatbot(self, args, model_path, tokenizer, model, image_processor, context_len):
         self.init_if_needed(args, model_path, tokenizer, model, image_processor, context_len)
-        # Her çağrıda taze template (demo gibi yeni tur)
         self.chatbot.conversation = conv_templates[self.chatbot.conv_mode].copy()
         return self.chatbot
 chat_manager = ChatSessionManager()
 def _build_prompt_and_ids(chatbot, user_text: str, device: torch.device):
-    # DEMO PARİTE: sarım yok, tek görüntü için tek image token
     inp = f"{DEFAULT_IMAGE_TOKEN}\n{user_text}"
     chatbot.conversation.append_message(chatbot.conversation.roles[0], inp)
     chatbot.conversation.append_message(chatbot.conversation.roles[1], None)
     prompt = chatbot.conversation.get_prompt()
     input_ids = tokenizer_image_token(
         prompt, chatbot.tokenizer, IMAGE_TOKEN_INDEX, return_tensors="pt"
     ).unsqueeze(0).to(device)
@@ -227,31 +225,29 @@ def generate_response(
     max_new_tokens: Optional[int] = None,
     conv_mode_override: Optional[str] = None,
     repetition_penalty: Optional[float] = None,
-    det_seed: Optional[int] = None,  # None → stokastik (demo gibi)
 ):
     if not (LLAVA_AVAILABLE and TRANSFORMERS_AVAILABLE):
         return {"error": "Required libraries not available (llava/transformers)"}
     if not message_text or image_input is None:
         return {"error": "Both 'message' and 'image' are required"}
-    # Varsayılanlar → demo
     if temperature is None: temperature = 0.05
     if top_p is None: top_p = 1.0
     if max_new_tokens is None: max_new_tokens = 4096
-    if repetition_penalty is None: repetition_penalty = 1.0  # etkisiz
-    # Chat session
     chatbot = chat_manager.get_chatbot(args, args.model_path, tokenizer, model, image_processor, context_len)
     if conv_mode_override and conv_mode_override in conv_templates:
         chatbot.conversation = conv_templates[conv_mode_override].copy()
-    # Görüntü yükle
     try:
         pil_img = load_image_any(image_input)
     except Exception as e:
         return {"error": f"Failed to load image: {e}"}
-    # Log için hash+path
     img_hash, img_path = "NA", None
     try:
         buf = BytesIO(); pil_img.save(buf, format="JPEG"); raw = buf.getvalue()
@@ -262,37 +258,55 @@ def generate_response(
         if not os.path.isfile(img_path):
             pil_img.save(img_path)
     except Exception as e:
-        print(f"[log] save image failed: {e}")
-    # Cihaz/dtype
     device = next(chatbot.model.parameters()).device
-    dtype = torch.float16  # demo: half
-    # Görüntü ön-işleme → tensör
     try:
         processed = process_images([pil_img], chatbot.image_processor, chatbot.model.config)
         if isinstance(processed, (list, tuple)) and len(processed) > 0:
             image_tensor = processed[0]
         elif isinstance(processed, torch.Tensor):
             image_tensor = processed[0] if processed.ndim == 4 else processed
         else:
-            return {"error": "Image processing returned empty"}
         if image_tensor.ndim == 3:
-            image_tensor = image_tensor.unsqueeze(0)  # (1,C,H,W)
-        image_tensor = image_tensor.to(device=device, dtype=dtype)  # demo: half + device
     except Exception as e:
-        return {"error": f"Image processing failed: {e}"}
-    # STYLE_HINT ekle ve prompt hazırla
     msg = (message_text or "").strip()
     msg = f"{msg}\n\n{STYLE_HINT}"
     _, input_ids = _build_prompt_and_ids(chatbot, msg, device)
-    # Stop string (conv separator) → güvenli kriter
     stop_str = chatbot.conversation.sep if chatbot.conversation.sep_style != SeparatorStyle.TWO else chatbot.conversation.sep2
     stopping = SafeKeywordsStoppingCriteria(stop_str, chatbot.tokenizer)
-    # Seed (gönderilmediyse stokastik → demo gibi)
     if det_seed is not None:
         try:
             s = int(det_seed)
@@ -303,26 +317,21 @@ def generate_response(
         except Exception:
             pass
-    # Streamer (demo gibi)
-    streamer = TextIteratorStreamer(
-        chatbot.tokenizer, skip_prompt=True, skip_special_tokens=True
-    )
-    # Generate kwargs — demo ayarları
     gen_kwargs = dict(
         inputs=input_ids,
         images=image_tensor,
         streamer=streamer,
-        do_sample=True,                     # DEMO
-        temperature=float(temperature),     # DEMO default 0.05
-        top_p=float(top_p),                 # DEMO default 1.0
-        max_new_tokens=int(max_new_tokens), # DEMO slider
-        repetition_penalty=float(repetition_penalty),  # default 1.0 → etkisiz
         use_cache=False,
-        stopping_criteria=[stopping],       # DEMO-benzeri durdurma
     )
-    # Üretim (arka thread) + akışı topla
     try:
         t = Thread(target=chatbot.model.generate, kwargs=gen_kwargs)
         t.start()
@@ -330,12 +339,11 @@ def generate_response(
         for piece in streamer:
             chunks.append(piece)
         text = "".join(chunks)
-        text = _postprocess_min(text)   # yalnızca whitespace/format temizliği
         chatbot.conversation.messages[-1][-1] = text
     except Exception as e:
         return {"error": f"Generation failed: {e}"}
-    # Log
     try:
         row = {
             "time": datetime.datetime.now().isoformat(),
@@ -349,12 +357,11 @@ def generate_response(
             f.write(json.dumps(row, ensure_ascii=False) + "\n")
         _safe_upload(_conv_log_path()); _safe_upload(img_path or "")
     except Exception as e:
-        print(f"[log] failed: {e}")
     return {"status": "success", "response": text, "conversation_id": id(chatbot.conversation)}
 # ===================== Public API =====================
 def query(payload: dict):
     """HF Endpoint entry (demo-like)."""
     global model_initialized, tokenizer, model, image_processor, context_len, args
@@ -369,11 +376,10 @@ def query(payload: dict):
         if not message.strip(): return {"error": "Missing 'message' text"}
         if image is None:       return {"error": "Missing 'image'. Use 'image', 'image_url', or 'img'."}
-        # Demo varsayılanları — payload override edebilir
         temperature        = float(payload.get("temperature", 0.05))
         top_p              = float(payload.get("top_p", 1.0))
         max_new_tokens     = int(payload.get("max_output_tokens", payload.get("max_new_tokens", payload.get("max_tokens", 4096))))
-        repetition_penalty = float(payload.get("repetition_penalty", 1.0))  # etkisiz default
         conv_mode_override = payload.get("conv_mode", None)
         det_seed           = payload.get("det_seed", None)
@@ -413,13 +419,12 @@ def get_model_info():
     }
 # ===================== Init & Session =====================
 class _Args:
     def __init__(self):
         self.model_path = os.getenv("HF_MODEL_ID", "PULSE-ECG/PULSE-7B")
         self.model_base = None
         self.num_gpus   = int(os.getenv("NUM_GPUS", "1"))
-        self.conv_mode  = "llava_v1"  # Parite için sabit
         self.max_new_tokens = int(os.getenv("MAX_NEW_TOKENS", "4096"))
         self.num_frames = 16
         self.load_8bit  = bool(int(os.getenv("LOAD_8BIT", "0")))
@@ -429,21 +434,53 @@ class _Args:
 def initialize_model():
     global tokenizer, model, image_processor, context_len, args
     if not LLAVA_AVAILABLE:
-        print("[init] LLaVA not available; cannot init.")
         return False
     try:
         args = _Args()
         model_name = get_model_name_from_path(args.model_path)
         tokenizer_, model_, image_processor_, context_len_ = load_pretrained_model(
             args.model_path, args.model_base, model_name, args.load_8bit, args.load_4bit
         )
-        # demo: model'ı genelde cuda’da çalıştırır
         try:
             _ = next(model_.parameters()).device
         except Exception:
             if torch.cuda.is_available():
                 model_ = model_.to(torch.device("cuda"))
         model_.eval()
         globals()["tokenizer"] = tokenizer_
         globals()["model"] = model_
@@ -454,11 +491,10 @@ def initialize_model():
         print("[init] model/tokenizer/image_processor loaded.")
         return True
     except Exception as e:
-        print(f"[init] failed: {e}")
         return False
 # ===================== HF EndpointHandler =====================
 class EndpointHandler:
     """Hugging Face Endpoint uyumlu sınıf"""
     def __init__(self, model_dir):
@@ -474,24 +510,21 @@ class EndpointHandler:
         return get_model_info()
 if __name__ == "__main__":
-    print("Handler ready (Demo Parity + Style Hint + whitespace post-process). Use `EndpointHandler` or `query`.")
 # ===================== Minimal FastAPI Wrapper =====================
 try:
-    from fastapi import FastAPI, Body
     from pydantic import BaseModel
-    from typing import Any, Dict
     FASTAPI_AVAILABLE = True
 except Exception as e:
     FASTAPI_AVAILABLE = False
-    print(f"[WARN] fastapi/pydantic not available: {e}")
 if FASTAPI_AVAILABLE:
     app = FastAPI(title="PULSE ECG Handler API", version="1.0.0")
     class QueryIn(BaseModel):
-        # Hugging Face Endpoint tarzı payload ile uyumlu
         message: str | None = None
         query: str | None = None
         prompt: str | None = None
@@ -523,10 +556,35 @@ if FASTAPI_AVAILABLE:
     async def _info():
         return get_model_info()
     @app.post("/query")
     async def _query(payload: QueryIn):
-        # Boş alanları at, handler.query interface'ine aynen gönder
         return query({k: v for k, v in payload.dict().items() if v is not None})
 else:
     app = None  # uvicorn handler:app çalıştırıldığında import error verir

 # -*- coding: utf-8 -*-
 """
+PULSE ECG Handler — Demo Parity + Style Hint + Robust Fallbacks + Debug
 - Demo app.py ile aynı üretim ayarları:
   do_sample=True, temperature=0.05, top_p=1.0, max_new_tokens=4096
 - Stopping: konuşma ayırıcıda (conv.sep/sep2) güvenli token-eşleşmeli kriter
 - Görsel tensörü: .half() ve model cihazında
 - Streamer: TextIteratorStreamer (demo gibi), thread ile generate
 - Seed/deterministic KAPALI (göndermezseniz); demo gibi stokastik
+- STYLE_HINT: demo üslubuna (narratif + sonda tek satır structured impression)
+- Post-process: yalnızca whitespace/biçim temizliği
+- Ekler:
+  * DEBUG yardımcıları (ENV: DEBUG=1)
+  * image_processor fallback (AutoProcessor → CLIPImageProcessor)
+  * process_images fallback (torchvision + CLIP norm)
+  * FastAPI wrapper: /health, /info, /query, /debug
 """
 import os
 import datetime
 from io import BytesIO
 from threading import Thread
+from typing import Optional, Union, Any, Dict
 import torch
 from PIL import Image
 import requests
+# ====== Debug Helpers ======
+def _env_bool(name: str, default: bool = False) -> bool:
+    v = os.getenv(name)
+    if v is None:
+        return default
+    return str(v).strip().lower() in {"1", "true", "yes", "y", "on"}
+DEBUG = _env_bool("DEBUG", False)
+def dbg(*args, **kwargs):
+    if DEBUG:
+        print("[DEBUG]", *args, **kwargs)
+def warn(*args, **kwargs):
+    print("[WARN]", *args, **kwargs)
 # ====== LLaVA & Transformers ======
 try:
+    from llava.constants import IMAGE_TOKEN_INDEX, DEFAULT_IMAGE_TOKEN
     from llava.conversation import conv_templates, SeparatorStyle
     from llava.model.builder import load_pretrained_model
+    from llava.mm_utils import tokenizer_image_token, process_images, get_model_name_from_path
     from llava.utils import disable_torch_init
     LLAVA_AVAILABLE = True
 except Exception as e:
     LLAVA_AVAILABLE = False
+    warn(f"LLaVA not available: {e}")
 try:
     from transformers import TextIteratorStreamer, StoppingCriteria
     TRANSFORMERS_AVAILABLE = True
 except Exception as e:
     TRANSFORMERS_AVAILABLE = False
+    warn(f"transformers not available: {e}")
 # ====== HF Hub logging (opsiyonel) ======
 try:
         api = HfApi()
         repo_name = os.environ.get("LOG_REPO", "")
     except Exception as e:
+        warn(f"[HF Hub] init failed: {e}")
         api = None
         repo_name = ""
 )
 # ===================== Utilities =====================
 def _safe_upload(path: str):
     if api and repo_name and path and os.path.isfile(path):
         try:
                 repo_type="dataset",
             )
         except Exception as e:
+            warn(f"[upload] failed for {path}: {e}")
 def _conv_log_path() -> str:
     t = datetime.datetime.now()
     raise ValueError("Unsupported image input format")
 def _normalize_whitespace(text: str) -> str:
     text = text.replace("\r\n", "\n").replace("\r", "\n")
     lines = [re.sub(r"[ \t]+", " ", ln.strip()) for ln in text.split("\n")]
     text = "\n".join(lines).strip()
     return text
 def _postprocess_min(text: str) -> str:
     return _normalize_whitespace(text)
 # ====== Güvenli Stop Kriteri (conv separator) ======
 class SafeKeywordsStoppingCriteria(StoppingCriteria):
     def __init__(self, keyword: str, tokenizer):
         self.tokenizer = tokenizer
         tok = tokenizer(keyword, add_special_tokens=False, return_tensors="pt").input_ids[0]
         return torch.equal(tail, kw)
 # ===================== Core Generation =====================
 class InferenceDemo:
     def __init__(self, args, model_path, tokenizer_, model_, image_processor_, context_len_):
         if not LLAVA_AVAILABLE:
         self.tokenizer, self.model, self.image_processor, self.context_len = (
             tokenizer_, model_, image_processor_, context_len_
         )
         self.conv_mode = "llava_v1"
         self.conversation = conv_templates[self.conv_mode].copy()
         self.num_frames = getattr(args, "num_frames", 16)
             self.chatbot = InferenceDemo(args, model_path, tokenizer, model, image_processor, context_len)
     def get_chatbot(self, args, model_path, tokenizer, model, image_processor, context_len):
         self.init_if_needed(args, model_path, tokenizer, model, image_processor, context_len)
         self.chatbot.conversation = conv_templates[self.chatbot.conv_mode].copy()
         return self.chatbot
 chat_manager = ChatSessionManager()
 def _build_prompt_and_ids(chatbot, user_text: str, device: torch.device):
     inp = f"{DEFAULT_IMAGE_TOKEN}\n{user_text}"
     chatbot.conversation.append_message(chatbot.conversation.roles[0], inp)
     chatbot.conversation.append_message(chatbot.conversation.roles[1], None)
     prompt = chatbot.conversation.get_prompt()
     input_ids = tokenizer_image_token(
         prompt, chatbot.tokenizer, IMAGE_TOKEN_INDEX, return_tensors="pt"
     ).unsqueeze(0).to(device)
     max_new_tokens: Optional[int] = None,
     conv_mode_override: Optional[str] = None,
     repetition_penalty: Optional[float] = None,
+    det_seed: Optional[int] = None,
 ):
     if not (LLAVA_AVAILABLE and TRANSFORMERS_AVAILABLE):
         return {"error": "Required libraries not available (llava/transformers)"}
     if not message_text or image_input is None:
         return {"error": "Both 'message' and 'image' are required"}
     if temperature is None: temperature = 0.05
     if top_p is None: top_p = 1.0
     if max_new_tokens is None: max_new_tokens = 4096
+    if repetition_penalty is None: repetition_penalty = 1.0
+    dbg(f"[gen] temperature={temperature} top_p={top_p} max_new_tokens={max_new_tokens} rep={repetition_penalty} seed={det_seed}")
     chatbot = chat_manager.get_chatbot(args, args.model_path, tokenizer, model, image_processor, context_len)
     if conv_mode_override and conv_mode_override in conv_templates:
         chatbot.conversation = conv_templates[conv_mode_override].copy()
     try:
         pil_img = load_image_any(image_input)
     except Exception as e:
         return {"error": f"Failed to load image: {e}"}
     img_hash, img_path = "NA", None
     try:
         buf = BytesIO(); pil_img.save(buf, format="JPEG"); raw = buf.getvalue()
         if not os.path.isfile(img_path):
             pil_img.save(img_path)
     except Exception as e:
+        warn(f"[log] save image failed: {e}")
     device = next(chatbot.model.parameters()).device
+    dtype = torch.float16
+    # Görüntü ön-işleme → tensör (fallback'lı)
     try:
+        dbg(f"[pre] PIL image size={pil_img.size}, mode={pil_img.mode}, processor={type(chatbot.image_processor)}")
         processed = process_images([pil_img], chatbot.image_processor, chatbot.model.config)
+        dbg("[pre] process_images ok")
         if isinstance(processed, (list, tuple)) and len(processed) > 0:
             image_tensor = processed[0]
         elif isinstance(processed, torch.Tensor):
             image_tensor = processed[0] if processed.ndim == 4 else processed
         else:
+            raise ValueError("Image processing returned empty")
         if image_tensor.ndim == 3:
+            image_tensor = image_tensor.unsqueeze(0)
+        image_tensor = image_tensor.to(device=device, dtype=dtype)
+        dbg(f"[pre] tensor shape={tuple(image_tensor.shape)} dtype={image_tensor.dtype} device={image_tensor.device}")
     except Exception as e:
+        warn(f"[pre] process_images failed: {e} → manual CLIP preprocess fallback kullanılacak.")
+        try:
+            from torchvision import transforms
+            from torchvision.transforms import InterpolationMode
+            preprocess = transforms.Compose([
+                transforms.Resize(224, interpolation=InterpolationMode.BICUBIC),
+                transforms.CenterCrop(224),
+                transforms.ToTensor(),
+                transforms.Normalize(
+                    mean=[0.48145466, 0.4578275, 0.40821073],
+                    std=[0.26862954, 0.26130258, 0.27577711]
+                ),
+            ])
+            image_tensor = preprocess(pil_img).unsqueeze(0).to(device=device, dtype=dtype)
+            dbg("[pre] manual CLIP preprocess fallback ok → tensor shape=" + str(tuple(image_tensor.shape)))
+        except Exception as ee:
+            return {"error": f"Image processing failed (and fallback failed): {ee}"}
     msg = (message_text or "").strip()
     msg = f"{msg}\n\n{STYLE_HINT}"
+    dbg(f"[prompt] conv_sep_style={chatbot.conversation.sep_style} sep_len={len(chatbot.conversation.sep)}")
     _, input_ids = _build_prompt_and_ids(chatbot, msg, device)
     stop_str = chatbot.conversation.sep if chatbot.conversation.sep_style != SeparatorStyle.TWO else chatbot.conversation.sep2
     stopping = SafeKeywordsStoppingCriteria(stop_str, chatbot.tokenizer)
     if det_seed is not None:
         try:
             s = int(det_seed)
         except Exception:
             pass
+    streamer = TextIteratorStreamer(chatbot.tokenizer, skip_prompt=True, skip_special_tokens=True)
     gen_kwargs = dict(
         inputs=input_ids,
         images=image_tensor,
         streamer=streamer,
+        do_sample=True,
+        temperature=float(temperature),
+        top_p=float(top_p),
+        max_new_tokens=int(max_new_tokens),
+        repetition_penalty=float(repetition_penalty),
         use_cache=False,
+        stopping_criteria=[stopping],
     )
     try:
         t = Thread(target=chatbot.model.generate, kwargs=gen_kwargs)
         t.start()
         for piece in streamer:
             chunks.append(piece)
         text = "".join(chunks)
+        text = _postprocess_min(text)
         chatbot.conversation.messages[-1][-1] = text
     except Exception as e:
         return {"error": f"Generation failed: {e}"}
     try:
         row = {
             "time": datetime.datetime.now().isoformat(),
             f.write(json.dumps(row, ensure_ascii=False) + "\n")
         _safe_upload(_conv_log_path()); _safe_upload(img_path or "")
     except Exception as e:
+        warn(f"[log] failed: {e}")
     return {"status": "success", "response": text, "conversation_id": id(chatbot.conversation)}
 # ===================== Public API =====================
 def query(payload: dict):
     """HF Endpoint entry (demo-like)."""
     global model_initialized, tokenizer, model, image_processor, context_len, args
         if not message.strip(): return {"error": "Missing 'message' text"}
         if image is None:       return {"error": "Missing 'image'. Use 'image', 'image_url', or 'img'."}
         temperature        = float(payload.get("temperature", 0.05))
         top_p              = float(payload.get("top_p", 1.0))
         max_new_tokens     = int(payload.get("max_output_tokens", payload.get("max_new_tokens", payload.get("max_tokens", 4096))))
+        repetition_penalty = float(payload.get("repetition_penalty", 1.0))
         conv_mode_override = payload.get("conv_mode", None)
         det_seed           = payload.get("det_seed", None)
     }
 # ===================== Init & Session =====================
 class _Args:
     def __init__(self):
         self.model_path = os.getenv("HF_MODEL_ID", "PULSE-ECG/PULSE-7B")
         self.model_base = None
         self.num_gpus   = int(os.getenv("NUM_GPUS", "1"))
+        self.conv_mode  = "llava_v1"
         self.max_new_tokens = int(os.getenv("MAX_NEW_TOKENS", "4096"))
         self.num_frames = 16
         self.load_8bit  = bool(int(os.getenv("LOAD_8BIT", "0")))
 def initialize_model():
     global tokenizer, model, image_processor, context_len, args
     if not LLAVA_AVAILABLE:
+        warn("[init] LLaVA not available; cannot init.")
         return False
     try:
         args = _Args()
+        dbg(f"[init] HF_MODEL_ID={args.model_path} | LOAD_8BIT={args.load_8bit} | LOAD_4BIT={args.load_4bit}")
         model_name = get_model_name_from_path(args.model_path)
         tokenizer_, model_, image_processor_, context_len_ = load_pretrained_model(
             args.model_path, args.model_base, model_name, args.load_8bit, args.load_4bit
         )
+        dbg(f"[init] load_pretrained_model ok | tokenizer={type(tokenizer_)} | model={type(model_)} | image_processor={type(image_processor_)} | context_len={context_len_}")
         try:
             _ = next(model_.parameters()).device
         except Exception:
             if torch.cuda.is_available():
                 model_ = model_.to(torch.device("cuda"))
         model_.eval()
+        dbg(f"[init] device={next(model_.parameters()).device}, cuda_available={torch.cuda.is_available()}")
+        # --- image_processor fallback zinciri ---
+        try:
+            if image_processor_ is None:
+                dbg("[init] image_processor None → AutoProcessor fallback deneniyor…")
+                try:
+                    from transformers import AutoProcessor
+                    image_processor_ = AutoProcessor.from_pretrained(args.model_path)
+                    dbg("[init] image_processor: AutoProcessor.from_pretrained(model_path) ile yüklendi.")
+                except Exception as _e1:
+                    dbg(f"[init] AutoProcessor failed: {_e1} → CLIPImageProcessor fallback deneniyor…")
+                    from transformers import CLIPImageProcessor
+                    image_processor_ = CLIPImageProcessor.from_pretrained("openai/clip-vit-large-patch14")
+                    warn("[init] image_processor: CLIPImageProcessor(openai/clip-vit-large-patch14) fallback kullanılıyor.")
+        except Exception as _e:
+            warn(f"[init] image_processor fallback failed: {_e}")
+        # --- image_processor introspection ---
+        try:
+            ip = image_processor_
+            if ip is not None:
+                crop_sz = getattr(getattr(ip, "crop_size", None), "height", None) or getattr(ip, "crop_size", None)
+                size_sz = getattr(getattr(ip, "size", None), "height", None) or getattr(ip, "size", None)
+                dbg(f"[init] image_processor crop_size={crop_sz} size={size_sz} class={ip.__class__.__name__}")
+            else:
+                warn("[init] image_processor yine None (fallback da başarısız).")
+        except Exception as e_ip:
+            warn(f"[init] image_processor inspect error: {e_ip}")
         globals()["tokenizer"] = tokenizer_
         globals()["model"] = model_
         print("[init] model/tokenizer/image_processor loaded.")
         return True
     except Exception as e:
+        warn(f"[init] failed: {e}")
         return False
 # ===================== HF EndpointHandler =====================
 class EndpointHandler:
     """Hugging Face Endpoint uyumlu sınıf"""
     def __init__(self, model_dir):
         return get_model_info()
 if __name__ == "__main__":
+    print("Handler ready (Demo Parity + Style Hint + whitespace post-process + fallbacks + debug). Use `EndpointHandler` or `query`.")
 # ===================== Minimal FastAPI Wrapper =====================
 try:
+    from fastapi import FastAPI
     from pydantic import BaseModel
     FASTAPI_AVAILABLE = True
 except Exception as e:
     FASTAPI_AVAILABLE = False
+    warn(f"fastapi/pydantic not available: {e}")
 if FASTAPI_AVAILABLE:
     app = FastAPI(title="PULSE ECG Handler API", version="1.0.0")
     class QueryIn(BaseModel):
         message: str | None = None
         query: str | None = None
         prompt: str | None = None
     async def _info():
         return get_model_info()
+    @app.get("/debug")
+    async def _debug():
+        try:
+            dev = str(next(model.parameters()).device) if model else "Unknown"
+        except Exception:
+            dev = "Unknown"
+        try:
+            ip = image_processor
+            ip_cls = ip.__class__.__name__ if ip else None
+            crop_sz = getattr(getattr(ip, "crop_size", None), "height", None) or getattr(ip, "crop_size", None)
+            size_sz = getattr(getattr(ip, "size", None), "height", None) or getattr(ip, "size", None)
+        except Exception:
+            ip_cls, crop_sz, size_sz = None, None, None
+        return {
+            "debug": bool(DEBUG),
+            "llava_available": LLAVA_AVAILABLE,
+            "transformers_available": TRANSFORMERS_AVAILABLE,
+            "device": dev,
+            "context_len": context_len,
+            "image_processor_class": ip_cls,
+            "image_processor_crop_size": crop_sz,
+            "image_processor_size": size_sz,
+            "model_path": args.model_path if args else None,
+        }
     @app.post("/query")
     async def _query(payload: QueryIn):
         return query({k: v for k, v in payload.dict().items() if v is not None})
 else:
     app = None  # uvicorn handler:app çalıştırıldığında import error verir