Spaces:

chenzihong
/

GraphGen

Running

github-actions[bot] commited on 13 days ago

Commit

3389c47

1 Parent(s): e358663

Auto-sync from demo at Mon Jan 5 10:28:58 UTC 2026

Files changed (1) hide show

graphgen/models/llm/local/vllm_wrapper.py CHANGED Viewed

@@ -18,10 +18,14 @@ class VLLMWrapper(BaseLLMWrapper):
         gpu_memory_utilization: float = 0.9,
         temperature: float = 0.6,
         top_p: float = 1.0,
-        topk: int = 5,
         **kwargs: Any,
     ):
-        super().__init__(temperature=temperature, top_p=top_p, **kwargs)
         try:
             from vllm import AsyncEngineArgs, AsyncLLMEngine, SamplingParams
         except ImportError as exc:
@@ -39,9 +43,6 @@ class VLLMWrapper(BaseLLMWrapper):
             disable_log_stats=False,
         )
         self.engine = AsyncLLMEngine.from_engine_args(engine_args)
-        self.temperature = temperature
-        self.top_p = top_p
-        self.topk = topk
     @staticmethod
     def _build_inputs(prompt: str, history: Optional[List[str]] = None) -> str:
@@ -89,7 +90,7 @@ class VLLMWrapper(BaseLLMWrapper):
         sp = self.SamplingParams(
             temperature=0,
             max_tokens=1,
-            logprobs=self.topk,
             prompt_logprobs=1,
         )

         gpu_memory_utilization: float = 0.9,
         temperature: float = 0.6,
         top_p: float = 1.0,
+        top_k: int = 5,
         **kwargs: Any,
     ):
+        temperature = float(temperature)
+        top_p = float(top_p)
+        top_k = int(top_k)
+        super().__init__(temperature=temperature, top_p=top_p, top_k=top_k, **kwargs)
         try:
             from vllm import AsyncEngineArgs, AsyncLLMEngine, SamplingParams
         except ImportError as exc:
             disable_log_stats=False,
         )
         self.engine = AsyncLLMEngine.from_engine_args(engine_args)
     @staticmethod
     def _build_inputs(prompt: str, history: Optional[List[str]] = None) -> str:
         sp = self.SamplingParams(
             temperature=0,
             max_tokens=1,
+            logprobs=self.top_k,
             prompt_logprobs=1,
         )