Spaces:

CiscsoPonce
/

PrimoGreedy-Agent

Sleeping

CiscsoPonce commited on Mar 7

Commit

b329f6a

1 Parent(s): d022d8f

fix: bump structured output token limit to 8192 + add noise words

- Increase max_tokens from 4096 to 8192 to reduce fallback rate
(reasoning models burn ~2000 tokens thinking before structured output)
- Add FINRA, LISA, ATM, AMA, FDA, PHNX, IPG and other financial
acronyms to the noise word filter

Made-with: Cursor

Files changed (2) hide show

src/core/ticker_utils.py +2 -0
src/llm.py +1 -1

src/core/ticker_utils.py CHANGED Viewed

@@ -40,6 +40,8 @@ NOISE_WORDS = frozenset({
     # Financial acronyms / index names that aren't tradeable tickers
     "ROCE", "FTSE", "DJIA", "EBIT", "WACC", "CAGR", "ROIC", "REIT",
     "SPAC", "NBER", "OPEC", "MSCI", "EMEA", "APAC", "OECD", "FIFO",
 })
 _MAX_TICKER_LEN = 8  # longest valid ticker with suffix: e.g. CHE.UN.TO

     # Financial acronyms / index names that aren't tradeable tickers
     "ROCE", "FTSE", "DJIA", "EBIT", "WACC", "CAGR", "ROIC", "REIT",
     "SPAC", "NBER", "OPEC", "MSCI", "EMEA", "APAC", "OECD", "FIFO",
+    "FINRA", "SIPC", "FDIC", "LISA", "ISA", "ATM", "AMA", "FDA",
+    "PHNX", "IPG", "GAAP", "IFRS", "FASB", "IASB", "PCAOB",
 })
 _MAX_TICKER_LEN = 8  # longest valid ticker with suffix: e.g. CHE.UN.TO

src/llm.py CHANGED Viewed

@@ -48,7 +48,7 @@ def get_llm() -> ChatOpenAI:
     return _llm_instance
-def get_structured_llm(max_tokens: int = 4096) -> ChatOpenAI:
     """Return an LLM instance configured for structured output.
     Uses a capped ``max_tokens`` to prevent reasoning models from

     return _llm_instance
+def get_structured_llm(max_tokens: int = 8192) -> ChatOpenAI:
     """Return an LLM instance configured for structured output.
     Uses a capped ``max_tokens`` to prevent reasoning models from