Spaces:

toropets
/

RAG2

Sleeping

antimoda1 commited on Mar 1

Commit

8199364

1 Parent(s): f6aad86

hotfix

Files changed (2) hide show

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ import plotly.express as px
 import plotly.graph_objects as go
 import pandas as pd
 from generation import wrap_prompt
-# from llm import get_llm_answer
 from retrieval import Retrieval
 from _2_splitting import YEAR_OLD, YEAR_NEW
 from vocabulary.parse_vocabulary import parse_vocabulary
@@ -491,5 +491,5 @@ with gr.Blocks(title="RAG Application", theme=gr.themes.Soft()) as iface:
 if __name__ == "__main__":
     iface.launch(ssr_mode=False,
-                #  share=True
                  )

 import plotly.graph_objects as go
 import pandas as pd
 from generation import wrap_prompt
+from llm import get_llm_answer
 from retrieval import Retrieval
 from _2_splitting import YEAR_OLD, YEAR_NEW
 from vocabulary.parse_vocabulary import parse_vocabulary
 if __name__ == "__main__":
     iface.launch(ssr_mode=False,
+                 share=True
                  )

vocabulary/parse_vocabulary.py CHANGED Viewed

@@ -2,7 +2,8 @@ def parse_vocabulary(filepath):
     """
     Парсит файл vocabulary.md и возвращает словарь: термин -> определение
-    Формат файла:
     ### Термин1, Синоним1, Синоним2
     Определение термина
@@ -18,10 +19,15 @@ def parse_vocabulary(filepath):
     while i < len(lines):
         line = lines[i].strip()
-        # Если это заголовок (начинается с ###)
-        if line.startswith('###'):
             # Взять текст после ###
-            terms_line = line[3:].strip()
             # Разбить на отдельные термины (синонимы разделены ", ")
             terms = [term.strip() for term in terms_line.split(',')]
@@ -31,7 +37,8 @@ def parse_vocabulary(filepath):
             definition = ''
             while i < len(lines):
                 def_line = lines[i].strip()
-                if def_line and not def_line.startswith('###'):
                     definition = def_line
                     break
                 i += 1

     """
     Парсит файл vocabulary.md и возвращает словарь: термин -> определение
+    Новый формат файла:
+    ## Категория
     ### Термин1, Синоним1, Синоним2
     Определение термина
     while i < len(lines):
         line = lines[i].strip()
+        # Пропускаем категории (##)
+        if line.startswith('## '):
+            i += 1
+            continue
+        # Если это заголовок термина (начинается с ###)
+        if line.startswith('### '):
             # Взять текст после ###
+            terms_line = line[4:].strip()
             # Разбить на отдельные термины (синонимы разделены ", ")
             terms = [term.strip() for term in terms_line.split(',')]
             definition = ''
             while i < len(lines):
                 def_line = lines[i].strip()
+                # Если это не пустая строка и не заголовок
+                if def_line and not def_line.startswith('###') and not def_line.startswith('## '):
                     definition = def_line
                     break
                 i += 1