VietCat commited on
Commit
273eb0a
·
1 Parent(s): 047ffe2

fix phrase removal

Browse files
Files changed (2) hide show
  1. app/config.py +3 -3
  2. app/supabase_db.py +3 -1
app/config.py CHANGED
@@ -8,9 +8,9 @@ from loguru import logger
8
  load_dotenv()
9
 
10
  # Debug: Check environment variables
11
- logger.info(f"[CONFIG] FACEBOOK_APP_SECRET from env: {os.getenv('FACEBOOK_APP_SECRET', 'NOT_SET')[5:]}...")
12
- logger.info(f"[CONFIG] FACEBOOK_VERIFY_TOKEN from env: {os.getenv('FACEBOOK_VERIFY_TOKEN', 'NOT_SET')[5:]}...")
13
- logger.info(f"[CONFIG] SUPABASE_URL from env: {os.getenv('SUPABASE_URL', 'NOT_SET')[5:]}...")
14
 
15
  class Settings(BaseSettings):
16
  """
 
8
  load_dotenv()
9
 
10
  # Debug: Check environment variables
11
+ logger.info(f"[CONFIG] FACEBOOK_APP_SECRET from env: {os.getenv('FACEBOOK_APP_SECRET', 'NOT_SET')[:5]}...")
12
+ logger.info(f"[CONFIG] FACEBOOK_VERIFY_TOKEN from env: {os.getenv('FACEBOOK_VERIFY_TOKEN', 'NOT_SET')[:5]}...")
13
+ logger.info(f"[CONFIG] SUPABASE_URL from env: {os.getenv('SUPABASE_URL', 'NOT_SET')[:5]}...")
14
 
15
  class Settings(BaseSettings):
16
  """
app/supabase_db.py CHANGED
@@ -9,8 +9,10 @@ from .constants import VEHICLE_KEYWORD_TO_COLUMN, VIETNAMESE_STOP_WORDS, VIETNAM
9
 
10
  def remove_stop_phrases(text, stop_phrases):
11
  for phrase in stop_phrases:
 
12
  # Loại bỏ cụm từ, chỉ xóa khi là từ nguyên vẹn
13
- text = re.sub(rf"\\b{re.escape(phrase)}\\b", " ", text)
 
14
  return text
15
 
16
  class SupabaseClient:
 
9
 
10
  def remove_stop_phrases(text, stop_phrases):
11
  for phrase in stop_phrases:
12
+ # Sửa: Không escape dấu cách trong phrase, chỉ escape các ký tự đặc biệt khác
13
  # Loại bỏ cụm từ, chỉ xóa khi là từ nguyên vẹn
14
+ pattern = rf"\b{phrase}\b"
15
+ text = re.sub(pattern, " ", text)
16
  return text
17
 
18
  class SupabaseClient: