VietCat commited on
Commit
f327063
·
1 Parent(s): e9365bc

fix embedding

Browse files
Files changed (4) hide show
  1. app/constants.py +26 -3
  2. app/embedding.py +3 -2
  3. app/main.py +1 -0
  4. app/sheets.py +0 -3
app/constants.py CHANGED
@@ -1,11 +1,34 @@
1
- VEHICLE_KEYWORDS = ["xe máy", "ô tô", "xe đạp", "xe hơi"]
 
 
 
 
 
 
 
 
2
  SHEET_RANGE = 'chat!A2:I'
3
  EMBEDDING_DIM = 1536
4
 
5
  # Mapping từ từ khóa sang tên cột trong bảng tblPhuongtien
6
  VEHICLE_KEYWORD_TO_COLUMN = {
7
- "xe máy": "xemay",
 
8
  "ô tô": "oto",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9
  "xe đạp": "xedap",
10
- "xe hơi": "xehoi"
11
  }
 
1
+ VEHICLE_KEYWORDS = [
2
+ "ô tô tải", "xe tải",
3
+ "ô tô", "xe khách", "ô tô khách",
4
+ "mô tô", "xe máy điện", "xe máy", "xe gắn máy",
5
+ "máy kéo", "xe chuyên dùng",
6
+ "xe đạp máy", "xe đạp điện", "xe thô sơ", "xích lô", "xe bò", "súc vật kéo", "xe đạp",
7
+ "đi bộ"
8
+ ]
9
+
10
  SHEET_RANGE = 'chat!A2:I'
11
  EMBEDDING_DIM = 1536
12
 
13
  # Mapping từ từ khóa sang tên cột trong bảng tblPhuongtien
14
  VEHICLE_KEYWORD_TO_COLUMN = {
15
+ "ô tô tải": "otoTai",
16
+ "xe tải": "otoTai",
17
  "ô tô": "oto",
18
+ "xe khách": "oto",
19
+ "ô tô khách": "oto",
20
+ "mô tô": "moto",
21
+ "xe máy điện": "xemaydien",
22
+ "xe máy": "xeganmay",
23
+ "xe gắn máy": "xeganmay",
24
+ "máy kéo": "maykeo",
25
+ "xe chuyên dùng": "xechuyendung",
26
+ "xe đạp máy": "xedapmay",
27
+ "xe đạp điện": "xedapdien",
28
+ "xe thô sơ": "xethoso",
29
+ "xích lô": "xichlo",
30
+ "xe bò": "sucvat",
31
+ "súc vật kéo": "sucvat",
32
  "xe đạp": "xedap",
33
+ "đi bộ": "dibo"
34
  }
app/embedding.py CHANGED
@@ -43,12 +43,13 @@ class EmbeddingClient:
43
  # return embedding
44
 
45
  response = await self._client.post(
46
- "https://vietcat-vietnameseembeddingv2.hf.space/embed",
 
47
  json={"text": text}
48
  )
49
  response.raise_for_status()
50
  data = response.json()
51
- logger.info(f"[DEBUG] Embedding API response: {data}")
52
  return data["embedding"]
53
  except Exception as e:
54
  logger.error(f"Error creating embedding: {e}")
 
43
  # return embedding
44
 
45
  response = await self._client.post(
46
+ "https://vietcat-bgem3node.hf.space/embed",
47
+ # "https://vietcat-vietnameseembeddingv2.hf.space/embed",
48
  json={"text": text}
49
  )
50
  response.raise_for_status()
51
  data = response.json()
52
+ logger.info(f"[DEBUG] Embedding API response: {data[:10]}...{data[-10:]}")
53
  return data["embedding"]
54
  except Exception as e:
55
  logger.error(f"Error creating embedding: {e}")
app/main.py CHANGED
@@ -106,6 +106,7 @@ async def webhook(request: Request):
106
 
107
  try:
108
  body = json.loads(body_bytes)
 
109
  # Kiểm tra an toàn echo
110
  is_echo = (
111
  isinstance(body, dict)
 
106
 
107
  try:
108
  body = json.loads(body_bytes)
109
+ logger.info(f"[DEBUG] body: {body}")
110
  # Kiểm tra an toàn echo
111
  is_echo = (
112
  isinstance(body, dict)
app/sheets.py CHANGED
@@ -90,11 +90,8 @@ class SheetsClient:
90
  history = []
91
 
92
  for row in values:
93
- logger.info(f"[DEBUG] row raw: {row}")
94
  # Bổ sung cột rỗng cho đủ 9 cột
95
  row = row + [""] * (9 - len(row))
96
- logger.info(f"[DEBUG] row: {row}")
97
- logger.info(f"[DEBUG] row: {row[4]}:{user_id} - {row[5]}:{page_id} - {row[8].lower()}:false")
98
  if row[4] == user_id and row[5] == page_id and row[8].lower() == 'false':
99
  history.append({
100
  'conversation_id': row[0],
 
90
  history = []
91
 
92
  for row in values:
 
93
  # Bổ sung cột rỗng cho đủ 9 cột
94
  row = row + [""] * (9 - len(row))
 
 
95
  if row[4] == user_id and row[5] == page_id and row[8].lower() == 'false':
96
  history.append({
97
  'conversation_id': row[0],