[NOTICKET] fixed single source into multiple sources

#12
by sofhiaazzhr - opened
DataEyond org
No description provided.
DataEyond org
  • memperbaiki bug: key deduplication salah baca metadata, seharusnya ambil dari data dict bukan top-level metadata -> sources selalu tampil 1
  • before: document_id dan page_label dicari di top-level metadata, padahal keduanya ada di dalam data dict β†’ selalu return None β†’ key selalu (None, None) untuk semua chunk β†’ dianggap duplikat β†’ sources hanya tampil 1
  • after: document_id dan page_label diambil dari dalam data dict β†’ key unik per halaman β†’ deduplication bekerja β†’ sources tampil multiple sesuai jumlah halaman yang relevan
sofhiaazzhr changed pull request status to open
DataEyond org

ok

ishaq101 changed pull request status to merged

Sign up or log in to comment