Spaces:

Nguyen5
/

chatbot

Sleeping

Nguyen5 commited on Dec 4, 2025

Commit

40ce2a9

1 Parent(s): e640fc1

commit

Files changed (1) hide show

load_documents.py CHANGED Viewed

@@ -114,32 +114,3 @@ if __name__ == "__main__":
     docs = load_documents()
     print(docs[0])
     print("Total:", len(docs))
-- split_documents.py:
-# split_documents.py – v2
-from langchain_text_splitters import RecursiveCharacterTextSplitter
-CHUNK_SIZE = 1500
-CHUNK_OVERLAP = 200
-def split_documents(docs):
-    splitter = RecursiveCharacterTextSplitter(
-        chunk_size=CHUNK_SIZE,
-        chunk_overlap=CHUNK_OVERLAP,
-        separators=["\n\n", "\n", ". ", " ", ""],
-    )
-    chunks = splitter.split_documents(docs)
-    for c in chunks:
-        c.metadata["chunk_size"] = CHUNK_SIZE
-        c.metadata["chunk_overlap"] = CHUNK_OVERLAP
-    return chunks
-if __name__ == "__main__":
-    from load_documents import load_documents
-    docs = load_documents()
-    chunks = split_documents(docs)
-    print("Docs:", len(docs), "Chunks:", len(chunks))
-    print(chunks[0].page_content[:300], chunks[0].metadata)

     docs = load_documents()
     print(docs[0])
     print("Total:", len(docs))