jnjj
/

Vvbvv

@@ -9,7 +9,7 @@ library_name: transformers
 ## Progreso de Entrenamiento
-- **Datasets procesados:** 6.0
-- **Ejemplos de texto procesados:** 18.0
-- **Tokens procesados:** 7025.0
-- **Última subida:** 2025-05-06 14:33:15 UTC

 ## Progreso de Entrenamiento
+- **Datasets procesados:** 9.0
+- **Ejemplos de texto procesados:** 27.0
+- **Tokens procesados:** 10676.0
+- **Última subida:** 2025-05-06 14:34:18 UTC

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:95905cb9c1afd7c6103c1e1fcc9fc6fbd26e197063087f7d7d0ddb66deaa8871
 size 51957256

 version https://git-lfs.github.com/spec/v1
+oid sha256:260d4fa77856dc2ee64e872ada25b5c99b1b68cd1da1ef8bfa558f36fbb2e4ae
 size 51957256

training.log CHANGED Viewed

@@ -81,3 +81,62 @@ Traceback (most recent call last):
   File "pyarrow/error.pxi", line 155, in pyarrow.lib.pyarrow_internal_check_status
   File "pyarrow/error.pxi", line 92, in pyarrow.lib.check_status
 pyarrow.lib.ArrowInvalid: JSON parse error: Invalid value. in row 0

   File "pyarrow/error.pxi", line 155, in pyarrow.lib.pyarrow_internal_check_status
   File "pyarrow/error.pxi", line 92, in pyarrow.lib.check_status
 pyarrow.lib.ArrowInvalid: JSON parse error: Invalid value. in row 0
+2025-05-06 16:33:18,163 INFO: Upload successful.
+2025-05-06 16:33:22,552 INFO: Preparing data for Eureka-Lab/PHYBench, config: default
+2025-05-06 16:33:22,655 INFO: Preparing data for nyuuzyou/svgfind, config: default
+2025-05-06 16:33:24,226 INFO: Starting model update for Eureka-Lab/PHYBench, config: default
+2025-05-06 16:33:25,829 ERROR: Error during data preparation for nyuuzyou/svgfind config default: Compression type zstd not supported
+Traceback (most recent call last):
+  File "/home/user/app/app.py", line 233, in process_and_train
+    first_item = await asyncio.to_thread(lambda: next(iter(train_ds_instance), None))
+  File "/usr/local/lib/python3.10/asyncio/threads.py", line 25, in to_thread
+    return await loop.run_in_executor(None, func_call)
+  File "/usr/local/lib/python3.10/concurrent/futures/thread.py", line 58, in run
+    result = self.fn(*self.args, **self.kwargs)
+  File "/home/user/app/app.py", line 233, in <lambda>
+    first_item = await asyncio.to_thread(lambda: next(iter(train_ds_instance), None))
+  File "/usr/local/lib/python3.10/site-packages/datasets/iterable_dataset.py", line 2266, in __iter__
+    for key, example in ex_iterable:
+  File "/usr/local/lib/python3.10/site-packages/datasets/iterable_dataset.py", line 222, in __iter__
+    for key_example in islice(self.generate_examples_fn(**gen_kwags), shard_example_idx_start, None):
+  File "/usr/local/lib/python3.10/site-packages/datasets/packaged_modules/generator/generator.py", line 33, in _generate_examples
+    yield from enumerate(self.config.generator(**gen_kwargs))
+  File "/home/user/app/app.py", line 214, in gen_data_for_cfg
+    for ex in dataset_split:
+  File "/usr/local/lib/python3.10/site-packages/datasets/iterable_dataset.py", line 2266, in __iter__
+    for key, example in ex_iterable:
+  File "/usr/local/lib/python3.10/site-packages/datasets/iterable_dataset.py", line 302, in __iter__
+    for key, pa_table in self.generate_tables_fn(**gen_kwags):
+  File "/usr/local/lib/python3.10/site-packages/datasets/packaged_modules/json/json.py", line 99, in _generate_tables
+    for file_idx, file in enumerate(itertools.chain.from_iterable(files)):
+  File "/usr/local/lib/python3.10/site-packages/datasets/utils/track.py", line 49, in __iter__
+    for x in self.generator(*self.args):
+  File "/usr/local/lib/python3.10/site-packages/datasets/utils/file_utils.py", line 1366, in _iter_from_urlpaths
+    elif xisdir(urlpath, download_config=download_config):
+  File "/usr/local/lib/python3.10/site-packages/datasets/utils/file_utils.py", line 799, in xisdir
+    return fs.isdir(inner_path)
+  File "/usr/local/lib/python3.10/site-packages/fsspec/spec.py", line 701, in isdir
+    return self.info(path)["type"] == "directory"
+  File "/usr/local/lib/python3.10/site-packages/fsspec/archive.py", line 40, in info
+    self._get_dirs()
+  File "/usr/local/lib/python3.10/site-packages/datasets/filesystems/compression.py", line 66, in _get_dirs
+    f = {**self._open_with_fsspec().fs.info(self.fo), "name": self.uncompressed_name}
+  File "/usr/local/lib/python3.10/site-packages/fsspec/core.py", line 491, in open
+    out = open_files(
+  File "/usr/local/lib/python3.10/site-packages/fsspec/core.py", line 314, in open_files
+    [
+  File "/usr/local/lib/python3.10/site-packages/fsspec/core.py", line 315, in <listcomp>
+    OpenFile(
+  File "/usr/local/lib/python3.10/site-packages/fsspec/core.py", line 78, in __init__
+    self.compression = get_compression(path, compression)
+  File "/usr/local/lib/python3.10/site-packages/fsspec/core.py", line 544, in get_compression
+    raise ValueError(f"Compression type {compression} not supported")
+ValueError: Compression type zstd not supported
+2025-05-06 16:33:27,737 INFO: Finished training and saved model/tokenizer for Eureka-Lab/PHYBench config default
+2025-05-06 16:33:27,738 ERROR: Error in background_training_loop task scheduling: local variable 'merged_model' referenced before assignment
+2025-05-06 16:33:28,089 INFO: Preparing data for FreedomIntelligence/medical-o1-reasoning-SFT, config: en
+2025-05-06 16:33:28,153 INFO: Preparing data for BramVanroy/CommonCrawl-CreativeCommons, config: v1
+2025-05-06 16:33:32,653 INFO: Starting model update for FreedomIntelligence/medical-o1-reasoning-SFT, config: en
+2025-05-06 16:33:36,683 INFO: Finished training and saved model/tokenizer for FreedomIntelligence/medical-o1-reasoning-SFT config en
+2025-05-06 16:33:36,683 INFO: Starting model update for BramVanroy/CommonCrawl-CreativeCommons, config: v1
+2025-05-06 16:33:38,967 INFO: Finished training and saved model/tokenizer for BramVanroy/CommonCrawl-CreativeCommons config v1