Update README.md
Browse files
README.md
CHANGED
|
@@ -20,6 +20,6 @@ pip install janome jaconv
|
|
| 20 |
extract_hiragana(text): テキストからひらがなを抽出します。
|
| 21 |
preprocess_text(text): テキストの前処理(改行、空白の正規化、カタカナ変換)を行います。
|
| 22 |
read_text_with_bom_removal(filepath, encoding='utf-8'): BOM付きの可能性のあるテキストファイルを読み込みます。
|
| 23 |
-
output_comparison_data(filename, original_text, preprocessed_text, hiragana_text, output_folder): 比較結果を TSV
|
| 24 |
process_file(filename, input_folder, output_folder): 個々のテキストファイルを処理します。
|
| 25 |
load_text_files(folder_path): 指定されたフォルダ内の .txt ファイルのリストを取得します。
|
|
|
|
| 20 |
extract_hiragana(text): テキストからひらがなを抽出します。
|
| 21 |
preprocess_text(text): テキストの前処理(改行、空白の正規化、カタカナ変換)を行います。
|
| 22 |
read_text_with_bom_removal(filepath, encoding='utf-8'): BOM付きの可能性のあるテキストファイルを読み込みます。
|
| 23 |
+
output_comparison_data(filename, original_text, preprocessed_text, hiragana_text, output_folder): 比較結果を TSV ファイルとJSONLファイルにに出力します。
|
| 24 |
process_file(filename, input_folder, output_folder): 個々のテキストファイルを処理します。
|
| 25 |
load_text_files(folder_path): 指定されたフォルダ内の .txt ファイルのリストを取得します。
|