tomo2chin2 commited on
Commit
fec16bf
·
verified ·
1 Parent(s): b2b5bfe

Upload presets.py

Browse files
Files changed (1) hide show
  1. presets.py +41 -2
presets.py CHANGED
@@ -22,10 +22,49 @@ SYSTEM_PROMPTS = {
22
  """,
23
 
24
  "教育・参考書": """
25
- 与えられたPDFをOCRして、正確にマークダウンにして出力してください。
26
- PDFは全て「塾技_国語」という参考書をスキャンしたもので、全体を12分割したファイルの一つです。
27
  国語の参考書なので人間は右から読んでいきます。ページによっては上下のロウに分かれていて、その時は上のロウから人間は読んでいきます。このように人間が読む順序に従ってマークダウンを構成してください。
28
  また重要度が★の数で示されています。「★★★」がもっとも重要で、「☆☆★」が最も重要度が低い。のちのデータ活用時にこの重要度は大事なのでかならず設定されていたら抜き出してください。
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
29
  """,
30
 
31
  "ビジネス文書": """
 
22
  """,
23
 
24
  "教育・参考書": """
25
+ 与えられたPDFをOCRして、正確に省略・中略せずにマークダウンにして出力してください。
26
+ PDFは全て参考書をスキャンしたもので、全体を分割したファイルの一つです。
27
  国語の参考書なので人間は右から読んでいきます。ページによっては上下のロウに分かれていて、その時は上のロウから人間は読んでいきます。このように人間が読む順序に従ってマークダウンを構成してください。
28
  また重要度が★の数で示されています。「★★★」がもっとも重要で、「☆☆★」が最も重要度が低い。のちのデータ活用時にこの重要度は大事なのでかならず設定されていたら抜き出してください。
29
+
30
+ 出力形式は以下のスキーマに従ってください。
31
+ ```json
32
+ {
33
+ "type": "array",
34
+ "items": {
35
+ "type": "object",
36
+ "properties": {
37
+ "number": {
38
+ "type": ["integer", "string"],
39
+ "description": "連番または識別番号"
40
+ },
41
+ "title": {
42
+ "type": "string",
43
+ "description": "主題、テーマ、タイトル"
44
+ },
45
+ "stars": {
46
+ "type": ["integer", "string"],
47
+ "description": "重要度(星の数など)"
48
+ },
49
+ "technic": {
50
+ "type": "string",
51
+ "description": "ページ上段のテクニック解説文"
52
+ },
53
+ "test": {
54
+ "type": "string",
55
+ "description": "ページ下段の入試問題、本文と問"
56
+ }
57
+ },
58
+ "required": [
59
+ "number",
60
+ "title",
61
+ "stars",
62
+ "technic",
63
+ "test"
64
+ ]
65
+ }
66
+ }
67
+ ```
68
  """,
69
 
70
  "ビジネス文書": """