Karim shoair commited on
Commit ·
e85bf1f
1
Parent(s): 73d17a7
docs: make the cli section clearer for README files of all languages
Browse files- docs/README.md +4 -5
- docs/README_AR.md +4 -5
- docs/README_CN.md +4 -5
- docs/README_DE.md +4 -5
- docs/README_ES.md +4 -5
- docs/README_JP.md +4 -5
- docs/README_RU.md +4 -5
docs/README.md
CHANGED
|
@@ -222,13 +222,12 @@ Scrapling v0.3 includes a powerful command-line interface:
|
|
| 222 |
|
| 223 |
[](https://asciinema.org/a/736339)
|
| 224 |
|
|
|
|
| 225 |
```bash
|
| 226 |
-
# Launch interactive Web Scraping shell
|
| 227 |
scrapling shell
|
| 228 |
-
|
| 229 |
-
|
| 230 |
-
|
| 231 |
-
# If ended with `.md`, it will be a markdown representation of the HTML content, and `.html` will be the HTML content right away.
|
| 232 |
scrapling extract get 'https://example.com' content.md
|
| 233 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # All elements matching the CSS selector '#fromSkipToProducts'
|
| 234 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 222 |
|
| 223 |
[](https://asciinema.org/a/736339)
|
| 224 |
|
| 225 |
+
Launch the interactive Web Scraping shell
|
| 226 |
```bash
|
|
|
|
| 227 |
scrapling shell
|
| 228 |
+
```
|
| 229 |
+
Extract pages to a file directly without programming (Extracts the content inside the `body` tag by default). If the output file ends with `.txt`, then the text content of the target will be extracted. If it ends in `.md`, it will be a Markdown representation of the HTML content; if it ends in `.html`, it will be the HTML content itself.
|
| 230 |
+
```bash
|
|
|
|
| 231 |
scrapling extract get 'https://example.com' content.md
|
| 232 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # All elements matching the CSS selector '#fromSkipToProducts'
|
| 233 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_AR.md
CHANGED
|
@@ -212,13 +212,12 @@ async with AsyncStealthySession(max_pages=2) as session:
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# تشغيل غلاف استخراج الويب التفاعلي
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# إذا انتهى بـ `.md`، فسيكون تمثيل markdown لمحتوى HTML، و`.html` سيكون محتوى HTML مباشرة.
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # جميع العناصر المطابقة لمحدد CSS '#fromSkipToProducts'
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
تشغيل غلاف استخراج الويب التفاعلي
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
استخراج الصفحات إلى ملف مباشرة دون برمجة (يستخرج المحتوى داخل وسم `body` افتراضياً). إذا انتهى ملف الإخراج بـ `.txt`، فسيتم استخراج محتوى النص للهدف. إذا انتهى بـ `.md`، فسيكون تمثيل Markdown لمحتوى HTML؛ إذا انتهى بـ `.html`، فسيكون محتوى HTML نفسه.
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # جميع العناصر المطابقة لمحدد CSS '#fromSkipToProducts'
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_CN.md
CHANGED
|
@@ -212,13 +212,12 @@ Scrapling v0.3包含强大的命令行界面:
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# 启动交互式网页抓取shell
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# 如果以`.md`结尾,它将是HTML内容的markdown表示,`.html`将直接是HTML内容。
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # 所有匹配CSS选择器'#fromSkipToProducts'的元素
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
启动交互式网页抓取shell
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
直接将页面提取到文件而无需编程(默认提取`body`标签内的内容)。如果输出文件以`.txt`结尾,则将提取目标的文本内容。如果以`.md`结尾,它将是HTML内容的Markdown表示;如果以`.html`结尾,它将是HTML内容本身。
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # 所有匹配CSS选择器'#fromSkipToProducts'的元素
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_DE.md
CHANGED
|
@@ -212,13 +212,12 @@ Scrapling v0.3 enthält eine leistungsstarke Befehlszeilenschnittstelle:
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# Interaktive Web-Scraping-Shell starten
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# Wenn sie mit `.md` endet, ist es eine Markdown-Darstellung des HTML-Inhalts, und `.html` ist direkt der HTML-Inhalt.
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Alle Elemente, die dem CSS-Selektor '#fromSkipToProducts' entsprechen
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
Interaktive Web-Scraping-Shell starten
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
Seiten direkt ohne Programmierung in eine Datei extrahieren (Extrahiert standardmäßig den Inhalt im `body`-Tag). Wenn die Ausgabedatei mit `.txt` endet, wird der Textinhalt des Ziels extrahiert. Wenn sie mit `.md` endet, ist es eine Markdown-Darstellung des HTML-Inhalts; wenn sie mit `.html` endet, ist es der HTML-Inhalt selbst.
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Alle Elemente, die dem CSS-Selektor '#fromSkipToProducts' entsprechen
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_ES.md
CHANGED
|
@@ -212,13 +212,12 @@ Scrapling v0.3 incluye una poderosa interfaz de línea de comandos:
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# Lanzar shell interactivo de Web Scraping
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# Si termina con `.md`, será una representación markdown del contenido HTML, y `.html` será el contenido HTML directamente.
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Todos los elementos que coinciden con el selector CSS '#fromSkipToProducts'
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
Lanzar shell interactivo de Web Scraping
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
Extraer páginas a un archivo directamente sin programar (Extrae el contenido dentro de la etiqueta `body` por defecto). Si el archivo de salida termina con `.txt`, entonces se extraerá el contenido de texto del objetivo. Si termina con `.md`, será una representación Markdown del contenido HTML; si termina con `.html`, será el contenido HTML en sí mismo.
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Todos los elementos que coinciden con el selector CSS '#fromSkipToProducts'
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_JP.md
CHANGED
|
@@ -212,13 +212,12 @@ Scrapling v0.3には強力なコマンドラインインターフェースが含
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# インタラクティブウェブスクレイピングシェルを起動
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# `.md`で終わる場合、HTMLコンテンツのMarkdown表現になり、`.html`は直接HTMLコンテンツになります。
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # CSSセレクタ'#fromSkipToProducts'に一致するすべての要素
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
インタラクティブウェブスクレイピングシェルを起動
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
プログラミングせずに直接ページをファイルに抽出(デフォルトで`body`タグ内のコンテンツを抽出)。出力ファイルが`.txt`で終わる場合、ターゲットのテキストコンテンツが抽出されます。`.md`で終わる場合、HTMLコンテンツのMarkdown表現になります;`.html`で終わる場合、HTMLコンテンツそのものになります。
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # CSSセレクタ'#fromSkipToProducts'に一致するすべての要素
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
docs/README_RU.md
CHANGED
|
@@ -212,13 +212,12 @@ Scrapling v0.3 включает мощный интерфейс командно
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
|
|
|
| 215 |
```bash
|
| 216 |
-
# Запустить интерактивную оболочку веб-скрапинга
|
| 217 |
scrapling shell
|
| 218 |
-
|
| 219 |
-
|
| 220 |
-
|
| 221 |
-
# Если заканчивается на `.md`, это будет markdown-представление HTML-содержимого, а `.html` будет непосредственно HTML-содержимым.
|
| 222 |
scrapling extract get 'https://example.com' content.md
|
| 223 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Все элементы, соответствующие CSS-селектору '#fromSkipToProducts'
|
| 224 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|
|
|
|
| 212 |
|
| 213 |
[](https://asciinema.org/a/736339)
|
| 214 |
|
| 215 |
+
Запустить интерактивную оболочку веб-скрапинга
|
| 216 |
```bash
|
|
|
|
| 217 |
scrapling shell
|
| 218 |
+
```
|
| 219 |
+
Извлечь страницы в файл напрямую без программирования (Извлекает содержимое внутри тега `body` по умолчанию). Если выходной файл заканчивается на `.txt`, то будет извлечено текстовое содержимое цели. Если заканчивается на `.md`, это будет Markdown-представление HTML-содержимого; если заканчивается на `.html`, это будет само HTML-содержимое.
|
| 220 |
+
```bash
|
|
|
|
| 221 |
scrapling extract get 'https://example.com' content.md
|
| 222 |
scrapling extract get 'https://example.com' content.txt --css-selector '#fromSkipToProducts' --impersonate 'chrome' # Все элементы, соответствующие CSS-селектору '#fromSkipToProducts'
|
| 223 |
scrapling extract fetch 'https://example.com' content.md --css-selector '#fromSkipToProducts' --no-headless
|