Spaces:

wanifuck
/

dots-ocr-space

Sleeping

App Files Files Community

dots-ocr-space / README.md

wanifuck's picture

Update README.md

d482402 verified 4 months ago

|

history blame contribute delete

2.05 kB

	---
	title: dots.ocr (GOT-OCR2_0) - 高精度OCR API
	emoji: 🔍
	colorFrom: blue
	colorTo: purple
	sdk: gradio
	sdk_version: 5.43.1
	app_file: app.py
	pinned: false
	license: apache-2.0
	hardware: t4-small
	---

	# 🔍 dots.ocr (GOT-OCR2_0) - 高精度OCR API

	HuggingFace Spaceで動作する高精度OCRアプリケーションです。

	## 🌟 特徴

	- 高精度OCR: 95%以上の認識精度
	- 多言語対応: 日本語、英語、中国語など80以上の言語
	- レイアウト検出: テキスト、テーブル、図表の構造認識
	- API対応: RESTful API経由での利用可能
	- GPU最適化: T4 GPU使用で高速処理

	## 🚀 使用方法

	### Webインターフェース
	1. 画像をアップロード
	2. OCRタイプを選択（ocr/format/fine-grained）
	3. 処理開始ボタンをクリック

	### API利用
	```python
	from gradio_client import Client

	client = Client("your-username/dots-ocr-space")
	result = client.predict(
	image_path, # 画像ファイルパス
	api_name="/ocr_api"
	)
	print(result)
	```

	## 📊 OCRタイプ

	- ocr: 基本的なOCR処理
	- format: フォーマットを保持したOCR
	- fine-grained: 詳細な解析を含むOCR

	## 🔧 技術仕様

	- モデル: ucaslcl/GOT-OCR2_0
	- フレームワーク: PyTorch + Transformers
	- GPU: NVIDIA T4
	- インターフェース: Gradio 4.0

	## 🌐 統合例

	このSpaceは外部のWebアプリケーションから呼び出すことができます：

	```python
	import requests
	import json

	# HuggingFace Space APIエンドポイント
	api_url = "https://your-username-dots-ocr-space.hf.space/api/predict"

	# 画像をBase64エンコードしてPOST
	response = requests.post(api_url,
	json={"data": [image_base64]},
	headers={"Content-Type": "application/json"}
	)

	result = response.json()
	print(result["data"][0]) # OCR結果
	```

	## 📝 ライセンス

	Apache 2.0 License

	## 🤝 貢献

	Issue報告やPull Requestは歓迎です。

	---

	Powered by dots.ocr (GOT-OCR2_0) • Built with Gradio