Spaces:

wanifuck
/

dots-ocr-space

Sleeping

App Files Files Community

dots-ocr-space / README.md

wanifuck

Update README.md

d482402 verified 4 months ago

preview code

raw

history blame contribute delete

2.05 kB

A newer version of the Gradio SDK is available: 6.1.0

Upgrade

metadata

title: dots.ocr (GOT-OCR2_0) - 高精度OCR API
emoji: 🔍
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.43.1
app_file: app.py
pinned: false
license: apache-2.0
hardware: t4-small

🔍 dots.ocr (GOT-OCR2_0) - 高精度OCR API

HuggingFace Spaceで動作する高精度OCRアプリケーションです。

🌟 特徴

高精度OCR: 95%以上の認識精度
多言語対応: 日本語、英語、中国語など80以上の言語
レイアウト検出: テキスト、テーブル、図表の構造認識
API対応: RESTful API経由での利用可能
GPU最適化: T4 GPU使用で高速処理

🚀 使用方法

Webインターフェース

画像をアップロード
OCRタイプを選択（ocr/format/fine-grained）
処理開始ボタンをクリック

API利用

from gradio_client import Client

client = Client("your-username/dots-ocr-space")
result = client.predict(
    image_path,  # 画像ファイルパス
    api_name="/ocr_api"
)
print(result)

📊 OCRタイプ

ocr: 基本的なOCR処理
format: フォーマットを保持したOCR
fine-grained: 詳細な解析を含むOCR

🔧 技術仕様

モデル: ucaslcl/GOT-OCR2_0
フレームワーク: PyTorch + Transformers
GPU: NVIDIA T4
インターフェース: Gradio 4.0

🌐 統合例

このSpaceは外部のWebアプリケーションから呼び出すことができます：

import requests
import json

# HuggingFace Space APIエンドポイント
api_url = "https://your-username-dots-ocr-space.hf.space/api/predict"

# 画像をBase64エンコードしてPOST
response = requests.post(api_url, 
    json={"data": [image_base64]},
    headers={"Content-Type": "application/json"}
)

result = response.json()
print(result["data"][0])  # OCR結果

📝 ライセンス

Apache 2.0 License

🤝 貢献

Issue報告やPull Requestは歓迎です。