| title: Pix2Text | |
| emoji: 🔤 | |
| colorFrom: blue | |
| colorTo: green | |
| sdk: gradio | |
| sdk_version: 3.50.0 | |
| app_file: app.py | |
| pinned: false | |
| license: mit | |
| language: | |
| - en | |
| - tr | |
| tags: | |
| - ocr | |
| - image-to-text | |
| - computer-vision | |
| - transformers | |
| # Pix2Text Model | |
| Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir. | |
| ## Kullanım | |
| ```python | |
| from transformers import AutoModel, AutoConfig | |
| from PIL import Image | |
| # Model yükle | |
| config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True) | |
| model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True) | |
| # Görüntü yükle ve tahmin yap | |
| image = Image.open("your_image.jpg") | |
| result = model.predict(image) | |
| print(result) | |
| ``` | |
| ## Özellikler | |
| - PyTorch tabanlı | |
| - Transformers kütüphanesi ile uyumlu | |
| - Gradio arayüzü ile test edilebilir | |
| - Türkçe ve İngilizce metin desteği | |
| ## Model Mimarisi | |
| - CNN tabanlı görüntü kodlayıcısı | |
| - Fully connected text decoder | |
| - 768 boyutlu gizli katman | |
| - 30.000 kelime dağarcığı | |
| ## Performans | |
| Model hala geliştirme aşamasındadır ve örnek amaçlıdır. | |