Instructions to use alibakirx/pix2test1 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use alibakirx/pix2test1 with Transformers:
# Use a pipeline as a high-level helper # Warning: Pipeline type "image-to-text" is no longer supported in transformers v5. # You must load the model directly (see below) or downgrade to v4.x with: # 'pip install "transformers<5.0.0' from transformers import pipeline pipe = pipeline("image-to-text", model="alibakirx/pix2test1")# Load model directly from transformers import AutoModel model = AutoModel.from_pretrained("alibakirx/pix2test1", dtype="auto") - Notebooks
- Google Colab
- Kaggle
Pix2Text Model
Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.
Kullanım
from transformers import AutoModel, AutoConfig
from PIL import Image
# Model yükle
config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)
# Görüntü yükle ve tahmin yap
image = Image.open("your_image.jpg")
result = model.predict(image)
print(result)
Özellikler
- PyTorch tabanlı
- Transformers kütüphanesi ile uyumlu
- Gradio arayüzü ile test edilebilir
- Türkçe ve İngilizce metin desteği
Model Mimarisi
- CNN tabanlı görüntü kodlayıcısı
- Fully connected text decoder
- 768 boyutlu gizli katman
- 30.000 kelime dağarcığı
Performans
Model hala geliştirme aşamasındadır ve örnek amaçlıdır.
- Downloads last month
- 5