alibakirx
/

pix2test1

computer-vision

Model card Files Files and versions

pix2test1 / README.md

alibakirx's picture

Upload README.md with huggingface_hub

1a9df35 verified 6 months ago

|

history blame contribute delete

1.17 kB

	---
	title: Pix2Text
	emoji: 🔤
	colorFrom: blue
	colorTo: green
	sdk: gradio
	sdk_version: 3.50.0
	app_file: app.py
	pinned: false
	license: mit
	language:
	- en
	- tr
	tags:
	- ocr
	- image-to-text
	- computer-vision
	- transformers
	---

	# Pix2Text Model

	Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.

	## Kullanım

	```python
	from transformers import AutoModel, AutoConfig
	from PIL import Image

	# Model yükle
	config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
	model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)

	# Görüntü yükle ve tahmin yap
	image = Image.open("your_image.jpg")
	result = model.predict(image)
	print(result)
	```

	## Özellikler

	- PyTorch tabanlı
	- Transformers kütüphanesi ile uyumlu
	- Gradio arayüzü ile test edilebilir
	- Türkçe ve İngilizce metin desteği

	## Model Mimarisi

	- CNN tabanlı görüntü kodlayıcısı
	- Fully connected text decoder
	- 768 boyutlu gizli katman
	- 30.000 kelime dağarcığı

	## Performans

	Model hala geliştirme aşamasındadır ve örnek amaçlıdır.