Tesseract OCR
Last updated
Last updated
Bu aktivite, Tesseract OCR kullanarak bir resimden metin çıkarmaya (Image to Text) yarar. OCR işlemi, Türkçe, İngilizce ve Latince dillerinde desteklenmektedir. Farklı diller için teknik destek alınmalıdır.
Özellikler
Display Name:Aktivitenin süreç içinde ayırt edilmesi için verilen isimdir. Varsayılan olarak "Tesseract OCR" olarak ayarlanır.
Description : Aktivitenin işlevini açıklayan isteğe bağlı bir not alanıdır. Sürecin bakımını kolaylaştırmak için kullanılır.
Delay Before : Aktivite başlamadan önce geçen bekleme süresini (saniye cinsinden) belirtir.
Varsayılan Değer: 0 (Bekleme olmadan çalışır).
Örnek Kullanım: Aktivitenin çalıştırılmasından önce belirli bir süre beklemek gerekiyorsa, bu süre burada belirtilir. Örneğin, 2 yazılırsa aktivite başlamadan önce 2 saniye bekler.
Delay After: Aktivite tamamlandıktan sonra geçen bekleme süresini (saniye cinsinden) belirtir.
Varsayılan Değer: 0 (Bekleme olmadan bir sonraki aktiviteye geçer).
Örnek Kullanım: İşlem tamamlandıktan sonra sistemde gecikmeler yaşanıyorsa ya da sonraki adımın başlaması için bir süre verilmesi gerekiyorsa, bu alanda belirtilir.
Continue On Error: Aktivite sırasında bir hata oluştuğunda sürecin devam edip etmeyeceğini kontrol eden özelliktir.
True: Aktivite hata aldığında bile süreç çalışmaya devam eder.
False: Aktivite hata alırsa süreç durur.
Varsayılan Değer: False (Varsayılan olarak süreç hata alırsa durur).
Örnek Kullanım: Kritik olmayan işlemlerde hata olsa bile sürecin devam etmesi isteniyorsa bu seçenek True olarak ayarlanır. Örneğin, bir dosyanın varlığını kontrol eden bir aktivitede hata alınırsa ve süreç bu hataya rağmen devam etmeliyse bu seçenek aktif edilir.
Inputs
Image Path ○ Veri Tipi: Text ○ Açıklama: OCR işlemi yapılacak resmin tam dosya yoludur. ○ Örnek Kullanım: "C:\Images\document.png"
Language ○ Veri Tipi: Text ○ Açıklama: OCR işlemi için kullanılacak dil kodudur. ○ Örnek Kullanım:
"tur" → Türkçe OCR işlemi için
"eng" → İngilizce OCR işlemi için
OCR Engine Mode
○ Veri Tipi: Text
○ Açıklama: OCR motorunun çalışma modunu belirtir. Detaylı ayarlar, motorun performansını ve işlevselliğini optimize etmek için kullanılabilir.
○ Örnek Kullanım: "1" (Örneğin, Tesseract’ın standart motor modları)
Outputs
OCR Result ○ Veri Tipi: Collection ○ Açıklama: OCR işleminin sonucunu, satır bazlı olarak Collection/Datatable formatında sunar. Kolon başlığı "Result" olarak belirlenmiştir. ○ Örnek Kullanım:
Result
Merhaba
Dünya
OCR Text Result ○ Veri Tipi: Text ○ Açıklama: OCR işleminin sonucunu düz metin formatında döndürür. ○ Örnek Kullanım: "Merhaba Dünya"
Örnek Kullanım
Basılı Evrak Dijitalleştirme: Kağıt üzerindeki yazıları dijital metne çevirmek.
Ekran Üzerinden Metin Okuma: Bir ekran görüntüsündeki yazıyı almak.
Otomatik Veri İşleme: OCR ile metin alıp, bir sistemde işlemek.
Örnek Kullanım: