# Tesseract Regex In OCR

Bu aktivite, Tesseract OCR kullanarak bir resimden metin çıkarmaya (Image to Text) ve belirli bir Regex pattern ile veri aramaya yarar. OCR işlemi, Türkçe, İngilizce ve Latince dillerinde desteklenmektedir. Farklı diller için teknik destek alınmalıdır.&#x20;

**Özellikler** &#x20;

* **Display Name:** Aktivitenin süreç içinde ayırt edilmesi için verilen isimdir. Varsayılan olarak "Tessaract Regex In OCR" olarak ayarlanır. &#x20;
* **Description:** Aktivitenin işlevini açıklayan isteğe bağlı bir not alanıdır. Sürecin bakımını kolaylaştırmak için kullanılır. &#x20;
* **Delay Before:** Aktivite başlamadan önce geçen bekleme süresini (saniye cinsinden) belirtir. &#x20;
  * **Varsayılan Değer:** 0 (Bekleme olmadan çalışır). &#x20;
  * **Örnek Kullanım:** Aktivitenin çalıştırılmasından önce belirli bir süre beklemek gerekiyorsa, bu süre burada belirtilir. Örneğin, 2 yazılırsa aktivite başlamadan önce 2 saniye bekler. &#x20;
* **Delay After:** Aktivite tamamlandıktan sonra geçen bekleme süresini (saniye cinsinden) belirtir. &#x20;
  * Varsayılan Değer: 0 (Bekleme olmadan bir sonraki aktiviteye geçer). &#x20;
  * Örnek Kullanım: İşlem tamamlandıktan sonra sistemde gecikmeler yaşanıyorsa ya da sonraki adımın başlaması için bir süre verilmesi gerekiyorsa, bu alanda belirtilir.    &#x20;
* **Continue On Error:** Aktivite sırasında bir hata oluştuğunda sürecin devam edip etmeyeceğini kontrol eden özelliktir. &#x20;
  * **True:** Aktivite hata aldığında bile süreç çalışmaya devam eder. &#x20;
  * **False:** Aktivite hata alırsa süreç durur. &#x20;
  * **Varsayılan Değer:** False (Varsayılan olarak süreç hata alırsa durur). &#x20;
  * **Örnek Kullanım:** Kritik olmayan işlemlerde hata olsa bile sürecin devam etmesi isteniyorsa bu seçenek True olarak ayarlanır. Örneğin, bir dosyanın varlığını kontrol eden bir aktivitede hata alınırsa ve süreç bu hataya rağmen devam etmeliyse bu seçenek aktif edilir. &#x20;

&#x20;

<figure><img src="/files/ysophcNq5410RtK7vp0g" alt=""><figcaption></figcaption></figure>

**Inputs** &#x20;

* **Image Path**&#x20;
  * **Veri Tipi:** Text&#x20;
  * **Açıklama:** OCR işlemi yapılacak resmin tam dosya yoludur.&#x20;
  * **Örnek Kullanım:** "C:\Images\document.png"  &#x20;
* **Regex Pattern**&#x20;
  * **Veri Tipi:** Text&#x20;
  * **Açıklama:** OCR sonucunda belirli bir desen (pattern) ile arama yapmak için kullanılan Regex ifadesidir.&#x20;
  * **Örnek Kullanım:**&#x20;
    * **"\d{4}-\d{2}-\d{2}":** Tarih formatı (YYYY-MM-DD) araması yapar.&#x20;
    * **"\[A-Z]{3}\d{3}":** Üç harf ve üç rakamdan oluşan bir kodu yakalar (örn: ABC123).&#x20;
* **Language**&#x20;
  * **Veri Tipi:** Text&#x20;
  * **Açıklama:** OCR işlemi için kullanılacak dil kodudur.&#x20;
  * **Örnek Kullanım:**&#x20;
    * **tur:** Türkçe OCR işlemi için&#x20;
    * **eng:** İngilizce OCR işlemi için&#x20;
* **Result Header Column Name**&#x20;
  * **Veri Tipi:** Text&#x20;
  * **Açıklama:** Regex sonucu Collection/Datatable olarak döndürülecektir. Kolon başlığı bu parametreye göre belirlenir. Varsayılan değer "Result" olarak atanmıştır.&#x20;
  * **Örnek Kullanım:** "Tarih" (Çıktıdaki sütun adı "Tarih" olur.)&#x20;

<figure><img src="/files/CHWaBh7rvcSj7UbJ8gOh" alt=""><figcaption></figcaption></figure>

**Outputs**&#x20;

* **OCR Result**&#x20;
  * &#x20;**Veri Tipi:** Collection&#x20;
  * **Açıklama:** OCR işlemi sonucunda, Regex pattern'ine uyan değerleri içeren bir Collection/Datatable çıktısı döner. Kolon adı Result Header Column Name parametresine göre değişir.&#x20;
  * **Örnek Kullanım:**
    * **\[dt\_TesseractRegex]:** Collection adı verilir.

&#x20;

**Örnek Kullanım:**&#x20;

* **Fatura Bilgisi Okuma:** OCR ile belgelerden tarih veya fatura numarası çekme.&#x20;
* **Kimlik ve Form Bilgisi Çekme:** Kimlik kartı veya belgelerden belirli kod veya numara bilgilerini ayıklama.&#x20;
* **Belirli Kelime/Kod Arama:** OCR sonucunda Regex ile özel bir desen yakalama.&#x20;

{% embed url="<https://www.genrpa.com/download/Activities/OPERATIONS/Operations_Ocr/Operations_TesseractRegexInOcr.xml>" %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.genrpa.com/aktiviteler/operations/ocr/tesseract-regex-in-ocr.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
