Pdf Image To Text
Last updated
Last updated
Bu aktivite, bir PDF dosyasındaki sayfaları tek tek OCR (Optical Character Recognition) işlemine alarak, her sayfadaki metni çıkartır ve bunları birleştirip size text çıktısı sunar.
Özellikler
Display Name:Aktivitenin süreç içinde ayırt edilmesi için verilen isimdir. Varsayılan olarak "CPdf Image To Text" olarak ayarlanır.
Description : Aktivitenin işlevini açıklayan isteğe bağlı bir not alanıdır. Sürecin bakımını kolaylaştırmak için kullanılır.
Delay Before : Aktivite başlamadan önce geçen bekleme süresini (saniye cinsinden) belirtir.
Varsayılan Değer: 0 (Bekleme olmadan çalışır).
Örnek Kullanım: Aktivitenin çalıştırılmasından önce belirli bir süre beklemek gerekiyorsa, bu süre burada belirtilir. Örneğin, 2 yazılırsa aktivite başlamadan önce 2 saniye bekler.
Delay After: Aktivite tamamlandıktan sonra geçen bekleme süresini (saniye cinsinden) belirtir.
Varsayılan Değer: 0 (Bekleme olmadan bir sonraki aktiviteye geçer).
Örnek Kullanım: İşlem tamamlandıktan sonra sistemde gecikmeler yaşanıyorsa ya da sonraki adımın başlaması için bir süre verilmesi gerekiyorsa, bu alanda belirtilir.
Continue On Error: Aktivite sırasında bir hata oluştuğunda sürecin devam edip etmeyeceğini kontrol eden özelliktir.
True: Aktivite hata aldığında bile süreç çalışmaya devam eder.
False: Aktivite hata alırsa süreç durur.
Varsayılan Değer: False (Varsayılan olarak süreç hata alırsa durur).
Örnek Kullanım: Kritik olmayan işlemlerde hata olsa bile sürecin devam etmesi isteniyorsa bu seçenek True olarak ayarlanır. Örneğin, bir dosyanın varlığını kontrol eden bir aktivitede hata alınırsa ve süreç bu hataya rağmen devam etmeliyse bu seçenek aktif edilir.
Inputs
Pdf Path
Veri Tipi: Text
Açıklama: OCR işlemi yapılacak PDF dosyasının tam yolu.
Örnek Kullanım: "C:\Belgeler\Dosya.pdf"
Language
Veri Tipi: Text
Açıklama: OCR işlemi yapılacak dil ailesi. Örneğin, Türkçe için "tur", İngilizce için "eng", Latince için "lat".
Örnek Kullanım: "eng" (İngilizce), "tur" (Türkçe)
Outputs
Result
Veri Tipi: Text
Açıklama: OCR işleminden elde edilen tüm sayfaların birleştirilmiş metni.
Örnek Kullanım: "Bu bir test metnidir."
Collection Result
Veri Tipi: Collection
Açıklama: OCR işleminden elde edilen sayfa başına metinleri satır satır olarak collection tipindeki bir değişkene atar.
Örnek Kullanım:
Sayfa 1: "Bu birinci sayfadır."
Sayfa 2: "Bu ikinci sayfadır."
Örnek Kullanım:
• Dijitalleştirilmiş Belgelerden Metin Çekme: Basılı metinleri dijitalleştirerek ve OCR kullanarak metin olarak kaydetme.
• Eski Belgeleri Dijitalleştirme: Eski taranmış belgelerden metin çıkarmak ve dijital ortamda kullanılabilir hale getirmek.
• Fatura ve Belge Okuma: Tarayıcı ile taranmış fatura ve belgelerden metin çıkararak veri analizine dahil etme.