LBFGS Logistic Regression Train Model

Bu aktivite, belirli bir veri kümesi üzerinde L-BFGS algoritması ile lojistik regresyon eğitimi gerçekleştirmek için kullanılır. Eğitim parametreleri ve veri kümesi yol bilgisi girilerek model oluşturulması sağlanır.

Özellikler

  • Display Name:Aktivitenin süreç içinde ayırt edilmesi için verilen isimdir. Varsayılan olarak "LBFGS Logistic Regression Train Model" olarak ayarlanır.

  • Description : Aktivitenin işlevini açıklayan isteğe bağlı bir not alanıdır. Sürecin bakımını kolaylaştırmak için kullanılır.

  • Delay Before : Aktivite başlamadan önce geçen bekleme süresini (saniye cinsinden) belirtir.

    • Varsayılan Değer: 0 (Bekleme olmadan çalışır).

    • Örnek Kullanım: Aktivitenin çalıştırılmasından önce belirli bir süre beklemek gerekiyorsa, bu süre burada belirtilir. Örneğin, 2 yazılırsa aktivite başlamadan önce 2 saniye bekler.

  • Delay After: Aktivite tamamlandıktan sonra geçen bekleme süresini (saniye cinsinden) belirtir.

    • Varsayılan Değer: 0 (Bekleme olmadan bir sonraki aktiviteye geçer).

    • Örnek Kullanım: İşlem tamamlandıktan sonra sistemde gecikmeler yaşanıyorsa ya da sonraki adımın başlaması için bir süre verilmesi gerekiyorsa, bu alanda belirtilir.

  • Continue On Error: Aktivite sırasında bir hata oluştuğunda sürecin devam edip etmeyeceğini kontrol eden özelliktir.

    • True: Aktivite hata aldığında bile süreç çalışmaya devam eder.

    • False: Aktivite hata alırsa süreç durur.

    • Varsayılan Değer: False (Varsayılan olarak süreç hata alırsa durur).

    • Örnek Kullanım: Kritik olmayan işlemlerde hata olsa bile sürecin devam etmesi isteniyorsa bu seçenek True olarak ayarlanır. Örneğin, bir dosyanın varlığını kontrol eden bir aktivitede hata alınırsa ve süreç bu hataya rağmen devam etmeliyse bu seçenek aktif edilir.

Inputs

Data Path

  • Veri Tipi: Text

  • Açıklama: Eğitilecek verilerin bulunduğu dosya yolu.

Separator Char

  • Veri Tipi: Character

  • Açıklama: Veri sütunlarını ayırmak için kullanılan karakter (örn: ,, ).

Has Header

  • Veri Tipi: True/False

  • Açıklama: Verilerin ilk satırının başlık (header) içerip içermediğini belirtir.

Allow Quoting

  • Veri Tipi: True/False

  • Açıklama: Tırnak işaretleri içinde veri kabul edilip edilmeyeceğini belirtir.

Trim Whitespace

  • Veri Tipi: True/False

  • Açıklama: Verilerin başındaki veya sonundaki boşlukların temizlenip temizlenmeyeceğini belirtir.

Allow Sparse

  • Veri Tipi: True/False

  • Açıklama: Seyrek veri formatı desteklenip desteklenmediğini belirtir.

Label Column Name

  • Veri Tipi: Text

  • Açıklama: Etiket sütununun adını belirtir.

Feature Column Name

  • Veri Tipi: Text

  • Açıklama: Özellik sütun(ları)nun adını belirtir.

Example Weight Column Name

  • Veri Tipi: Text

  • Açıklama: Örnek ağırlıklarını belirten sütun adını belirtir.

L1Regularization

  • Veri Tipi: Float

  • Açıklama: L1 düzenleme katsayısı (regularization).

L2Regularization

  • Veri Tipi: Float

  • Açıklama: L2 düzenleme katsayısı (regularization).

Optimization Tolerance

  • Veri Tipi: Float

  • Açıklama: Optimizasyon işlemi için tolerans değeri.

Test Fraction

  • Veri Tipi: Float

  • Açıklama: Test verisi olarak ayrılacak oran (örneğin: 0.2 = %20 test).

History Size

  • Veri Tipi: Number

  • Açıklama: L-BFGS algoritmasında tutulan geçmiş bilgi miktarı.

Enforce Non Negativity

  • Veri Tipi: True/False

  • Açıklama: Ağırlıkların negatif olmaması için zorlayıcı kısıt.

Output Column Name

  • Veri Tipi: Text

  • Açıklama: Modelin tahmin sonuçlarını yazacağı sütun adı.

Input Column Name

  • Veri Tipi: Text

  • Açıklama: Giriş verilerinin alındığı sütun adı.

Workspace Path

  • Veri Tipi: Text

  • Açıklama: Model dosyalarının yazılacağı çalışma alanı yolu.

Outputs

Bu aktivite doğrudan bir çıktı döndürmez; ancak model eğitimi sonucunda belirtilen klasöre bir model dosyası oluşturulur.

Kullanım Örnekleri:

  • CSV veri seti ile Lojistik Regresyon modeli eğitmek

  • Eğitim ve test verisi oranını belirleyerek model başarımını değerlendirmek

  • Regularizasyon parametrelerini deneyerek overfitting’i önlemek

  • Sparse (seyrek) veri formatında eğitim gerçekleştirmek

Last updated