Bu Sayfada

Process Mining için Veri Temizliği ve Hazırlık

Etkili bir Process Mining çalışması kaliteli verilerle başlar; bu sürecin en kritik adımlarından biri de verilerin temizlenmesi ve hazırlanmasıdır. Düşük veri kalitesi, hatalı veya eksik stratejik bilgilere yol açarak süreçlerinizi iyileştirmenizi zorlaştırabilir. Bu dokümanda, veri setlerinizin başarılı bir Process Mining analizi için hazır hale gelmesini sağlayacak temel veri temizleme ve hazırlama adımlarını ele alacağız.

Veri Temizliği ve Hazırlık Neden Önemlidir?

Process Mining, bir süreçteki aktivitelerin sırasını gösteren event log’lara dayanır. Bu veri setleri eksik, tutarsız ya da hatalıysa process mining ile elde edeceğiniz stratejik bilgiler yanıltıcı olur. Temiz ve düzgün veriler sayesinde aracınız iş akışlarını (workflows) net biçimde haritalar, darboğazları bulur ve iyileştirme noktalarını görmenizi sunar.

Veri Temizliği ve Hazırlık için Temel Adımlar

1. Veri Toplama ve Entegrasyon

Temizliğin ilk adımı, sürecinizle ilgili tüm verilerin, ERP, CRM veya diğer sistemler dahil, farklı kaynaklardan eksiksiz toplanmasıdır. Bu aşamada veri entegrasyonu devreye girer.

  • Veri kaynaklarını birleştirin: Sürece katkı sağlayan tüm platformlardan veri toplayın. Örneğin, order-to-cash analizi yapıyorsanız, satış (örn. Salesforce) ve finans (örn. SAP) sisteminizden veri alın.
  • Formatları tutarlı hale getirin: Devam etmeden önce verinin dışa aktarımı ve formatı standart olmalı. Tüm zaman damgası (zaman damgası), para birimi ve ID alanlarının aynı yapıda olmasına özen gösterin.

Verinizi topladıktan sonra, process mining için temizleme ve hazırlık aşamasına geçin.

2. Tekrarları Kaldırma

Çift kayıtlar, activity sayısını şişirip aynı event’i birden fazla kez göstererek process mining analizini ciddi biçimde bozabilir. Doğru event log için tekrarları bulup silmek gerekir.

  • Tekrarları tespit edin: Aynı case ID, activity ve zaman damgası (zaman damgası)’i olan kayıtlar büyük ihtimalle tekrar kayıtlardır.
  • Silin veya birleştirin: Tekrar bulunan kayıtları ihtiyaca göre silin ya da benzer kayıtları birleştirin.

3. Eksik Verilerle Başa Çıkma

Eksik değerler, process mining sonuçlarını etkileyen bir başka yaygın durumdur. Eksik zaman damgası (zaman damgası), activity veya case ID’ler, event sıralamasını bozup eksik süreç modellerine yol açabilir.

  • Eksik alanları tespit edin: Eksik alanları bulmak için araç veya script kullanın (örn. boş zaman damgası (zaman damgası), activity adı veya null case ID).
  • Eksikleri tamamlayın: Mümkünse eksikleri dış kaynaklar, alan bilgisi veya diğer veriden tahminle doldurun. Örneğin, bir faaliyetin zaman damgası (zaman damgası)‘i eksikse, çevresindeki olayların zamanlarından tahmin edin.
  • Doldurma stratejileri: Kritik eksik veriler için (örn. zaman damgası (zaman damgası) veya case ID) tahmini (ortalama, regresyon gibi) yöntemler kullanabilir ya da veri kurtarılamıyorsa ilgili kayıtları çıkarabilirsiniz.

4. Veri Formatlarını Normalleştirme

Tutarlı veri formatı, process mining yazılımının event log doğru analiz edebilmesi için büyük önem taşır. Bu, zaman damgası (zaman damgası) formatları, activity adları ve case ID yapısının standartlaşmasını kapsar.

  • Zaman damgaları: Tüm tarih ve saatler aynı formatta olmalı (örn. YYYY-MM-DD HH:MM:SS). Zaman dilimi varsa, hepsini tek bir dilime çevirin ya da farklı yorumlanmaması için UTC kullanın. Desteklenen tarih formatlarımızı burada bulabilirsiniz 
  • Aktivite adları: Farklı sistemlerde aynı activity farklı yazılabilir. İsimleri standartlaştırın (örn. “Approve Order” ile “Order Approval” birleştirilmeli).
  • Case ID’ler: Case ID’nin sistemler arasında tutarlı ve her bir sürece eşsiz atanmış olmasına dikkat edin.

5. Gereksiz Verileri Temizleme

Sistemdeki her activity veya event, process mining analiziniz için önemli olmayabilir. Arka plandaki işlemler veya ilgili olmayan event’ler veri setini kalabalıklaştırabilir.

  • İlgisiz olayları filtreleyin: Analiz ettiğiniz süreçle ilgisiz activity ve olayları tespit edip veri setinden çıkarın. Örn. sistem girişleri veya gereksiz admin işlemleri process map’inizi karmaşıklaştırabilir.
  • Kritik adımlara odaklanın: Süreci anlamak için gerekli olan activity ve olayları belirleyip, veri setinizi bu alanlarda yoğunlaştırın.

6. Aykırı Değer ve Gürültü Yönetimi

Veri setindeki aykırı değerler veya “gürültü”, sürecin gerçek akışını yanlış gösterebilir. Örneğin, nadir bir nedenle çok uzun süren bir task analizlerinde yanıltıcı olabilir.

  • Aykırıları tespit edin: İstatistiksel yöntemlerle, ortalamanın çok üstünde ya da altında kalan görevlerı belirleyin.
  • Tutmak mı silmek mi?: Aykırı kayıtlar değerli bilgi mi sunuyor (örn. nadir ve kritik bir problem) yoksa standart akışa mı odaklanmak istiyorsunuz; buna karar verip gerekli işlemi yapın.

7. Tutarlı Case ve Activity Sıralaması

Process Mining’in en kritik noktalarından biri olayların doğru sırada olmasıdır. Sıralama karışık olursa süreç akışı yanlış görünür.

  • Activity sırasını kontrol edin: Activity’ler zaman damgalarıe göre mantıklı dizilmeli. Örneğin, bir process instance’da “Order Approved” her zaman “Order Created”dan sonra olmalı.
  • Event’leri zaman damgası (zaman damgası)’e göre sırala: Her case’i zaman damgası (zaman damgası) alanına göre sıralayıp olayların doğru sırada olmasını sağlayın.

8. Event Log Oluşturma

Veriniz temizlenip standart hale geldiyse, sıra ana veri seti olan event log oluşturmada. Event log şunları içermeli:

  • Case ID: Her process instance’a ait eşsiz tanımlayıcı.
  • Aktivite ismi: Her adımın ismi.
  • zaman damgası (zaman damgası): Her aktivitenin gerçekleştiği kesin zaman; event sırası için gereklidir.
  • Opsiyonel alanlar: Analiz gerektikçe, görevi yapan kişi veya departman gibi ek alanlar da eklenebilir.

9. Veri Setini Doğrulama

Veri temizlenip yapılandırıldıktan sonra, süreci doğru yansıttığından ve analize hazır olduğundan emin olmak için doğrulama yapılmalıdır.

  • Örnek kontrol yapın: Rastgele birkaç process instance’ı manuel inceleyip, veri ve event sıralarının mantıklı olduğuna bakın.
  • Test analizi çalıştırın: Mümkünse, process mining aracında test analizi yapıp hata/tutarsızlık olup olmadığına bakın.
  • Geri bildirim alın: Sürecin gerçekliğini yansıtıp yansıtmadığını uzmanlarla birlikte kontrol edin.

Veri Temizliği ve Hazırlık için Araçlar

Veri temizliği ve hazırlığını otomatikleştirmek için birçok araç kullanılabilir. Yaygın seçeneklerden bazıları:

  • Python/Pandas: Veri işlemi ve temizliği için güçlü bir programlama dili ve kütüphane. Tekrarları kaldırmak, formatları normalize etmek gibi işlemler için script yazabilirsiniz.
  • Excel/Google Sheets: Küçük veri setlerinde, tekrarları silmek, gereksiz satırları filtrelemek ve sütunları düzenlemek gibi kolaylıklar sunar.
  • ETL Araçları (Extract, Transform, Load): Talend, Informatica veya Apache Nifi gibi araçlarla, farklı sistemlerden veri çekme, dönüştürme ve process mining yazılımlarına yükleme kolaylaştırılır.
  • OpenRefine: Karışık verileri temizlemek, tekrarları ve yanlış formatları düzeltmek için ücretsiz ve açık kaynak kodlu bir çözümdür.

Sonuç

Veri temizliği ve hazırlık, process mining süreç döngüsünde kritik adımlardır. Veri setlerinizin eksiksiz, tutarlı ve doğru olmasını sağlayarak yanıltıcı analizlerden kaçınabilir ve süreçlerinizin nasıl işlediğine dair gerçek zamanlı stratejik bilgiler elde edebilirsiniz. Bu dokümandaki tekrarları kaldırma, eksik verileri tamamlama, formatları standartlaştırma ve temiz bir event log oluşturma adımlarını uyguladığınızda, process mining projelerinizde maksimum değer elde etmeye hazır olursunuz.