Veri Akış Madenciliği

20 Ağu 2014
14:00 - 15:45
Üsküdar Gençlik Merkezi

Veri Akış Madenciliği

Veri akış madenciliği (data stream mining) veri madenciliğinin, özel bir uygulaması olarak düşünülebilir. Bu yöntem basitçe akan bir verinin (streaming data) üzerinde çalışmakta ve bu veriden bir sonuç çıkararak bu veriyi işlemektedir. Örneğin sürekli yeni verilerin geldiği bir ortamda verinin sınıflandırılması (classification) bir akış madenciliği problemi olabilir.
Akış madenciliğini diğer veri madenciliği yöntemlerinden ayıran en önemli özelliği ise, sınıfların sabit olmamasıdır. Örneğin verinin sürekli aktığı bir çağrı merkezini düşünelim. Gün içerisinde sürekli olarak yeni telefon aramaları bu çağrı merkezine geliyor olsun. Çağrı merkezi yöneticisi, müşterilere daha iyi hizmet verebilmek için arayan kişileri sınıflandırmak istiyor olsun. Sınıflandırma işlemi başlangıçta belirli sayıda sınıf kabulüyle gelen çağrıları sınıflandırabilir ancak zaman içerisinde ulaşan yeni çağrılardan yeni bir sınıf türetilmesi gerektiğini bulmak, akışın işlenmesi ve bu akışın yeni ihtiyaçlarının ortaya çıkarılması ile olabilir. İşte tam bu noktada akış madenciliği devreye girer.
Ayrıca gelen yeni verilere ve yeni türetilen sınıflara göre, eski verilerin sürekli işlem altında tutulması ve bu sayede geçmişte sınıflanıdrılan verilerin yeniden sınıflandırılması, akış madenciliğinin güncel konularındandır (içerik kayması , concept drift).
Hatta daha önceden öğrenilen sınıfların içeriğinin kayması (concept shift / concept drift) veya genişlemesi veya daralması söz konusu olabilir.
Ders Kapsamında genel olarak akan veri madenciliği kavramları açıklanacak, basit örnekler üzerinden uygulama anlatılacak ve sosyal medya üzerindeki kullanımları örnekler ile gösterilecektir.