Yazar: Yasin DURSUN - İş Zekası Uzmanı
Bir önce ki yazıya o kadar güzel yorumlar ve tepkiler geldi ki bu yazıyı yazmak için oluşan heyecanım kat ve kat arttı. Öncelikle bu duygularımı sizlerle paylaşarak başlamak istedim. Python ile whatsapp grup mesajları analizi yazımın ikinci bölümünde aşağıdaki başlıkları ele alacağız. Bir önceki yazıyı okumadıysanız; bir önceki yazıyı buradan okuyabilirsiniz. Hadi başlayalım.
- Gruptaki kişilerin günlük ortalama mesaj sayılarını görselleştirme,
- En fazla konuşulan günlere,
- Grupta en fazla konuşulan kelimelerin çıkarımına,
- Kişilerin konuşma oranlarını pasta dilimi şeklinde görselleştirmeye,
- Hangi aylarda daha çok konuşulduğuna,
- Genellikle insanların hangi saatlerde mesajlaştığına,
- Verimizi filtrelemeye ve filtreli veri üzerinde görselleştirme.
Analizimize günlük ortalama atılan mesaj sayılarını görselleştirerek devam edelim.
Yukarıdaki grafikte kişilerin günlük ortalama mesaj sayıları gösterilmiştir. En fazla mesaj atan kişinin günlük ortalama mesaj sayısı 40’ın üzerindedir.
Peki en fazla konuşulan günleri bulmaya ne dersiniz?
1030 mesajla 3 Mayıs 2018 tarihi en fazla mesaj atılan gün olurken 14 Ekim 2018 tarihi 1 mesajla en az mesaj atılan gün olmuştur.
Burada datanın detayına inilip 3 Mayıs tarihinde neden diğer günlere göre bu kadar fazla konuşulduğunun detayına bakılabilir.
Grup sohbetinde en sık kullanılan kelimelerin kelime bulutunu çıkaralım bakalım grupta ki yazışmalarda en fazla hangi kelimeleri kullanılmış?
Tabi bu kelimelerden Türkçe de sıklıkla kullanılan ve, veya, da, o, ya, acaba, ama gibi kelimeleri çıkartıyoruz.
Gelmedi, yok, sadece, İstanbul, var, eski, o zaman, simdi, benim gibi kelimelerin en sık kullanılan kelimeler olduğu gözükmektedir. Burada datayı kişilere göre filtreleyip kişi bazında en sık kullanılan kelimelerde gösterilebilir. Ayrıca gösterilecek kelime sayısı, font, size ve çerçeve boyutunu kod bloğunda ayarlayabilirsiniz. Kişilerin mesaj sayılarını pasta dilimi olarak gösterelim:
Yukarıda ki grafikte ise mesaj sayılarının oranı pasta dilimi şeklinde görselleştirilmiştir. En fazla mesaj atan kişinin mesaj sayısı tüm mesaj sayısının yüzde 29.9 unu oluşturduğu görülmektedir.
Data üzerinde filtre uygulamaya bakalım:
Yukarıda görüldüğü gibi datamıza filtre uyguladık. 5 Nisan tarihinden sonraki verileri filtreleyerek yeni bir veri seti oluşturduk. Şimdi bu veri seti üzerinden en sık konuşulan aylara bakalım. Aşağıdaki görselde görüldüğü gibi Ağustos 2018 tarihinden sonra mesaj sayılarında azalma gözükmektedir. Mayıs, Haziran ve Temmuz aylarında ise grubun en aktif olduğu aylar olduğu görünüyor.
Şimdi de son olarak gruptaki konuşmaların saatlere dağılımına bakalım.
Çıkan grafikte mesajların saatlik durumlarını incelediğimiz zaman ortaya çıkan sonuç şu şekildedir:
Sabah 07.00'dan 09.30'a kadar artış gösteriyor. 09:30 ile gece 00:00 arasında ise bazı ekstrem pick noktaları hariç neredeyse eşit bir dağılım söz konusu. Pick noktaları incelenerek grup neden daha fazla aktif olmuş sonucu bulunabilir. Bu da bizi bir insan davranışına götürüyor. Konuyu yazılımdan aldık sosyolojiye getirmeyi bir şekilde başardık :). Tahmin yürütmem gerekirse bu pick noktalar; işten çıkış saatleri, iş yerinde veya okullarda verilen aralar, serviste geçirilen zamanlar veya evde şöyle yemekten sonra ayakların uzatıldığı dinlenme zamanları olabilir. Kim bilebilir belki de daha başka sebepleri vardır.
Neyse ben konuyu çok dağıtmaya başladım. Şimdilik bu renkli ve müthiş enerjili arkadaşlarımın içerisinde yer aldığı whatsapp grubunun incelenmesi konunu kapatabiliriz. Benim için güzel bir çalışma ve güzel bir yazı serisi oldu. Evet diyeceklerim bu kadar demeden önce son bir söz paylaşıp kapatacağım.
Nikola Tesla’nın da dediği gibi bırakın gerçekleri gelecek söylesin ve herkesi eserlerine başarılarına göre değerlendirsin. Bugün onların olsun; ama uğrunda çalıştığınız gelecek sizlerindir.
Herkese mutlu çalışmalar.
Comentários