Verinin çarpıcılığına vurulup, nedenle sonucu karıştırmak

Doç. Dr. Emre Erdoğan
Doç. Dr. Emre Erdoğan
  Eki.01, 2017, 00:00
Teknik bir konuyu anlatmanın en verimli yolu, konunun aslında ne olmadığını anlatmaktan geçer.

Teknik bir konuyu anlatmanın en verimli yolu, konunun aslında ne olmadığını anlatmaktan geçer.

Dokuzuncu ayımızda üzerinde duracağımız tespit “tüketicinin hayatına dokunmayan; temel motivasyon ve bariyerlerini açıkla(ya)mayan veriden içgörü çıkmaz”. Bu tespit özellikle son yıllarda gittikçe popü­lerleşen veri bilimcilerin ortaya koyduğu şaşırtıcı ve çarpıcı tespitlerde karşımıza çıkıyor. Bahsi geçen analiz süreci ister çoklu kaynaktan beslenen “big data”, olsun, isterse özenle seçilmiş örneklerden gelen “small data”; veri madenciliği ile ulaşılan ham veri­ler kendi kendine bir içgörüye dönüşmüyor. Çoğu doğru tespit veya özet statüsünde kalan bu ham verilerin en büyük eksikliği açıklama aşamasında ortaya çıkıyor. Şaşırtıcı verilere getirilen açıklamalar, birbirini takip eden argümanlar olarak sıralanıyor ancak süreç gittikçe dairesel bir nitelik kazanarak açıkladığı konudan uzaklaşıp karmaşıklaşa­rak en sonunda kendi kendini açıklar hale gelerek içgörüyü kaybediyor.

İnsan hariç tüm canlılar içgüdüsel olarak farklı gördüklerini tehlikeli addederek çok renkli bitki (mantar) ve hayvanlardan (kur­bağa ve böcekler), veya belirgin şekilde ses çıkararak yerini belli eden (çıngıraklı yılan) hayvanlardan zehirli olduklarını düşüne­rek uzak durur. İnsan ise bitmek bilmeyen merakı ile farklı ve sıra dışı olana yönelir. Veri madenciliği de tam olarak böyle başlar veri setinin içinde istisnai görünen bir nokta fark edilir ve vurgulanır. Bu örneklerden yoğun popülerlik kazanmış bir tanesi: “benzin istasyonları içinde yer alan marketlerde geceleyin en çok ‘prezervatif’ ve ‘enerji içe­ceği’ satılır”. Ya da daha az bilinen bir başka tespit “internet üzerinden yapılan eko-paket çamaşır deterjanı alışverişlerinde pakete fantezi iç giyim ürünleri de giriyor.” Kişi bu tespitleri ilk duyduğunda şaşırıyor ve “vay be” demekten kendini alamıyor, sonrasında neden acaba sorusu gündeme geliyor.

Zira açıklamada yer alan veri parçaları sosyal bilimlerde “olumsal”, contingent olarak adlandırılan, yani neden sonuç ilişkisi ile değil zamansal olarak birlikte bulunmaları nedeniyle ilişkileniyorlar. Biraz daha açıklar­sak, hem prezervatif hem de enerji içeceği endüstrisi farklı nedenler ile (sırasıyla mahre­miyet ve konvansiyonel rekabet) görünürlük kazanmakta zorlanıyor bu nedenle fırsat yakaladıkları alternatif kanallarda yoğun bir teşhir uygulamasına giderek fark edilir hale geliyorlar. Şimdi ürünlerin tüketici tarafından daha çok göründüğünü anladık ama neden birlikte alınıyor, cevap aslında burada gizli birlikte alınmıyor, aynı noktayı kullanan farklı hedef kitleler, (yine sırasıyla açık eczane aramak istemeyenler ve uykusunu açmak isteyen şoförler) alıyor ve iki ürünün aynı alışveriş sepetinde bulunma oranı aslında oldukça düşük.

Dolayısıyla pazarlama alanı ile ilgili deneyimi olan herkesin ilk aklına gelen bu ürünleri birleştiren promosyonlar yapma (bundle pack) veya rafta yan yana sergileme çözümleri yanlış. İkinci örnekte ise durum daha da enteresan zira veri online alışverişten geldiği ve kişi bazlı toplandığı için aynı hedef kitle, tek bir alışverişinde bu iki ürünü satın alıyor. Ancak yine ilişki neden sonuçla değil, olumsallık ile (contingency) bağlı. İki üründe kadınlar tarafından alınıyor ve dolaylı bir ortak özellikleri nedeniyle alı­nıyor. Hem büyük boy eko paketler hem de fantezi iç giyim ürünleri orta ve alt orta sınıf mahallelerde bulunamıyor. İlki bu mahalle­lerde parakende noktalarının çoğunluğunun indirim marketlerden oluşmasından ve bu marketlerin daha ufak stok tutması, ikinci ise bu mahallelerde kiralık nokta bulmakta zorlanılması ve müşteri ayak trafiğinin yeterli olmamasından kaynaklanıyor. Yani iki faktör için neden sonuç ilişkisi iki ürün ve bu ürün­lerin işlevleri değil orta sınıf mahalle kültürü.

Her zaman olduğu gibi dedikodu yap­mamak adına raporu üreten kişi ve kurum­ları aktarmadan raporun sadece küçük bir kısmına alıntılayacağım. 

“Günümüzde ‘kurtlar vadisi’ sadece Türki­yeli izleyiciler tarafından değil tüm Ortado­ğu izleyicileri tarafından severek izlenir hale gelmiştir. Ayrıca konvansiyonel mecraları aşarak televizyonda izlendiğinden çok in­ternet üzerinden takip edilmektedir. Online izleyici profili incelendiğinde Ortadoğulu iz­leyicilerin sayıca Türkiyeli izleyicileri geçtiği görülmektedir. Bu veriler ışığında dizinin se­naryosunda eklemeler yapılması ve sadece Türkiye değil güncel Ortadoğu konularına da yer vermesi yerinde olacaktır”

Okuduğumuz paragraf pek çok farklı kaynaktan gelen verinin, reyting rakamları, site trafikleri, ip kayıtları vb incelenmesi ile yapılan bir analizi bizler ile paylaşıyor ve içinde iki çok önemli tespit ve maalesef oldukça yanlış bir aksiyon önerisi bulunu­yor. Hızlıca özetlersek, Kurtlar Vadisi’nin televizyon yayını ile ulaştığından daha fazla kişiye internetten ulaştığını reyting skorları ile dizinin internete yüklenen legal ve illegal kopyalarının izlenme sayılarının kıyaslaya­rak doğrulamak mümkün. Ancak bu tespiti yaparken iki eşitsiz veriyi kıyasladığımız gerçeğini unutmamalıyız, televizyon en azından ortalama bir izleyici için durduru­lamayan akan bir yayın olduğu için zamana bağlı iken internet videoları, talebe bağlı ve zamandan bağımsız izleniyor. Ayrıca televizyon reytinglerinde tekil izleyicilerden bahsederken internette izleyicinin tekil olup olmadığı kesin değil, benzeri şekilde parça­lar halinde ve farklı bilgisayarlardan diziyi tamamlayan izleyici birden fazla ve eksik izli­yor görünüyor. Dolayısıyla bu tespitin kabul edilmesi için çok daha ayrıntılı incelemelerin yapılması ve iki verinin analiz seviyelerinin eşitlenmesi gerekiyor.

İkinci tespitimiz diziyi izleyen daha çok Ortadoğulu olması. Dizinin Arap ülkelerinde de popüler olduğu bir gerçek. Ancak bu izleyicilerin Türk izleyicileri sayıca geçmesi matematiğin ve rakamların doğasından kaynaklanıyor. Zira yaklaşık 100 milyon kişi Anadolu Türkçesini ana dil olarak kullanır­ken, yarım milyar kişi dizi yayınlanır yayın­lanmaz eklenen korsan Arapça altyazıları okuyarak diziyi takip edebiliyor. Dolayısıyla diziyi izleyen rasgele kişileri listelediğimizde Arapça bilen birisini bulma şansımız daha yüksek. Ya da daha yalın bir ifade ile dizi aslında Ortadoğu’da Türkiye’ye göre çok daha küçük bir grup tarafından izleniyor ancak havuzun büyüklüğünden dolayı bu grup bile sayısal olarak Türk izleyicisinden fazla olabiliyor. Maalesef aksiyon önerisinde ise tek başına bırakılan ham veri, analistimizi çok büyük bir hataya yönlendiriyor. Zira dizi­nin başarısında en büyük rolü oynayan Türk dizisi olmasından vaz geçilmesini öneriyor. Başka bir deyişle Ortadoğu’da sevilmesi, iz­lenmesi sonucunu yaratan, Türk dizisi olması nedenini ortadan kaldırmak için kullanıyor. Zira Ortadoğulu izleyiciler, diziyi kendilerini anlattığı için değil, Türkiye’yi anlattığı ve hikâye onları sürüklediği için izliyor. Senaryo ve içeriği değiştirdiğimizde bu ilgiyi kaybet­me riski ile karşı karşıya kalıyoruz.

Sunumu hazırlayan veri uzmanına

• Ham veriye içgörü gücü kazandıran şey veri analiz prosesi değil, analistin yorumla­ma gücüdür.

Raporu değerlendirecek üst yöneticiye

• Her zaman verinin bize doğru kararı göste­remeyeceğini unutma!

 Anasayfa'ya Dön

YORUM YAZIN

Max. 255 karakter girebilirsiniz

Yorumunuz Alınıyor

Boş Yorum Gönderemezsiniz

YORUMLAR

Hiç Yorum Yok

BENZER HABERLER