Verinin sihirbazları Datathon’da büyük ödülü aldı

8-9-10 Mart 2019 tarihleri arasında, Türkiye’de ilk defa bir perakende firması kendi verisini kullanarak Datathon gerçekleştirdi. Yapay Zekâ ve Makine Öğrenmesi’nden yola çıkarak verilen probleme özgü bir modelleme geliştiren, veri bilimi konusunda uzman isimlerden oluşan Boğaziçi Üniversitesi takımı Crawlers, üç günlük maratonda Satış Tahmini alanında yarıştı ve 400 yarışmacı arasından sıyrılıp büyük ödülün sahibi oldu.

Boğaziçi Üniversitesi ekibi Crawlers, 8-9-10 Mart’ta LC Waikiki tarafından ülkemizde perakende alanında ilk kez düzenlenen Datathon yarışmasında geliştirdikleri makine öğrenmesi tabanlı modelleme ile birincilik ödülüne değer bulundu.  Yarışmada birinciye tam 15.000TL, ikinciye 10.000TL, üçüncüye ise 5.000TL ödül verildi.

Boğaziçi Üniversitesi takımında Yazılım Mühendisliği mezunu Yasin Sancaktutan, Bilgisayar Mühendisliği mezunu,  yüksek lisans öğrencisi ve aynı zamanda araştırma görevlisi olan Burak Suyunu,  Endüstri Mühendisliği mezunu, halen yüksek lisans öğrencisi ve Garanti Ödeme Sistemleri’nde veri bilimci olan Mehmet Emin Öztürk, Boğaziçi Üniversitesi Ekonomi bölümü mezunu, İşletme MBA mezunu ve MIS yüksek lisans öğrencisi Yavuz Selim Elmas ve TRT World’de yazılım geliştirme uzmanı olan Berk Baytar yer aldılar. Yarışmaya dair Yavuz Selim Elmas ve Burak Suyunu’dan bilgi aldık.

Sizleri tanıyabilir miyiz?

Yavuz Selim Elmas: Boğaziçi Üniversitesi Ekonomi 2015 mezunuyum, İşletme bölümünden 2018’de MBA derecesiyle mezun oldum. İkinci yüksek lisansıma Boğaziçi Üniversitesi Yönetim Bilişim Sistemleri’nde devam ediyorum. Aynı zamanda son üç yıldır TRT World’de dijital pazarlama departmanında çalışıyorum.

Burak Suyunu: Bilgisayar Mühendisliği 2017 mezunuyum, aynı bölümde yüksek lisans yapıyorum ve araştırma görevlisi olarak çalışıyorum. Yavuz Selim’in yanı sıra ekibimizin diğer iki üyesi olan Boğaziçi Üniversitesi mezunları Yasin Sancaktutan ve Mehmet Emin Öztürk ile yollarımız TRT World’de kesişti. Ekibimizde yer alan Berk Baytar ise şirketten arkadaşımız.

Datathon kavramını biraz anlatır mısınız, Hackathon’dan farkı nedir?

Yavuz Selim Elmas - Burak Suyunu: Datathon’da yapılan çalışmaların merkezinde veri yer alıyor. Datathon’da bir yazılım projesi geliştirmek yerine, sunulan bir veri setinin amaca uygun olarak çözümlenmesi veya hedef değerlere en yakın sonuca ulaşmak hedefleniyor. Hackathon ise bilgisayar programcılarının ve yazılım geliştiricilerin dahil olduğu, genellikle bir yazılım projesi üzerinde çalışılan etkinlik anlamına geliyor.

Bu yarışmanın süreçleri nasıl ilerledi?

Yavuz Selim Elmas - Burak Suyunu: Veri bilimi ile uğraşan arkadaşlarımızla birlikte daha önce Türk Hava Yolları’nın düzenlediği Hackhaton yarışmasında finale kalmıştık. O yarışma bizim ilk tecrübemizdi. Bu yarışma ise bir Datathon yani tamamen veri üzerine kuruluydu.

400 kişinin başvurduğu yarışmanın ön elemesinde katılımcılara küçük bir problem yollandı. E-Ticaret müşterilerinin sitede kalma süreleri, açtıkları sayfalar, session sayıları, bounce rateleri gibi değerler ile alışveriş yapıp yapmadıkları verilmişti. Ekiplerden, bu verileri kullanılarak bir model kurmaları isteniyordu. Belirlenen zamanda bu modeli yollayanlar arasından Datathon’a katılacak ekipler belirlendi.

Ardından ön elemeyi geçen ekiplerin Satış Tahmini, Churn Analizi ve Görüntü İşleme problemlerinden birini ele almaları istendi. Biz Satış Tahmini problemini seçtik çünkü verinin kendisi ve zenginliği heyecan vericiydi. Üzerinde denenebilecek çok şey vardı. Ayrıca bu problemin diğer problemlerden daha zor gözükse de perakende sektörü için daha kıymetli olduğunu düşündük.  LCW bize 2015-2016-2017 yıllarına dair üç yıllık satış datasını sağladı. 90 milyon satır veriden oluşan ve herhangi bir bilgisayara yüklenemeyecek kadar büyük bir veriden söz ediyoruz. Bizden beklenen 2018 satış verisini tahmin etmemizdi.

Neden Satış Tahmini’ni seçtiniz?

Yavuz Selim Elmas - Burak Suyunu: Gözlemlerimize göre perakende sektöründe satış tahmini yapmak oldukça zor zira pek çok değişken söz konusu. Fakat aynı zamanda şirket açısından en değerli problemlerin başında satış geliyordu. Ayrıca elimizde hem temiz hem de büyük bir veri bulunuyordu. Biz de zoru seçtik.

Kurguladığımız model diğer modellerin hata oranından daha düşük bir hata oranı üretmesi ve modelimizde türettiğimiz yeni özellikler bizim en büyük farklılığımız oldu. Yarışmada bulut bilişim partneri olarak seçtiğimiz Amazon’un bize sağladığı neredeyse sınırsız destek çok önemliydi. Bize verilen veri o kadar büyüktü ki yarışma sonucunda bazı yarışmacıların veriyle uğraşmayı bıraktığını gördük.

Yarışma Cuma akşamı başladı, pazar günü saat 13.00’e dek bütün kodlamalarımızı, çıkardığımız veriyi ve hata oranlarını teslim ettik. Jüri, LCW BT Uygulama Geliştirme Genel Müdür Yardımcısı Şerafettin Özer, E-Ticaret Genel Müdür Yardımcısı Salih Yılmaz, Invent Analytics firmasından Gürhan Kök, Hepsiburada’dan İsmail Parsa, Fortune Türkiye’den gazeteci Kerem Özdemir gibi bilişim sektörünün önde gelen isimlerinden oluşuyordu ve yarışma sonucunda sunum yaparken en çok soruyu bize sormaları yaptığımız işin doğru olduğunu hissetmemizi sağladı.

Bu yarışmanın size vizyon anlamında katkıları neler oldu?

Yavuz Selim Elmas - Burak Suyunu: Bildiğimiz kadarıyla Türkiye’de böyle bir yarışma ilk defa Datathon formatında düzenlendi, bu heyecan vericiydi. Bu tecrübe aynı zamanda ileride bir bankanın düzenleyeceği Datathon’da veya başka bir perakende Datathonu’nda, yaptığımız işi tekrardan yapabilir miyiz diye düşünmemize fırsat sağladı. Ayrıca BT Uygulama Geliştirme Genel Müdür Yardımcısı Şerafettin Yılmaz’ın yarışmada 26 ekibin projeleri arasından seçilen üç takımın 11 üyesinin 10’unun Boğaziçi Üniversitesi’nin çeşitli lisans ve yüksek lisans bölümlerinden mezun olduklarını belirtmesi bizim için gurur vericiydi.  

Bundan sonra da Makine Öğrenmesi alanında bir şeyler yapabilmek ve sonuç almak bizi gerçekten heyecanlandırıyor ve gelecekte bunun üzerinden ilerlemeyi düşünüyoruz.

Galeri 1 Fotoğraf