Bu ilk data ile ilgili projem olup (EDA(Exploratory Data Analysis)) ile ilgilidir.Filmler ve tv şovları verileri kullanılarak python dilinde hazırlandı.Filmler ve tv şovları verileri kaggle ( https://www.kaggle.com/datasets/asaniczka/full-tmdb-tv-shows-dataset-2023-150k-shows )den alındı. Bu veriseti 150 binden fazla film veya tv şovu içeriyor.Bu veriler The TMDB (The Movie Database) veritabanından elde edilmiş verilerdir.
İşleme sokulmadan önce 166382 satırdan oluşan veri vardı.İlk işlem olarak verisetinde eksik değerler incelendi.Birçok eksik değer vardı hepsini silmeye kalkarsak birçok veriyi kaybederiz.Eksik kısımlar uygun verilerle dolduruldu.(ortalama ve frekans) Kullanmayacağımız satırlar da dolduruldu. Aykırı değerleri filtreledik.Son adımda 142356 satır verimiz kaldı.
Daha sonra bu veriler kullanılarak birtakım grafikler elde ettim ve birbirleriyle ilişkisini inceledim.
Siz de grafikler yardımıyla ilgi çekici istatistikleri kolayca anlayabilirsiniz