2 Giriş
Bu kitabın ilk bölümünün amacı sizi veri keşfi için gerekli temel araçlar konusunda giriş seviyesine ulaştırmak. Veri keşfi, verinize göz atma, hızlıca hipotezler üretme ve bu hipotezleri hızlıca test etmenin ve bu süreci tekrar tekrar tekrar tekrar yapma sanatıdır. Veri keşfinin hedefi size daha sonra derinlemesine araştırabileceğiniz ipuçları sağlamaktır.
Kitabın bu bölümünde size kısa zaman içinde fayda sağlayacak bazı araçlar öğrenceksiniz.
Görselleştirme R programlamaya başlamak için güzel bir yer çünkü faydası çok açık: şık ve bilgilendirici grafikler çizerek verinizi anlamanıza yardımcı olur. [Görselleştirme] bölümünde görselleştirmeye derin bir dalış yapacak, ggplot2 grafiklerinin temel yapısını öğrenecek ve veriyi grafiğe dönüştürecek güçlü teknikler öğreneceksiniz.
Görselleştirme genellikle tek başına yeterli değildir dolayısıyla [veri dönüştürme] bölümünde size önemli değişkenleri seçme, anahtar gözlemleri filtreleme, yeni değişkenler oluşturma ve özetler hesaplamanıza izin veren fiileri öğreneceksiniz.
Son olarak Keşifsel Veri Analizi bölümünde, görselleştirme ve düzenlemeyi sizin merakınız ve şüpheciliğinizle birleştirerek veriniz hakkında sorular sormayı ve cevaplamayı öğreneceksiniz.
Modelleme, keşifsel veri analizinin önemli bir parçası fakat şu anda bunu etkin bir şekilde öğrenecek ya da uygulayacak yeteneklere sahip değilsiniz. Bu konuya veri cambazlığı ve programlama araçları konusunda daha etkin olduğunuzda modelleme bölümünde geri döneceğiz.
Size veri keşfini öğreten bu üç bölümün arasına R iş akışını öğreten üç bölüm sıkıştırıldı. [iş akışı: esaslar], [iş akışı: betikler] ve [iş akışı: projeler] bölümlerinde R kodu yazma ve organize etme konusunda doğru uygulama yöntemleri öğreneceksiniz. Bu uygulamalar size gerçek projeler üzerinde çalışırken düzenli kalmanız konusunda yardım edecekleri için uzun vadede başarılı olmanızı sağlayacaktır.