9 Giriş

Kitabın bu bölümünde, ham veri cambazlığı yani ham veriyi R’da modelleme ve görselleştirme yapmak için kullanışlı hale getirme sanatını öğreneceğiz. Veri cambazlığı çok önemli bir iştir ve bu cambazlıkları yapmadan kendi verinizle çalışmanız mümkün değildir! Veri cambazlığının üç aşaması var:

Kitabın bu bölümü aşağıdaki düzene göre ilerleyecek:

  • tibblelar kısmında, bu kitapta kullandığımız veri tablosu çeşitlerini öğreneceksiniz: tibble. Onları normal veri tablolarından farklı yapan sebepleri ve el yordamıyla nasıl oluşturabileceğinizi öğreneceksiniz.

  • veri yükleme kısmında verinizi diskten okuyup, R’a aktarmayı öğreneceksiniz. Düz metin formatına odaklanacak olmamıza rağmen diğer formatlar için gerekli olan paketler hakkında da bilgiler de vereceğiz.

  • [düzgün veri] bölümünde ise düzgün veriyi, yani dönüştürme, görselleştirme ve modelleme yapmanızı kolaylaştıran verilerinizi düzenli bir şekilde saklamayı öğreneceksiniz. Ayrıca bunun altında yatan prensipleri ve verinizi nasıl düzgün hale dönüştürebileceğinizi de öğreneceksiniz.

Veri cambazlığı daha önce az da olsa öğrendiğiniz veri dönüştürmeyi de kapsıyor. Şu anda sık karşılaşacağınız üç spesifik veri tipi için yeni bilgilere odaklanacağız.

  • İlişkisel veri size birbiriyle ilişkili birden fazla veri setiyle çalışma araçlarını verecek.

  • Dizgeler sizi dizge verileri manipüle etmenin güçlü bir yolu olan ifadelerle tanıştıracak.

  • Faktörler R’da kategorik verileri saklama yöntemidir. Değişkenler sabit potansiyel değerlere sahip olduğunda ya da alfabetik olmayan dizge sıralamaları istediğimizde kullanılır.

  • [Tarihler ve saatler] size tarih ve tarih-saatlerle çalışmak için önemli araçları verecek.