Hoşgeldiniz

Cover image Bu internet sitesi “Veri Bilimi için R” kitabına aittir. Bu kitap size R ile veri bilimi yapmayı öğretecek: Verilerinizi R’a aktarmayı, verinizi en kullanışlı yapıya getirmeyi, dönüştürmeyi, görselleştirmeyi ve modellemeyi öğreneceksiniz. Bu kitapta, veri bilimi için uygulamalar bulacaksınız. Tıpkı bir kimyagerin test tüplerini nasıl temizleyeceğini ve bir laboratuvarı nasıl stoklayacağını öğrenmesi gibi, siz de verileri nasıl temizleyeceğinizi ve grafikler çizmeyi ve bunun yanı sıra birçok başka şeyi daha öğreneceksiniz. Bunlar, veri biliminin gerçekleşmesini sağlayan becerilerdir ve burada, bunların her birini R ile yapmak için en iyi uygulamaları bulacaksınız. Grafiklerin dil bilgisini, kolay programlamayı ve tekrarlanabilir araştırmayı zaman kazanmak için nasıl kullanacağınızı öğreneceksiniz. Veri cambazlığı yaparken, görselleştirirken ve keşfederken keşifleri kolaylaştırmak için bilişsel kaynakları nasıl yöneteceğinizi de öğreneceksiniz.

Çeviriye Önsöz

21.yüzyılda hızlanarak devam eden bilgi devriminin elzem sonuçlarından birisi insan hayatına dokunan her alandan toplanan veri miktarının üssel bir şekilde artması ve sıklıkla bu verilerin erişiminin herkese açılması olmuştur. Alanı ne olursa olsun, sosyal bilimlerden temel bilimlere, tıptan mühendisliğe, teoriden uygulamaya, veri toplamak pahalı bir uğraştır ve bu verilerin toplanması ve analizi genelde ekonomisi daha gelişmiş toplumların ve sınıfların tekelinde olmuştur. Bu bağlamda, “büyük veri” olarak tabir edilen ve sosyal medyadan insan genomuna geniş yelpazede çeşitlilik gösteren veri setlerinin artık herkesçe ulaşılabilir olması bilim uğraşısının bir ucundan tutmak isteyenler için büyük bir eşitleyici rol üstlenmiştir. Veri bilimi (data science) de böyle bir atmosferde, bağımsız ama aynı zamanda tüm diğer bilim alanlarıyla ilişkili yeni bir meslek grubu olarak ortaya çıkmıştır.

Günümüzün veri analizi ile uğraşanlar için bir diğer eşitleyici unsuru R gibi ücretsiz ve öğrenmesi görece kolay istatistiksel programlama dillerinin yaygınlaşması olmuştur. Bu tür dillerin yaygınlaşmasından önce kullanılan istatistiksel yazılım programları bireysel araştırmacıların kendi başlarına üstlenebileceğinden çok daha büyük bir ekonomik yük teşkil ediyor ve araştırmacıları kendi kurumlarının yazılımlarını kullanmaya mecbur bırakıyordu. Artık herhangi bir seviyede istatistiksel analiz gerçekleştirmek isteyen araştırmacının tek ihtiyacı bir bilgisayar ve internet bağlantısıdır.

İstatistiksel programlama dillerinin yaygınlaşması bu dilleri öğrenmek ve ustalaşmak isteyenler için pek çok kaynağı da beraberinde getirdi. Şu an okumakta olduğunuz kitap bunun en başarılı örneklerinden birisidir ve size sadece kod yazmayı öğretmekle kalmaz, aynı zamanda kod yazma biçiminizi bir standarda oturtur ve diğerleri için yazdığınız kodu daha okunaklı kılarak analizlerin tekrarlanabilirliğini ve test edilebilirliğini arttırır. Bu çeviride emeği geçen herkes kendi meslek hayatında R kullanmış ve bu tarz programlama dillerinin veri analizi için yarattığı kolaylığı ve keyfi bizzat tatmıştır. Böyle değerli bir kaynağa ulaşmanın dil bariyerine takılmasının, veri biliminin yarattığı eşitleyici ortama ve zamanın ruhuna aykırı olduğunu düşünüyoruz. Bu çeviri ile amacımız Türkiye’de veri bilimine el atmak veya kendi alanlarının gerektirdiği sayısal analizleri en doğru ve en kolay şekilde gerçekleştirmek isteyenler için dil bariyerini bir miktar da olsa hafifletmektir.

Okuyacağınız çeviri bütünüyle bir gönüllü uğraşıdır. COVID salgınından önce başlamış ve hem kişisel hem de mesleki hayat dalgalanmalarının arasında bitmiştir. Bu bakımdan çeviride hatalar olması kaçınılmazdır. Bu hataları bize bildirerek bu gönüllü hareketin bir parçası olursanız bizi çok mutlu edersiniz (Düzelti ve çeviri önerileri için: https://bit.ly/r4ds-oneri).

Çeviriye katkı veren ve emeğini bizlerle paylaşan herkese ve Ekoloji ve Evrimsel Biyoloji Derneği’ne gönülden teşekkür ederiz.

Çeviri editörleri: İsmail Bekar, Nurbahar Usta, Bilgecan Şen

Çeviriye katkı verenler:

Anıl Bahar (28. Bölüm); Ayşe Mergenci (7. Bölüm); Bahar Patlar (27. ve 29. Bölümler); Elif Bozlak (14. Bölüm); Cansu Çetin (13. Bölüm); Cansu Ülgen (10. Bölüm); Dilşad Dağtekin (3. ve 4. Bölümler); Gökçe Ayan (11. ve 12. Bölümler); Gürçay Kıvanç Akyıldız (23. Bölüm); Gürkan Semiz (8. Bölüm); İsmail Bekar (1., 2., 9., 22. ve 30. Bölümler); Kahraman İpekdal (19. ve 20. Bölümler); Melike Dönertaş (5., 6., 15. ve 16. Bölümler); Nurbahar Usta (17., 18., 21. ve 26. Bölümler); Ortaç Çetintaş (24. ve 25. Bölümler).

Bu internet sitesi ücretsizdir (ve hep ücretsiz kalacaktır) ve Creative Commons Attribution-NonCommercial-NoDerivs 3.0 lisansı altındadır. Eğer kitabın fiziksel kopyasını isterseniz amazon üzerinden sipariş verebilirsiniz; O’Reilly tarafından 2017 Ocak ayında yayınlandı. Eğer bağış yaparak destek olmak isterseniz Kākāpō Kurtarma vakfına destek olabilirsiniz: [kākāpō]’lar (https://www.youtube.com/watch?v=9T1vfsHYiKY) (R4DS kitabının kapağında mevcutlar) Yeni Zelanda’ya has ve nesli kritik tehlike altında olan bir papağan: dünyada sadece 148 adet kaldı.

Bu kitap RMarkdown ve bookdown kullanılarak yazılmıştır. Otomatik bir şekilde kaynağından travis kullanılarak oluşturulmuştur. R4DS kitabı bir işbirliği ürünüdür ve çok sayıda insan çekme istekleriyle yaptıkları düzeltmeler ve iyileştirmeler ile kitaba katkıda bulunmuştur.

Katkıda bulunan herkese kocaman teşekkürler! adi pradhan (@adidoit), Andrea Gilardi (@agila5), Ajay Deonarine (@ajay-d), @AlanFeder, pete (@alonzi), Alex (@ALShum), Andrew Landgraf (@andland), @andrewmacfarland, Michael Henry (@aviast), Mara Averick (@batpigandme), Brent Brewington (@bbrewington), Bill Behrman (@behrman), Ben Herbertson (@benherbertson), Ben Marwick (@benmarwick), Ben Steinberg (@bensteinberg), Brandon Greenwell (@bgreenwell), Brett Klamer (@bklamer), Christian Mongeau (@chrMongeau), Cooper Morris (@coopermor), Colin Gillespie (@csgillespie), Rademeyer Vermaak (@csrvermaak), Abhinav Singh (@curious-abhinav), Curtis Alexander (@curtisalexander), Christian G. Warden (@cwarden), Kenny Darrell (@darrkj), David Rubinger (@davidrubinger), David Clark (@DDClark), Derwin McGeary (@derwinmcgeary), Daniel Gromer (@dgromer), @djbirke, Devin Pastoor (@dpastoor), Julian During (@duju211), Dylan Cashman (@dylancashman), Dirk Eddelbuettel (@eddelbuettel), Edwin Thoen (@EdwinTh), Ahmed El-Gabbas (@elgabbas), Eric Watt (@ericwatt), Erik Erhardt (@erikerhardt), Etienne B. Racine (@etiennebr), Everett Robinson (@evjrob), Flemming Villalona (@flemingspace), Floris Vanderhaeghe (@florisvdh), Garrick Aden-Buie (@gadenbuie), Garrett Grolemund (@garrettgman), Josh Goldberg (@GoldbergData), bahadir cankardes (@gridgrad), Gustav W Delius (@gustavdelius), Hadley Wickham (@hadley), Hao Chen (@hao-trivago), Harris McGehee (@harrismcgehee), Hengni Cai (@hengnicai), Ian Sealy (@iansealy), Ian Lyttle (@ijlyttle), Ivan Krukov (@ivan-krukov), Jacob Kaplan (@jacobkap), Jazz Weisman (@jazzlw), John D. Storey (@jdstorey), Jeff Boichuk (@jeffboichuk), Gregory Jefferis (@jefferis), 蒋雨蒙 (@JeldorPKU), Jennifer (Jenny) Bryan (@jennybc), Jen Ren (@jenren), Jeroen Janssens (@jeroenjanssens), Jim Hester (@jimhester), JJ Chen (@jjchern), Joanne Jang (@joannejang), John Sears (@johnsears), @jonathanflint, Jon Calder (@jonmcalder), Jonathan Page (@jonpage), Justinas Petuchovas (@jpetuchovas), Jose Roberto Ayala Solares (@jroberayalas), Julia Stewart Lowndes (@jules32), Sonja (@kaetschap), Kara Woo (@karawoo), Katrin Leinweber (@katrinleinweber), Karandeep Singh (@kdpsingh), Kyle Humphrey (@khumph), Kirill Sevastyanenko (@kirillseva), @koalabearski, Kirill Müller (@krlmlr), Noah Landesberg (@landesbergn), @lindbrook, Mauro Lepore (@maurolepore), Mark Beveridge (@mbeveridge), Matt Herman (@mfherman), Mine Cetinkaya-Rundel (@mine-cetinkaya-rundel), Matthew Hendrickson (@mjhendrickson), @MJMarshall, Mustafa Ascha (@mustafaascha), Nelson Areal (@nareal), Nate Olson (@nate-d-olson), Nathanael (@nateaff), Nick Clark (@nickclark1000), @nickelas, Nirmal Patel (@nirmalpatel), Nina Munkholt Jakobsen (@nmjakobsen), Jakub Nowosad (@Nowosad), Peter Hurford (@peterhurford), Patrick Kennedy (@pkq), Radu Grosu (@radugrosu), Ranae Dietzel (@Ranae), Robin Gertenbach (@rgertenbach), Richard Zijdeman (@rlzijdeman), Robin (@Robinlovelace), Emily Robinson (@robinsones), Rohan Alexander (@RohanAlexander), Romero Morais (@RomeroBarata), Albert Y. Kim (@rudeboybert), Saghir (@saghirb), Jonas (@sauercrowd), Robert Schuessler (@schuess), Seamus McKinsey (@seamus-mckinsey), @seanpwilliams, Luke Smith (@seasmith), Matthew Sedaghatfar (@sedaghatfar), Sebastian Kraus (@sekR4), Sam Firke (@sfirke), Shannon Ellis (@ShanEllis), @shoili, S’busiso Mkhondwane (@sibusiso16), @spirgel, Steven M. Mortimer (@StevenMMortimer), Stéphane Guillou (@stragu), Sergiusz Bleja (@svenski), Tal Galili (@talgalili), Tim Waterhouse (@timwaterhouse), TJ Mahr (@tjmahr), Thomas Klebel (@tklebel), Tom Prior (@tomjamesprior), Terence Teo (@tteo), Will Beasley (@wibeasley), @yahwes, Yihui Xie (@yihui), Yiming (Paul) Li (@yimingli), Hiroaki Yutani (@yutannihilation), @zeal626, Azza Ahmed (@zo0z)