Toàn cảnh

Mục tiêu của chúng tôi trong phần này của cuốn sách là cung cấp cho bạn cái nhìn tổng quan nhanh về các công cụ chính của khoa học dữ liệu: nhập, sắp xếp, biến đổi, và visualization dữ liệu, như trong Hình 1. Chúng tôi muốn cho bạn thấy “toàn cảnh” khoa học dữ liệu bằng cách cung cấp đủ kiến thức về tất cả các phần chính để bạn có thể xử lý các tập dữ liệu thực tế, dù đơn giản. Các phần sau của cuốn sách sẽ đi sâu hơn vào từng theme này, mở rộng phạm vi các thách thức khoa học dữ liệu mà bạn có thể giải quyết.

Sơ đồ hiển thị chu trình khoa học dữ liệu: Nhập -> Sắp xếp -> Hiểu (bao gồm các giai đoạn Biến đổi -> Trực quan hóa -> Mô hình hóa trong một chu trình) -> Truyền đạt. Bao quanh tất cả là Lập trình. Nhập, Sắp xếp, Biến đổi, và Trực quan hóa được đánh dấu.
Hình 1: Trong phần này của cuốn sách, bạn sẽ học cách nhập, sắp xếp, biến đổi, và visualization dữ liệu.

Bốn chương tập trung vào các công cụ khoa học dữ liệu:

Xen kẽ giữa các chương này là bốn chương khác tập trung vào workflow R của bạn. Trong 2  Quy trình làm việc: cơ bản, 4  Quy trình làm việc: phong cách mã, và 6  Quy trình làm việc: tập lệnh và dự án bạn sẽ học các phương pháp workflow tốt để viết và tổ chức mã R. Chúng sẽ giúp bạn thành công lâu dài, vì chúng cung cấp cho bạn các công cụ để duy trì tổ chức khi bạn thực hiện các dự án thực tế. Cuối cùng, 8  Quy trình làm việc: tìm kiếm trợ giúp sẽ dạy bạn cách tìm kiếm trợ giúp và tiếp tục học hỏi.