Lập trình
Trong phần này của cuốn sách, bạn sẽ cải thiện kỹ năng lập trình (programming) của mình. Lập trình là một kỹ năng xuyên suốt cần thiết cho mọi công việc khoa học dữ liệu: bạn phải sử dụng máy tính để thực hiện khoa học dữ liệu; bạn không thể làm điều đó trong đầu, hay bằng bút và giấy.
Lập trình tạo ra mã, và mã là một công cụ giao tiếp. Rõ ràng mã cho máy tính biết bạn muốn nó làm gì. Nhưng nó cũng truyền đạt ý nghĩa cho những con người khác. Việc nghĩ về mã như một phương tiện giao tiếp là quan trọng vì mọi dự án bạn thực hiện về cơ bản đều là cộng tác. Ngay cả khi bạn không làm việc với người khác, bạn chắc chắn sẽ làm việc với bạn-trong-tương-lai! Viết mã rõ ràng rất quan trọng để người khác (như bạn-trong-tương-lai) có thể hiểu tại sao bạn thực hiện phân tích theo cách bạn đã làm. Điều đó có nghĩa là trở nên giỏi hơn trong lập trình cũng bao gồm việc trở nên giỏi hơn trong giao tiếp. Theo thời gian, bạn muốn mã của mình không chỉ dễ viết hơn, mà còn dễ đọc hơn cho người khác.
Trong ba chương tiếp theo, bạn sẽ học các kỹ năng để cải thiện khả năng lập trình:
Sao chép-và-dán là một công cụ mạnh mẽ, nhưng bạn nên tránh làm điều đó quá hai lần. Lặp lại bản thân trong mã là nguy hiểm vì nó có thể dễ dàng dẫn đến lỗi và sự không nhất quán. Thay vào đó, trong 25 Function, bạn sẽ học cách viết hàm (function) cho phép bạn trích xuất mã tidyverse iterate lại để có thể dễ dàng tái sử dụng.
Function trích xuất mã iterate lại, nhưng bạn thường cần thực hiện cùng hành động trên các đầu vào khác nhau. Bạn cần các công cụ lặp (iteration) cho phép bạn thực hiện những việc tương tự iterate đi iterate lại. Các công cụ này bao gồm loop for và lập trình function, mà bạn sẽ tìm hiểu trong 26 Lặp.
Khi bạn đọc thêm mã do người khác viết, bạn sẽ thấy nhiều mã không sử dụng tidyverse. Trong 27 Cẩm nang về base R, bạn sẽ học một số function base R quan trọng nhất mà bạn sẽ gặp trong thực tế.
Mục tiêu của các chương này là dạy bạn mức tối thiểu về lập trình mà bạn cần cho khoa học dữ liệu. Khi bạn đã thành thạo tài liệu ở đây, chúng tôi rất khuyến nghị bạn tiếp tục đầu tư vào kỹ năng lập trình. Chúng tôi đã viết hai cuốn sách mà bạn có thể thấy hữu ích. Hands on Programming with R, của Garrett Grolemund, là phần giới thiệu R như một ngôn ngữ lập trình và là nơi tuyệt vời để bắt đầu nếu R là ngôn ngữ lập trình đầu tiên của bạn. Advanced R của Hadley Wickham đi sâu vào chi tiết của ngôn ngữ lập trình R; đây là nơi tuyệt vời để bắt đầu nếu bạn đã có kinh nghiệm lập trình và là bước tiếp theo tuyệt vời khi bạn đã tiếp thu các ý tưởng trong các chương này.