Hướng dẫn cơ bản sử dụng R

Giới thiệu: R là ngôn ngữ lập trình được thiết kế đặc biệt cho tính toán thống kê, phân tích dữ liệu và đồ họa. Tại Việt Nam, ngoài SPSS, Stata, EViews  đã phổ biến trước đây, thì  R đã trở nên phổ biến rộng rãi và có cộng đồng người dùng mạnh mẽ trên toàn thế giới. 
Nhờ tính linh hoạt, thư viện mở rộng và các tính năng mạnh mẽ khiến nó trở thành công cụ phù hợp cho nhiều tác vụ liên quan đến dữ liệu, trực quan dữ liệu. Ưu điểm của R là nguồn mở, miễn phí, cộng đồng mạnh. Nếu so với SPSS, Stata, EViews là phần mềm bản quyền, có phí khá cao. Bởi vậy xu thế tương lai sẽ sử dụng R phổ biến hơn do những ưu điểm đã liệt kê.

1. Giáo trình/tài liệu/ website hướng dẫn sử dụng R

a) Sách tiếng Việt về R:

Sách giới thiệu về R của Nguyễn Văn Tuấn : https://cran.r-project.org/doc/contrib/Intro_to_R_Vietnamese.pdf

Phân tích số liệu và tạo biểu đồ với R  của tác giả Nguyễn Văn Tuấn.

Phân tích dữ liệu với R của tác giả Nguyễn Văn Tuấn.

b) Sách tiếng Anh về R

Giới thiệu về R tại trang chủ dự án R: https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

Trực quan dữ liệu hiện đại của Bacoff: https://rkabacoff.github.io/datavis/

2. Một số lệch cơ bản để bắt đầu với R

a) Lệnh về thống kê mô tả với R

R cung cấp một số hàm để tính toán thống kê mô tả. Sau đây là một số hàm thống kê mô tả phổ biến nhất trong R:

Mean(): tính giá trị trung bình số học của một vectơ hoặc ma trận trung vị (): tính trung vị của vectơ hoặc ma trận

sd(): tính độ lệch chuẩn của vectơ hoặc ma trận

var(): tính phương sai của vectơ hoặc ma trận

summary(): cung cấp bản tóm tắt dữ liệu, bao gồm giá trị tối thiểu, tối đa, tứ phân vị, giá trị trung bình và trung vị.

 b) Thống kê suy luận trong R

R cung cấp một số hàm để thực hiện thống kê suy luận. Sau đây là một số hàm thống kê suy luận phổ biến nhất trong R:

t.test(): thực hiện kiểm tra t cho hai mẫu hoặc một mẫu

cor(): tính hệ số tương quan giữa hai biến

lm(): thực hiện phân tích hồi quy tuyến tính

chisq.test(): thực hiện kiểm tra chi bình phương về tính độc lập

anova(): thực hiện phân tích phương sai (ANOVA)

c) Trực quan hóa dữ liệu trong R

Trực quan hóa dữ liệu, hay vẽ biểu đồ là một phần thiết yếu của phân tích thống kê. R cung cấp một số gói để tạo nhiều loại biểu đồ khác nhau, chẳng hạn như biểu đồ thanh, biểu đồ phân tán, biểu đồ đường và biểu đồ mà học thuê.net đã đề cập nếu bạn vẽ biểu đồ cho luận văn, tiểu luận trong link này.

Kết luận:

R đang và đã sẽ là ngôi sao nổi lên bởi vì phần mềm mã nguồn mở, miễn phí, cộng đồng hỗ trợ mạnh mẽ.  Các dịch vụ của hocthue.net về R như sau:

  • Hướng dẫn học viên cao học xử lý bài tập kinh tế lượng tài chính, luận văn thạc sĩ, luận án tiến sĩ sử dụng R.
  • Dịch vụ xử lý dữ liệu theo nhu cầu về R.
  • Dịch vụ ứng dụng R để xử lý thống kê và viết báo cáo luận văn, bài tập khác.

Thẻ