Kiểm định Chi-Square về sự Độc lập

Trong bài này hocthue.net sẽ giới thiệu về kiểm định Chi-Square về tính độc lập. Kiểm định được áp dụng khi bạn có hai biến trong một. Kiểm định này được sử dụng để xác định xem có sự liên quan, mối liên hệ như thế nào giữa hai biến nhằm trả lời câu hỏi : Hai biến có độc lập hay không?

Ví dụ, trong một cuộc bài kiểm tra trên lớp có thể được phân loại theo giới tính (nam hoặc nữ) về các môn học (Quản trị kinh doanh, Toán cao cấp hoặc Xác suất thống kê). Chúng ta có thể sử dụng kiểm định Chi-Square để xác định xem giới tính có liên quan đến sở thích môn học nào không như ví dụ bên dưới:

Ví dụ

Một cuộc thăm dò về sở thích học của sinh viên đã khảo sát một mẫu ngẫu nhiên đơn giản gồm 1000 sinh viên. Những người được hỏi được phân loại theo giới tính (nam hoặc nữ) và theo sở thích môn học (Quản trị kinh doanh, Toán cao cấp hoặc Xác suất thống kê). Kết quả được hiển thị trong bảng dưới đây.

Bảng thống kê thu thập được môn học và giới tính
  Quản trị Toán Xác suất Tổng hàng
Nam 200 150 50 400
Nữ 250 300 50 600
Tổng cột 450 450 100 1000

Câu hỏi: Sở thích học những môn học của nam giới có khác biệt đáng kể so với sở thích của nữ giới không? Sử dụng mức ý nghĩa 0,05.

Khi nào nên sử dụng kiểm định Chi-Square cho kiểm định sự độc lập?

  • Phương pháp lấy mẫu là lấy mẫu ngẫu nhiên đơn giản.

  • Các biến được nghiên cứu là dạng phân loại danh mục (categorical variable).

Cách tiếp cận này bao gồm bốn bước: (1) nêu các giả thuyết, (2) xây dựng kế hoạch phân tích, (3) phân tích dữ liệu mẫu và (4) diễn giải kết quả.

Nêu các giả thuyết

Giả thuyết cho kiểm định Chi-Square như sau:

  • Ho: Biến A và biến B là độc lập. 
  • H1: Biến A và biến B không độc lập.

Trong trường hợp ví dụ trên thì giả thuyết như sau:

  • Ho: Biến Giới tính và biến Môn học là độc lập. 
  • H1: Biến Giới tính và biến Môn học không độc lập.

Lưu ý: Giả thuyết thay thế (H1) cho thấy các biến có liên quan; nhưng mối quan hệ không nhất thiết là nhân quả, theo nghĩa là một biến "ảnh hưởng" đến biến khác. Ví dụ các bạn không nên suy luận rằng biến A "gây nên" sự độc lập cho biến B. Bạn đơn giản nghĩ rằng biến A và B là độc lập nhau.

Xây dựng kế hoạch phân tích

Kế hoạch phân tích mô tả cách sử dụng dữ liệu mẫu để chấp nhận hoặc từ chối giả thuyết H0. Kế hoạch nên xác định các yếu tố sau.

Mức ý nghĩa thống kê: Thông thường, các nhà nghiên cứu chọn mức ý nghĩa bằng 0,01, 0,05 hoặc 0,10; nhưng bất kỳ giá trị nào từ 0 đến 1 đều có thể được sử dụng.
Phương pháp kiểm tra. Sử dụng kiểm tra chi bình phương để độc lập để xác định xem có mối quan hệ đáng kể giữa hai biến phân loại hay không.

Phân tích dữ liệu mẫu

Đối với SPSS, Mở hộp thoại Crosstabs (Analyze > Descriptive Statistics > Crosstabs).
Chọn Giới tính làm biến hàng và Cột làm biến cột.
Nhấp vào Statistics. Chọn Chi-Square, sau đó nhấp vào Continue.

Dịch kết quả: Để đơn giản trong bài viết này hocthue.net chỉ giới thiệu cách đọc kết quả. Chỉ cần so sánh giá trị P với mức ý nghĩa và bác bỏ giả thuyết H0 khi giá trị P nhỏ hơn mức ý nghĩa.