Kiểm tra Chi Square trong Excel | Cách thực hiện Kiểm tra Chi Square với Ví dụ

Kiểm tra Chi-Square với Excel

Kiểm tra Chi-Square trong excel là kiểm tra phi tham số được sử dụng phổ biến nhất được sử dụng để so sánh hai hoặc nhiều biến cho dữ liệu được chọn ngẫu nhiên. Đây là một loại kiểm tra được sử dụng để tìm ra mối quan hệ giữa hai hoặc nhiều biến, điều này được sử dụng trong thống kê, còn được gọi là Chi-Square P-value, trong excel chúng ta không có hàm sẵn có nhưng chúng ta có thể sử dụng công thức để thực hiện kiểm tra chi-bình phương trong excel bằng cách sử dụng công thức toán học cho Kiểm tra chi-bình phương.

Các loại

  1. Kiểm tra Chi-Square về độ vừa vặn
  2. Kiểm định Chi-Square cho tính độc lập của hai biến.

# 1 - Kiểm tra Chi-Square về độ vừa vặn

Nó được sử dụng để nhận biết độ gần của mẫu phù hợp với dân số. Biểu tượng của phép thử Chi-Square là (2). Nó là tổng của tất cả các ( Số lượng quan sát được - Số lượng mong đợi) 2 / Số lượng mong đợi.

  • trong đó k-1 bậc tự do hoặc DF.
  • Trong đó Oi là tần số quan sát, k là danh mục, và Ei là tần số mong đợi.

Lưu ý: - Mức độ phù hợp của một mô hình thống kê đề cập đến sự hiểu biết về mức độ phù hợp của dữ liệu mẫu với một tập hợp các quan sát.

Sử dụng

  • Mức độ tín nhiệm của người đi vay dựa trên nhóm tuổi của họ và các khoản vay cá nhân
  • Mối quan hệ giữa hiệu suất của nhân viên bán hàng và đào tạo nhận được
  • Lợi nhuận trên một cổ phiếu và cổ phiếu của một lĩnh vực như dược phẩm hoặc ngân hàng
  • Danh mục người xem và tác động của chiến dịch truyền hình.

# 2 - Kiểm định Chi-Square về tính độc lập của hai biến

Nó được sử dụng để kiểm tra xem các biến có tự trị với nhau hay không. Với (r-1) (c-1) bậc tự do

Trong đó Oi là tần số quan sát được, r là số hàng, c là số cột và Ei là tần số mong đợi

Lưu ý: - Hai biến ngẫu nhiên được gọi là độc lập nếu phân phối xác suất của một biến không bị ảnh hưởng bởi biến kia.

Sử dụng

Kiểm tra tính độc lập phù hợp với các trường hợp sau:

  • Có một biến phân loại.
  • Có hai biến phân loại và bạn sẽ cần xác định mối quan hệ giữa chúng.
  • Có các bảng thống kê chéo, và mối quan hệ giữa hai biến phân loại cần được tìm thấy.
  • Có những biến số không thể định lượng được (Ví dụ, câu trả lời cho các câu hỏi như, nhân viên ở các nhóm tuổi khác nhau có chọn các loại kế hoạch sức khỏe khác nhau không?)

Làm thế nào để Thực hiện Kiểm tra Chi-Square trong Excel? (với Ví dụ)

Bạn có thể tải Mẫu Excel Test Chi Square này tại đây - Mẫu Excel Test Chi Square

Người quản lý của một nhà hàng muốn tìm mối quan hệ giữa sự hài lòng của khách hàng và tiền lương của những người đang chờ bàn. Trong phần này, chúng tôi sẽ thiết lập giả thuyết để kiểm tra Chi-Square

  • Cô ấy lấy một mẫu ngẫu nhiên gồm 100 khách hàng để hỏi xem dịch vụ đó là tuyệt vời, tốt hay kém.
  • Sau đó, cô ấy phân loại mức lương của những người đang chờ đợi là thấp, trung bình và cao.
  • Giả sử mức ý nghĩa là 0,05. Ở đây, H0 và H1 biểu thị sự độc lập và phụ thuộc của chất lượng dịch vụ vào tiền lương của những người ngồi bàn chờ.
  • H 0 - chất lượng dịch vụ không phụ thuộc vào lương của người ngồi chờ bàn.
  • H 1 - Chất lượng dịch vụ phụ thuộc vào lương của những người chờ bàn
  • Phát hiện của cô ấy được thể hiện trong bảng dưới đây:

Trong đó, chúng tôi có 9 điểm dữ liệu, chúng tôi có 3 nhóm, mỗi nhóm có một thông điệp khác nhau về tiền lương và kết quả được đưa ra trong phần bên dưới.

Bây giờ chúng ta sẽ đếm tổng của tất cả các hàng và cột. Chúng tôi sẽ làm điều này với sự trợ giúp của công thức tức là SUM. Để Tổng số Xuất sắc trong cột tổng số, chúng tôi đã viết = SUM (B4: D4) và sau đó nhấn enter.

Điều này sẽ cho chúng ta 26 . Chúng tôi sẽ thực hiện tương tự với tất cả các hàng và cột.

Để tính Mức độ tự do (DF), chúng tôi sử dụng (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Có 3 loại dịch vụ và 3 loại lương
  • Chúng tôi có 27 người trả lời với mức lương Trung bình (hàng dưới, giữa)
  • Chúng tôi có 51 người trả lời với Dịch vụ tốt (cột cuối cùng, giữa)

Bây giờ chúng ta phải tính toán Tần suất mong đợi: -

Tần suất mong đợi có thể được tính bằng công thức: -

  • Để tính điểm Xuất sắc, chúng ta sẽ nhân tổng Điểm Thấp với tổng Điểm Xuất sắc chia cho N.

Giả sử chúng ta phải tính toán cho hàng đầu tiên và cột đầu tiên (= B7 * E4 / B9 ) . Điều này sẽ cho số lượng khách hàng dự kiến ​​đã bình chọn Dịch vụ xuất sắc cho mức lương của những người đang chờ đợi là thấp, tức là 8,32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Tương tự cho tất cả, chúng ta phải làm như vậy và công thức được áp dụng trong sơ đồ dưới đây.

Chúng tôi nhận được bảng Tần suất mong đợi như được đưa ra dưới đây: -

Lưu ý: - Giả sử mức ý nghĩa là 0,05. Ở đây, H0 và H1 biểu thị sự độc lập và phụ thuộc của chất lượng dịch vụ vào tiền lương của những người ngồi bàn chờ.

Sau khi tính toán Tần suất mong đợi, chúng tôi sẽ tính toán các điểm dữ liệu chi-bình phương bằng cách sử dụng công thức

Điểm Chi-Square = (Quan sát-Dự kiến) ^ 2 / Dự kiến

Để tính điểm đầu tiên ta viết = (B4-B14) ^ 2 / B14. 

Chúng tôi sẽ sao chép và dán công thức vào các ô khác để điền giá trị tự động.

Sau đó, chúng tôi sẽ tính giá trị chi (Giá trị được tính toán) bằng cách cộng tất cả các giá trị đã cho ở trên bảng

Chúng tôi nhận được giá trị Chi là 18,65823 .

Để tính toán giá trị tới hạn cho điều này, chúng tôi sử dụng bảng giá trị tới hạn chi-bình phương, chúng tôi có thể sử dụng công thức được đưa ra dưới đây.

Công thức này chứa 2 tham số CHISQ.INV.RT (xác suất, bậc tự do).

Xác suất là 0,05, đó là một giá trị có ý nghĩa giúp chúng ta xác định xem có chấp nhận Giả thuyết Null (H 0 ) hay không.

Giá trị tới hạn của chi-square là 9,487729037.

Bây giờ chúng ta sẽ tìm giá trị của chi-square hoặc (giá trị P) = CHITEST (thực_thức, dải_đầu_kỳ vọng)

Phạm vi từ = CHITEST (B4: D6, B14: D16) .

Như chúng ta đã thấy rằng giá trị của kiểm tra chi hoặc giá trị P là = 0,00091723.

Như chúng ta đã thấy rằng chúng ta đã tính toán tất cả các giá trị. Giá trị chi bình phương (Giá trị được tính toán) chỉ có ý nghĩa khi giá trị của nó bằng hoặc lớn hơn giá trị tới hạn 9,48, tức là giá trị tới hạn (Giá trị được lập bảng) phải cao hơn 18,65 để chấp nhận Giả thuyết Null (H 0 ) .

Nhưng ở đây Giá trị được tính toán > Giá trị được lập bảng

X2 (Tính toán)> X2 (Lập bảng)

18,65> 9,48

Trong trường hợp này, chúng tôi sẽ bác bỏ Giả thuyết Vô hiệu (H 0 )Thay thế (H 1 ) sẽ được chấp nhận.

  • Chúng ta cũng có thể sử dụng P-Value để dự đoán tương tự, tức là nếu P-value <= α (giá trị có ý nghĩa 0,05), giả thuyết Null sẽ bị bác bỏ
  • Nếu giá trị P> α , không bác bỏ  giả thuyết rỗng .

Ở đây P-value (0,0009172) < α (0,05), từ chối H 0 , chấp nhận H 1

Từ ví dụ trên, chúng tôi kết luận rằng Chất lượng dịch vụ phụ thuộc vào mức lương của những người đang chờ đợi.

Những điều cần ghi nhớ

  • Được coi là bình phương của một biến thể chuẩn thông thường.
  • Đánh giá nếu tần số quan sát được trong các hạng mục khác nhau thay đổi đáng kể so với tần số được mong đợi trong một tập hợp các giả định cụ thể.
  • Xác định mức độ phù hợp của phân phối giả định với dữ liệu.
  • Sử dụng bảng dự phòng (trong nghiên cứu thị trường, những bảng này được gọi là bảng chéo).
  • Hỗ trợ các phép đo mức danh nghĩa.

$config[zx-auto] not found$config[zx-overlay] not found