Skewness - Ý nghĩa, Các loại và Ví dụ
Ý nghĩa của Skewness
Skewness mô tả mức độ phân phối dữ liệu thống kê không đối xứng so với phân phối chuẩn, trong đó phân phối được chia đều cho mỗi bên. Nếu một phân bố không đối xứng hoặc Bình thường, thì nó bị lệch nghĩa là phân bố tần số bị lệch sang bên trái hoặc bên phải.
Các loại độ xiên
Nếu phân phối là đối xứng thì nó có độ lệch 0 & Mean = Median = Mode.
Vì vậy, về cơ bản, có hai loại -
- Tích cực : Phân phối bị lệch dương khi phần lớn tần suất phân phối nằm ở phía bên phải của phân phối & có đuôi bên phải dài hơn và béo hơn. Vị trí trung bình> trung bình> Chế độ của phân phối.
- Tiêu cực : Phân phối bị lệch âm khi phần lớn tần suất phân phối nằm ở phía bên trái của phân phối & có đuôi bên trái dài hơn và béo hơn. Nơi phân phối Trung bình <Trung vị <Chế độ.
Công thức
Công thức độ xiên được biểu diễn như sau:
Có một số cách để tính toán độ lệch của phân phối dữ liệu. Một trong số đó là hệ số thứ nhất và thứ hai của Pearson.
- Các hệ số đầu tiên của Pearson (Độ lệch chế độ): Nó dựa trên Trung bình, Chế độ & Độ lệch chuẩn của phân phối.
Công thức: (Trung bình - Chế độ) / Độ lệch chuẩn.
- Hệ số thứ hai của Pearson (Độ lệch trung vị): Nó dựa trên Trung bình, Trung vị & Độ lệch chuẩn của phân phối.
Công thức: (Trung bình - Trung vị) / Độ lệch Chuẩn.
Như bạn có thể thấy ở trên, hệ số lệch đầu tiên của Pearson có chế độ là một biến để tính toán nó và nó chỉ hữu ích khi dữ liệu có nhiều số lặp lại hơn trong tập dữ liệu, Giống như nếu chỉ có một vài dữ liệu lặp lại trong tập dữ liệu thuộc về sang chế độ, thì hệ số lệch thứ hai của Pearson là thước đo đáng tin cậy hơn về xu hướng trung tâm vì nó coi trung vị của tập dữ liệu thay vì chế độ.
Ví dụ:
Tập dữ liệu (a): 7,8,9,4,5,6,1,2,2,3.
Tập dữ liệu (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3.
Đối với cả hai tập dữ liệu, chúng ta có thể kết luận chế độ là 2. Nhưng không hợp lý khi sử dụng hệ số lệch đầu tiên của Pearson cho tập dữ liệu (a) vì số 2 của nó chỉ xuất hiện hai lần trong tập dữ liệu nhưng nó có thể được sử dụng để tạo cho tập dữ liệu (b) vì nó có chế độ lặp lại nhiều hơn.
Một cách khác để tính toán độ nghiêng bằng cách sử dụng công thức dưới đây:
- = Biến ngẫu nhiên.
- X = Trung bình phân phối.
- N = Tổng biến vào phân phối.
- α = Độ lệch Chuẩn.
Ví dụ về Skewness
Để hiểu chi tiết hơn về khái niệm này, chúng ta hãy xem xét ví dụ dưới đây:
Bạn có thể tải Mẫu Excel Skewness này tại đây - Mẫu Excel Skewness
Tại trường cao đẳng quản lý XYZ, 30 sinh viên năm cuối đang cân nhắc việc làm vào công ty nghiên cứu QPR & mức lương của họ dựa trên kết quả học tập và kinh nghiệm làm việc trong quá khứ của sinh viên. Dưới đây là dữ liệu về mức bồi thường của sinh viên trong công ty nghiên cứu PQR.
Giải pháp
Sử dụng dữ liệu dưới đây
Tính toán trung bình phân phối
- = ($ 400 * 12 + $ 500 * 8 + $ 700 * 5 + $ 850 * 3 + $ 1000 * 2) / 30
- Trung bình phân phối = 561,67
Tính toán độ lệch chuẩn
- Độ lệch chuẩn = √ {(Tổng bình phương độ lệch * Số học sinh) / N}.
- Độ lệch chuẩn = 189,16
Tính toán độ xiên có thể được thực hiện như sau:
- Độ xiên: (tổng của Khối lập phương độ lệch) / (N-1) * Khối lập phương độ lệch chuẩn.
- = (106374650,07) / (29 * 6768161,24)
- = 0,54
Do đó, giá trị 0,54 cho chúng ta biết rằng dữ liệu phân phối hơi lệch so với phân phối chuẩn.
Ưu điểm
- Độ xiên là tốt hơn để đo lường hiệu suất của lợi nhuận đầu tư.
- Nhà đầu tư sử dụng điều này khi phân tích tập dữ liệu vì nó xem xét cực của phân phối thay vì chỉ dựa vào
- Nó là một công cụ được sử dụng rộng rãi trong thống kê vì nó giúp hiểu được có bao nhiêu dữ liệu là bất đối xứng từ phân phối chuẩn.
Nhược điểm
- Phạm vi dao động từ âm vô cùng đến dương vô cùng và đôi khi nhà đầu tư khó dự đoán xu hướng trong tập dữ liệu.
- Một nhà phân tích đang dự báo hiệu suất trong tương lai của một tài sản bằng cách sử dụng mô hình tài chính thường giả định rằng dữ liệu được phân phối bình thường nhưng nếu việc phân phối dữ liệu bị lệch thì mô hình này sẽ không phản ánh kết quả thực tế trong giả định của nó.
Tầm quan trọng
Trong thống kê, nó đóng một vai trò quan trọng khi dữ liệu phân phối không được phân phối bình thường. Các điểm dữ liệu cực đoan trong tập dữ liệu có thể dẫn đến việc phân phối dữ liệu lệch về phía bên trái (tức là dữ liệu cực trị trong tập dữ liệu nhỏ hơn, tập dữ liệu lệch đó âm có nghĩa làPhần kết luận
Độ lệch chỉ đơn giản là mức độ lệch của tập dữ liệu so với phân phối chuẩn của nó. Giá trị âm lớn hơn trong tập dữ liệu có nghĩa là phân phối bị lệch âm & giá trị dương lớn hơn trong tập dữ liệu có nghĩa là phân phối được phân phối dương. Đó là một thước đo thống kê tốt giúp nhà đầu tư dự đoán lợi nhuận từ việc phân phối.