Đa cộng tuyến (Định nghĩa, Các loại) | 3 ví dụ hàng đầu có giải thích

Đa cộng tuyến là gì?

Đa cộng tuyến là một hiện tượng thống kê trong đó hai hoặc nhiều biến trong mô hình hồi quy phụ thuộc vào các biến khác theo cách mà một biến này có thể được dự đoán tuyến tính từ biến kia với mức độ chính xác cao. Nó thường được sử dụng trong các nghiên cứu quan sát và ít phổ biến hơn trong các nghiên cứu thực nghiệm.

Các loại đa cộng tuyến

Có bốn loại Đa cộng tuyến

  • # 1 - Đa cộng tuyến hoàn hảo - Nó tồn tại khi các biến độc lập trong phương trình dự đoán mối quan hệ tuyến tính hoàn hảo.
  • # 2 - Đa cộng tuyến cao - Nó đề cập đến mối quan hệ tuyến tính giữa hai hoặc nhiều biến độc lập không tương quan hoàn hảo với nhau.
  • # 3 - Đa cộng tuyến có cấu trúc - Điều này do nhà nghiên cứu tự gây ra bằng cách chèn các biến độc lập khác nhau vào phương trình.
  • # 4 - Đa cộng tuyến dựa trên dữ liệu - Nguyên nhân là do các thí nghiệm được thiết kế kém bởi nhà nghiên cứu.

Nguyên nhân của Đa cộng tuyến

Biến độc lập, Thay đổi trong các tham số của Biến làm cho một chút thay đổi trong các biến có tác động đáng kể đến kết quả & Tập hợp dữ liệu đề cập đến mẫu của tập hợp Đã chọn đang được lấy.

Ví dụ về Đa cộng tuyến

Ví dụ 1

Giả sử rằng ABC Ltd một KPO được một công ty dược phẩm thuê để cung cấp dịch vụ nghiên cứu và phân tích thống kê về các bệnh ở Ấn Độ. Đối với điều này, ABC ltd đã chọn tuổi, cân nặng, nghề nghiệp, chiều cao và sức khỏe làm các thông số cơ bản.

  • Trong ví dụ trên, có một tình huống đa cộng tuyến do các biến độc lập được chọn cho nghiên cứu có tương quan trực tiếp với kết quả. do đó nhà nghiên cứu nên điều chỉnh các biến trước khi bắt đầu bất kỳ dự án nào vì kết quả sẽ bị ảnh hưởng trực tiếp do các biến được chọn ở đây.

Ví dụ số 2

Giả sử rằng ABC Ltd đã được Tata Motors chỉ định để hiểu doanh số bán động cơ tata sẽ cao ở loại nào trên thị trường.

  • Trong ví dụ trên, trước hết các biến độc lập sẽ được hoàn thiện dựa trên đó mà nghiên cứu cần được hoàn thành. nó có thể là thu nhập hàng tháng, độ tuổi. thương hiệu, tầng lớp thấp hơn. Nó có nghĩa là chỉ dữ liệu sẽ được chọn phù hợp với tất cả các tab này để tìm ra bao nhiêu người có thể mua chiếc xe này (tata nano) mà không cần nhìn vào bất kỳ chiếc xe nào khác.

Ví dụ # 3

Giả sử rằng ABC Ltd được thuê để gửi báo cáo để biết có bao nhiêu người dưới 50 tuổi dễ bị đau tim. đối với điều này, các thông số là tuổi, giới tính, lịch sử y tế

  • Trong ví dụ trên, có đa cộng tuyến đã phát sinh vì biến độc lập "tuổi" cần được điều chỉnh thành độ tuổi dưới 50 để mời các đơn đăng ký từ công chúng để những người trên 50 tuổi tự động được lọc.

Ưu điểm

Dưới đây là một số ưu điểm

  • Mối quan hệ tuyến tính giữa các biến độc lập trong phương trình.
  • Rất hữu ích trong các mô hình thống kê và báo cáo nghiên cứu được chuẩn bị bởi các công ty dựa trên nghiên cứu.
  • Tác động trực tiếp đến kết quả mong muốn.

Nhược điểm

Dưới đây là một số nhược điểm

  • Trong một số tình huống, vấn đề này sẽ được giải quyết bằng cách thu thập thêm dữ liệu về các biến.
  • Sử dụng không chính xác các biến giả nghĩa là nhà nghiên cứu có thể quên sử dụng các biến giả bất cứ khi nào cần.
  • Chèn 2 biến giống nhau hoặc giống hệt nhau vào phương trình như trọng lượng kg và lbs.
  • Chèn một biến vào phương trình là kết hợp của 2.
  • Phức tạp để thực hiện tính toán vì nó là kỹ thuật thống kê và yêu cầu máy tính thống kê thực hiện.

Phần kết luận

Đa cộng tuyến là một trong những công cụ thống kê được ưa chuộng nhất thường được sử dụng trong phân tích hồi quy và phân tích thống kê cho cơ sở dữ liệu lớn và đầu ra mong muốn. Tất cả các công ty lớn đều có một bộ phận thống kê riêng trong công ty của họ để thực hiện phân tích hồi quy thống kê về sản phẩm hoặc con người nhằm cung cấp cái nhìn chiến lược về thị trường cho ban lãnh đạo và cũng giúp họ soạn thảo các chiến lược dài hạn. Việc trình bày bằng đồ thị của phân tích cung cấp cho người đọc một bức tranh rõ ràng về mối quan hệ trực tiếp, độ chính xác và hiệu suất.

  • Nếu mục tiêu của nhà nghiên cứu là hiểu các biến độc lập trong phương trình thì đa cộng tuyến sẽ là một vấn đề lớn đối với anh ta.
  • Nhà nghiên cứu cần thực hiện các thay đổi bắt buộc đối với các biến ở giai đoạn 0, nếu không nó có thể có tác động lớn đến kết quả.
  • Đa cộng tuyến có thể được thực hiện bằng cách kiểm tra ma trận tương quan.
  • Các biện pháp khắc phục đóng một vai trò quan trọng trong việc giải quyết các vấn đề đa cộng tuyến. 

$config[zx-auto] not found$config[zx-overlay] not found