Tương quan: Các biện pháp, tính toán và phương pháp

Sau khi đọc bài viết này, bạn sẽ tìm hiểu về: - 1. Các biện pháp tương quan 2. Tính toán tương quan 3. Phương pháp.

Các biện pháp tương quan:

Hệ số tương quan của Karl Pearson (Quan sát cá nhân) :

Để tính toán mức độ hoặc mức độ tương quan và hướng tương quan, phương pháp của Karl Pearson là thỏa đáng nhất.

Về mặt biểu tượng, công thức của nó là như sau:

Trong đó dx là độ lệch của các mục khác nhau của biến thứ nhất so với trung bình giả định và dy, độ lệch tương ứng của biến thứ hai so với trung bình giả định và N bao hàm số lượng cặp vật phẩm.

Việc áp dụng công thức được giải thích với tham chiếu đến dữ liệu giả thuyết sau:

Tính toán tương quan hiệu quả trong một chuỗi liên tục:

Trong trường hợp chuỗi liên tục, dữ liệu được phân loại trong bảng tần số hai chiều. Tính toán hệ số tương quan đối với dữ liệu được nhóm dựa trên giả định rằng mọi mục nằm trong một khoảng thời gian của lớp nhất định được giả định là rơi chính xác ở giá trị trung bình của lớp đó.

Như một minh họa, chúng ta sẽ tính hệ số hoặc tương quan liên quan đến dữ liệu sau:

Công thức tính hệ số tương quan trong trường hợp này sẽ có dạng sau:

Sự thay đổi duy nhất trong công thức trên so với công thức trước đó là việc giới thiệu f là viết tắt của tần số.

Áp dụng công thức cho Bảng 18.50, chúng tôi nhận được:

Phương pháp khác biệt thứ hạng của tương quan:

Trong trường hợp không thể đo trực tiếp hiện tượng đang nghiên cứu, ví dụ, về các đặc điểm như hiệu quả, tính trung thực, trí thông minh, v.v., phương pháp khác biệt thứ hạng được áp dụng để tìm ra mức độ tương quan.

Công thức tính tương quan xếp hạng là:

Trong đó R biểu thị hệ số tương quan xếp hạng giữa các cấp bậc được ghép đôi, D biểu thị sự khác biệt giữa các cấp bậc được ghép nối và N là số lượng của các cặp.

Chúng tôi sẽ, với sự giúp đỡ của ví dụ sau, minh họa việc áp dụng công thức trên:

Tính toán hệ số tương quan theo phương pháp chênh lệch thứ hạng :

(Khi có hai hoặc nhiều mục có cùng giá trị) :

Nếu có nhiều hơn một mục có cùng giá trị, một thứ hạng chung được trao cho các mục đó. Thứ hạng này là trung bình của các cấp bậc mà những vật phẩm này sẽ có, có một chút khác biệt trong giá trị của chúng. Giả sử các điểm đạt được của năm học sinh lần lượt là 70, 66, 66, 65, 63.

Nếu các điểm này được sắp xếp theo thứ tự giảm dần, hình 70 sẽ nhận được thứ hạng đầu tiên, 66 thứ hạng thứ hai, 65 thứ ba và 63, thứ hạng thứ tư. Vì, hai sinh viên trong ví dụ có số điểm bằng nhau, thứ hạng của họ là 2. Bây giờ họ sẽ được xếp hạng trung bình của các cấp bậc mà những sinh viên này có thể đảm bảo nếu họ hơi khác nhau.

Theo giả định này, thứ hạng của cả hai mục sẽ là 2 + 3/2. tức là 2, 5 và thứ hạng của mục tiếp theo (65) sẽ là 4. Do đó, hệ số tương quan xếp hạng sẽ cần hiệu chỉnh vì công thức trên [R = 1 6ΣD 2 / N (N 2 -1] dựa trên giả định rằng các cấp bậc của các mặt hàng khác nhau là khác nhau.

Trong trường hợp có nhiều hơn một mục có cùng giá trị, hệ số hiệu chỉnh, 1/12 (t 3 -t) được thêm vào giá trị của zd 2, trong đó t. là viết tắt của số mục có thứ hạng chung. Hệ số hiệu chỉnh này được thêm vào nhiều lần khi số lượng vật phẩm có thứ hạng chung xảy ra.

Điều này được giải thích trong ví dụ sau:

Phân tích dữ liệu và giải thích

Thí dụ:

Tính hệ số tương quan xếp hạng từ các dữ liệu sau:

Trong tập dữ liệu trên của chuỗi X, số 60 xảy ra ba lần. Thứ hạng của cả ba vật phẩm là 5, trung bình là 4, 5 và 6, thứ hạng mà các vật phẩm này sẽ được bảo đảm nếu chúng khác nhau đôi chút. Các số 68 khác trong chuỗi X và 70 trong chuỗi Y, đã xảy ra hai lần. Thứ hạng của họ lần lượt là 2, 5 và 1, 5.

Như vậy:

Do đó, công thức sửa đổi cho hệ số tương quan xếp hạng sẽ là:

Trong đó n là số lượng của các mục lặp đi lặp lại. Đối với ví dụ trên, công thức sẽ là:

Một sự thận trọng liên quan đến ý nghĩa và hàm ý của một hệ số tương quan là khá bảo đảm. Hệ số tương quan, bản thân nó là một ước tính rất hữu ích về mối quan hệ, không nên được coi là một bằng chứng tuyệt đối về mối liên hệ giữa các biến có liên quan nhiều như cách giải thích của nó phụ thuộc vào một thước đo lớn về kích thước của mẫu được chọn cho nghiên cứu, vì Ngoài ra, về bản chất của dữ liệu được thu thập.

Hệ số tương quan dường như rất cao, giả sử là 0, 80 (+) có thể thực sự khá sai lệch nếu sai số chuẩn của biến động mẫu là tương đối lớn hoặc lấy một ví dụ ngược lại, hệ số dường như thấp là 0, 45 (+) có thể gợi ý rằng mối quan hệ giữa các biến có thể bị bỏ qua nhưng trên mặt phẳng của thực tế, chỉ thị này có thể lại bị sai, vì hệ số tương quan cho các biến nhất định thường có thể thấp đến mức hệ số tương quan trên, ví dụ, 0, 45 so với sẽ cần được coi là tương đối cao cho lớp dữ liệu trong câu hỏi.

Tuy nhiên, quy ước thống kê quy định rằng hệ số tương quan nằm trong khoảng từ 1 đến 0, 7 (+) được coi là một chỉ số về tương quan 'cao' hoặc đáng kể, nằm trong khoảng từ 0, 7 đến 0, 4 (+) là đáng kể, trong khoảng từ 0, 4 đến 0, 2 (+) ) càng thấp và dưới 0, 2 (+) là không đáng kể.

Cũng cần phải nhấn mạnh rằng một mối tương quan cao giữa hai biến không tự nó tạo thành một bằng chứng cho thấy chúng có liên quan đến nhau. Một mối tương quan đáng kể giữa các biến số - ví dụ, giữa thu nhập và quy mô gia đình hoặc quy mô của một tổ chức giáo dục và hiệu suất của học sinh - hầu như không đưa ra bất kỳ dấu hiệu nào về mối quan hệ tình cờ có được giữa chúng.

Giả sử chúng ta thấy rằng thu nhập cao hơn tương quan nghịch với số lượng vấn đề (trẻ em), nghĩa là thu nhập của cha mẹ càng cao thì số lượng vấn đề của họ càng ít (hệ số tương quan là 0, 8, theo thống kê là khá cao), chúng ta sẽ sai và không chính đáng khi nói rằng thu nhập cao hơn là nguyên nhân của mức sinh thấp hơn.

Nó đã được chỉ ra trước đó rằng một suy luận về quan hệ nhân quả chỉ được bảo đảm nếu ba loại bằng chứng, biến đổi đồng thời, thứ tự thời gian và loại bỏ bất kỳ biến nào khác là điều kiện xác định của hiệu ứng giả thuyết, có thể được bảo đảm.

Trong trường hợp tức thì, những suy luận sau đây có thể được rút ra khi xem xét đầy đủ về mối tương quan rõ rệt giữa các biến số thu nhập và số trẻ em:

(a) Người này có thể gây ra người khác,

(b) Cả hai biến có thể là tác động của một số nguyên nhân hoặc nguyên nhân khác, và

(c) Hiệp hội có thể chỉ là một cơ hội xảy ra. Suy luận nhân quả rõ ràng có thể rất chắc chắn được thiết lập trong một tình huống thử nghiệm.

Chúng tôi đã xem xét điều này khi xử lý các thiết kế thử nghiệm. Trong khoa học xã hội, rất khó để thiết lập các thí nghiệm, do đó, các nghiên cứu phải là những thí nghiệm không thực nghiệm. Tuy nhiên, các thủ tục phân tích đã được đưa ra để rút ra những suy luận về mối quan hệ nhân quả trong các nghiên cứu phi thực nghiệm.

Các nhà nghiên cứu xã hội khá thường xuyên quan tâm đến việc ước tính mức độ liên kết giữa các thuộc tính, nghĩa là, giữa các biến được định nghĩa định tính; ví dụ, anh ta có thể muốn xác định mức độ liên kết giữa thuộc tính tình dục và sở thích chính trị hoặc giữa sự tự nhiên và thái độ đối với một vấn đề xã hội nhất định.

Về cơ bản, vấn đề liên kết là một trong những mối tương quan nhưng sự liên kết giữa các thuộc tính có thể không dễ dàng trở thành điều kiện toán học như trong trường hợp các biện pháp định lượng của các biến. Một thước đo liên kết như vậy giữa các thuộc tính là hệ số dự đoán tương đối (RP), trên thực tế, là một hệ số tương quan định tính.