Ghi chú học tập về bài kiểm tra Chi-Square

Bài viết này cung cấp một lưu ý nghiên cứu về kiểm tra chi bình phương.

Phép thử X ² (chữ Hy Lạp X ^{2 được} phát âm là Ki-vuông) là một phương pháp đánh giá xem tần số đã được quan sát theo kinh nghiệm có khác biệt đáng kể so với các giả định theo một giả định lý thuyết nhất định hay không. Ví dụ: giả sử ưu tiên chính trị và nơi cư trú hoặc tự nhiên đã được phân loại chéo và dữ liệu được tóm tắt trong bảng dự phòng 2 × 3 sau đây.

Trong bảng có tỷ lệ người thành thị là 38/48 = 0, 79, 20/46 = 0, 34 và 12/18 = 0, 67 (làm tròn thành hai số thập phân) cho ba đảng chính trị trong nước. Sau đó chúng tôi muốn biết liệu những khác biệt này có ý nghĩa thống kê hay không.

Để kết thúc này, chúng ta có thể đề xuất một giả thuyết không có giá trị giả định rằng không có sự khác biệt giữa ba đảng chính trị liên quan đến sự tự nhiên. Điều này có nghĩa là tỷ lệ người dân thành thị và nông thôn nên được dự kiến là giống nhau cho cả ba đảng chính trị.

Trên cơ sở giả định rằng giả thuyết null là chính xác, chúng ta có thể tính toán một tập hợp các tần số sẽ được mong đợi với các tổng số biên này. Nói cách khác, chúng ta có thể tính toán số người thể hiện sự ưu tiên cho đảng Quốc hội mà chúng ta mong đợi trên cơ sở giả định ở trên là người thành thị và so sánh con số này với người thực sự quan sát được.

Nếu giả thuyết null là đúng, chúng ta có thể tính tỷ lệ chung là:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Với tỷ lệ ước tính này, chúng tôi hy vọng 48 x (0, 625) = 30 người liên kết với Quốc hội, 46 _x (0, 625) = 28, 75 người liên kết với Đảng Janata và 18 x (0, 625) = 11, 25 người liên kết với Lok Dal từ 70 đô thị. Trừ các số liệu này từ các số liệu quan sát tương ứng từ các kích thước tương ứng của ba mẫu, chúng tôi thấy 48 - 30 = 18 liên kết với Quốc hội, 46 - 28, 75 = 17, 25 liên kết với Janata và 18 - 11, 25 = 6, 25 người liên kết với Lok Dal từ 42 người từ nông thôn.

Những kết quả này được hiển thị trong bảng sau, nơi tần số dự kiến ar. thể hiện trong ngoặc đơn.

Để kiểm tra khả năng của giả thuyết null, chúng tôi so sánh tần số dự kiến và tần suất quan sát được. Việc so sánh dựa trên thống kê X ² sau đây.

X ² = Σ (O- E) ² / E

Trong đó O là viết tắt của tần số quan sát và E cho tần số dự kiến.

Độ tự do :

Số bậc tự do có nghĩa là số lượng ràng buộc độc lập áp đặt lên chúng ta trong bảng dự phòng.

Ví dụ sau sẽ minh họa khái niệm:

Chúng ta hãy giả sử rằng hai thuộc tính A và B là độc lập trong trường hợp nào,

tần số dự kiến hoặc ô AB sẽ là 40 × 30/60 = 20. Một khi điều này được xác định, tần số của ba ô còn lại sẽ tự động được cố định. Do đó, đối với ô, αB tần số dự kiến phải là 40 - 20 = 20, tương tự, đối với ô AB phải là 30 - 20 = 10 và đối với αB thì phải là 10.

Điều này có nghĩa là đối với bảng 2 × 2, chúng ta chỉ có một lựa chọn của riêng mình, trong khi chúng ta không có tự do trong ba ô còn lại. Do đó, mức độ tự do (df) có thể được tính theo công thức:

df - (c - 1) (r - 1)

trong đó df là viết tắt của bậc tự do, c cho số cột và r cho số hàng.

Do đó, trong bảng 2 x 3 (Bảng 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Mức độ quan trọng :

Như đã nêu trước đó, phép thử chi bình phương được sử dụng để kiểm tra xem sự khác biệt giữa tần số quan sát và tần suất dự kiến là do dao động lấy mẫu và do đó không đáng kể hay trái ngược, cho dù sự khác biệt là do một số lý do khác và có ý nghĩa như vậy.

Trước khi rút ra suy luận rằng sự khác biệt là các nhà nghiên cứu quan trọng đã đặt ra một giả thuyết, thường được gọi là giả thuyết null (ký hiệu là H _o ) trái ngược với giả thuyết nghiên cứu (H ₁ ) được thiết lập như là một thay thế cho H _o .

Thông thường, mặc dù không phải lúc nào cũng vậy, giả thuyết null nói rằng không có sự khác biệt giữa một số nhóm hoặc không có mối quan hệ giữa các biến, trong khi giả thuyết nghiên cứu có thể dự đoán mối quan hệ tích cực hoặc tiêu cực.

Nói cách khác, giả thuyết null giả định rằng không có lỗi không lấy mẫu và sự khác biệt là do chỉ có cơ hội. Sau đó xác suất xảy ra sự khác biệt như vậy được xác định.

Xác suất chỉ ra mức độ phụ thuộc mà chúng ta có thể đặt vào suy luận được rút ra. Các giá trị bảng của chi bình phương có sẵn ở các mức xác suất khác nhau. Những cấp độ này được gọi là mức ý nghĩa. Chúng ta có thể tìm ra từ bảng các giá trị của bình phương ở các mức ý nghĩa nhất định.

Thông thường (trong bài toán khoa học xã hội), giá trị của bình phương chi ở mức 0, 05 hoặc 0, 01 mức ý nghĩa từ các mức độ tự do nhất định được nhìn thấy từ bảng và được so sánh với giá trị quan sát của bình phương. Nếu giá trị quan sát hoặc y ¹ lớn hơn giá trị bảng ở 0, 05, điều đó có nghĩa là sự khác biệt là đáng kể.

Mức độ tự do :

Để sử dụng kiểm tra chi bình phương, bước tiếp theo là tính toán mức độ tự do: Giả sử chúng ta có một bảng dự phòng 2 x 2 giống như bảng trong Hình 1.

Chúng ta biết hàng và cột tổng cộng r _t ¹ và r _t ² - và c _t ¹ và c _t ² . Số bậc tự do có thể được định nghĩa là số lượng giá trị ô mà chúng ta có thể tự do chỉ định.

Trong hình 1, một khi chúng ta chỉ định một giá trị của Hàng 1 (được biểu thị bằng kiểm tra trong hình), giá trị thứ hai trong hàng đó và các giá trị của hàng thứ hai (ký hiệu là X) đã được xác định; chúng tôi không được tự do chỉ định những điều này bởi vì chúng tôi biết tổng số hàng và tổng số cột. Điều này cho thấy rằng trong bảng dự phòng 2 x 2, chúng tôi chỉ có thể chỉ định một giá trị.

Thủ tục :

Tính toán cho Chi-vuông:

Chi-vuông như một bài kiểm tra mức độ phù hợp:

Trong phần trước chúng ta đã sử dụng chi bình phương như một bài kiểm tra độc lập; đó là liệu có chấp nhận hay bác bỏ một giả thuyết không. Các thử nghiệm x ~ cũng có thể được sử dụng để quyết định xem có sự khác biệt đáng kể giữa phân phối tần số quan sát và phân phối tần số lý thuyết hay không.

Theo cách này, chúng ta có thể xác định mức độ phù hợp của tần số được quan sát và dự kiến. Đó là, sự phù hợp sẽ được coi là tốt nếu không có sự khác biệt đáng kể giữa dữ liệu được quan sát và dữ liệu dự kiến khi đường cong của tần số quan sát được áp đặt trên đường cong của tần số dự kiến.

Tuy nhiên, chúng ta phải nhớ rằng ngay cả khi tỷ lệ trong các ô không thay đổi, giá trị chi bình phương thay đổi trực tiếp với tổng số trường hợp (N). Nếu chúng ta nhân đôi số trường hợp, giá trị chi bình phương sẽ tăng gấp đôi; nếu chúng ta nhân ba số trường hợp thì chúng ta cũng nhân ba số vuông và cứ thế.

Ý nghĩa của thực tế này có thể được minh họa bằng một ví dụ được đưa ra dưới đây:

Trong ví dụ hiện tại, giá trị chi bình phương là 3, 15. Trên cơ sở này, chúng tôi sẽ tự nhiên suy luận rằng mối quan hệ không phải là một mối quan hệ quan trọng.

Bây giờ, giả sử dữ liệu đã được thu thập trên 500 trường hợp với kết quả như sau:

Giá trị Chi bình phương như được tính toán từ các số liệu, hiện là 6, 30, gấp đôi giá trị đạt được trong ví dụ trước. Giá trị 6, 30 có ý nghĩa thống kê. Nếu chúng tôi bày tỏ kết quả về tỷ lệ phần trăm thì sẽ không có sự khác biệt trong diễn giải.

Các ví dụ trên minh họa một điểm rất quan trọng, viz., Chi bình phương tỷ lệ thuận với N. Do đó, chúng ta sẽ cần một biện pháp không bị ảnh hưởng chỉ bởi sự thay đổi số lượng trường hợp. Biện pháp phi (ǿ) dành cho cơ sở này, tức là tài sản mà chúng tôi mong muốn trong biện pháp của chúng tôi. Biện pháp này chỉ đơn giản là một tỷ lệ giữa giá trị chi bình phương và tổng số của các trường hợp được nghiên cứu.

Số đo phi (ø) được định nghĩa là:

Ø = √x ² / n

đó là căn bậc hai của bình phương chia cho số trường hợp.

Do đó, bằng cách áp dụng công thức này cho hai ví dụ được trích dẫn ở trên, trong trường hợp đầu tiên:

Do đó, số đo ø không giống như bình phương chi, cho kết quả tương tự khi tỷ lệ trong các ô so sánh giống hệt nhau.

G. Udny Yule đã đề xuất một hệ số liên kết khác thường được chỉ định là Q Q (thường được gọi là Qule của Yule), biện pháp liên kết trong? x 2 bàn. Hệ số liên kết (Q) có được bằng cách tính tỷ lệ giữa chênh lệch và tổng của các sản phẩm chéo của các ô chéo, nếu các ô của bảng 2 × 2 được chỉ định như trong bảng sau:

ac- bc / quảng cáo + được

trong đó a, b, c và d đề cập đến tần số ô.

Hệ số liên kết Q thay đổi giữa trừ một và cộng một (+1) là nhỏ hơn hoặc lớn hơn quảng cáo. Q đạt giới hạn +1 của nó bất cứ khi nào một trong các ô bằng 0, nghĩa là liên kết hoàn tất (tương quan là hoàn hảo). Q bằng 0 khi các biến độc lập (nghĩa là khi không có liên kết), tức là khi quảng cáo. = được và. Q = 0.

Áp dụng công thức trên được minh họa trong ví dụ sau:

Chúng ta hãy tính Hệ số kết hợp của Yule giữa tình trạng hôn nhân và hiệu suất trong kiểm tra trên cơ sở dữ liệu được trình bày trong bảng sau:

Thay thế các giá trị trên trong công thức của Yule:

Vì vậy, có một mối liên quan tiêu cực nhẹ giữa tình trạng hôn nhân và hiệu suất trong kiểm tra.

Chúng tôi cũng có thể xem xét vấn đề từ một quan điểm khác.

Tỷ lệ sinh viên đã kết hôn thất bại là = 60 × 100/150 = 40.

Tỷ lệ sinh viên chưa kết hôn thất bại là, = 100 × 100/350 = 28, 57 (xấp xỉ)

Do đó, 40 phần trăm sinh viên đã kết hôn và gần 29 phần trăm sinh viên chưa kết hôn đã thất bại trong kỳ thi. Do đó, kết quả học tập kém của sinh viên có thể được quy cho tình trạng hôn nhân.

Suy luận nhân quả có thể được thiết lập rất an toàn trong một tình huống thử nghiệm. Chúng tôi đã xem xét vấn đề này khi xử lý các thiết kế thử nghiệm. Trong khoa học xã hội, rất khó để thiết lập một thí nghiệm, vì vậy hầu hết các nghiên cứu đều là những thử nghiệm không thử nghiệm. Tuy nhiên, các quy trình phân tích đã được đưa ra để rút ra những suy luận về mối quan hệ nhân quả trong các nghiên cứu phi thực nghiệm.

Trong hầu hết các nghiên cứu xã hội liên quan đến một nghiên cứu về các mẫu được rút ra từ 'dân số' và tìm cách vẽ ra những khái quát cho 'dân số' này, điều cần thiết là, vì lợi ích của khoa học, để biết mức độ mà các khái quát hóa được rút ra biện minh.

Giả sử, trong một nghiên cứu về các mẫu học sinh nam và nữ, kết quả của chúng tôi cho thấy sự khác biệt đáng kể giữa hai mẫu về số giờ họ dành cho các nghiên cứu.

Chúng tôi có thể hỏi liệu sự khác biệt được quan sát có phản ánh sự khác biệt thực sự giữa học sinh nam và nữ hay không, liệu hai 'dân số' học sinh có thực sự giống nhau về số giờ họ dành cho nghiên cứu nhưng các mẫu được rút ra từ các 'quần thể' này đối với nghiên cứu có thể khác với mức độ này là 'cơ hội'.

Một số quy trình thống kê đã được thiết kế để cho phép chúng tôi trả lời một câu hỏi như vậy theo các tuyên bố xác suất.

Khi chúng ta so sánh các mẫu hoặc nghiên cứu sự khác biệt giữa các nhóm thử nghiệm và nhóm kiểm soát, chúng ta thường muốn kiểm tra một số giả thuyết về bản chất của sự khác biệt thực sự giữa các "quần thể" được cho là được đại diện bởi các mẫu được nghiên cứu.

Trong khoa học xã hội, chúng ta thường quan tâm đến giả thuyết tương đối thô thiển (ví dụ, các sinh viên nữ dành nhiều thời gian cho nghiên cứu của họ hơn các sinh viên nam làm).

Chúng tôi thường không ở vị trí để xem xét giả thuyết cụ thể hoặc chính xác hơn (ví dụ: trong đó xác định chính xác về sự khác biệt giữa hai "quần thể"). Giả sử, dữ liệu của chúng tôi cho thấy mẫu học sinh nữ dành trung bình bốn giờ cho các nghiên cứu trong khi mẫu của học sinh nam, chỉ hai giờ.

Rõ ràng, những phát hiện của các mẫu của chúng tôi phù hợp với giả thuyết, tức là, các sinh viên nữ dành nhiều thời gian cho nghiên cứu của họ hơn so với các đồng nghiệp nam. Nhưng chúng ta phải liên tục ghi nhớ khả năng rằng những phát hiện dựa trên các mẫu của chúng ta có thể không giống hệt như những phát hiện mà chúng ta có thể thu được nếu chúng ta nghiên cứu hai "quần thể" trong toto.

Bây giờ, chúng tôi muốn ước tính liệu chúng tôi có còn quan sát được nhiều thời gian hơn cho các nghiên cứu giữa các sinh viên nữ hay không, chúng tôi đã nghiên cứu tổng số 'dân số'. Ước tính như vậy là có thể nếu chúng ta kiểm tra 'giả thuyết không.'

Giả thuyết 'null' nói rằng 'quần thể' không khác nhau về đặc điểm nghiên cứu. Trong trường hợp này, một 'giả thuyết không' sẽ nói rằng trong toàn bộ 'dân số' học sinh, các nhóm nhỏ của học sinh nữ và nam không khác nhau về thời gian họ dành cho việc học.

Các kỹ thuật thống kê khác nhau được gọi là các thử nghiệm có ý nghĩa, đã được phát minh giúp chúng tôi ước tính khả năng hai mẫu của chúng tôi có thể khác nhau đến mức độ chúng làm, tình cờ, ngay cả khi thực sự không có sự khác biệt giữa hai 'quần thể' tương ứng của nam và nữ sinh viên về thời gian dành cho nghiên cứu.

Trong số các phương pháp kiểm tra có ý nghĩa khác nhau, quyết định phương pháp nào sẽ phù hợp với một nghiên cứu cụ thể phụ thuộc vào bản chất của các phép đo được sử dụng và phân phối các đặc điểm (ví dụ: số giờ học, số trẻ em, mức lương mong đợi, v.v. ).

Hầu hết các thử nghiệm có ý nghĩa này đều cho rằng các phép đo tạo thành thang đo khoảng và phân bố của đặc tính xấp xỉ một đường cong bình thường. Trong nghiên cứu xã hội, những giả định này hiếm khi tương ứng với thực tế. Tuy nhiên, các phát triển thống kê gần đây đã đưa ra một số giải pháp cho vấn đề này, dưới dạng các xét nghiệm không tham số không dựa trên các giả định này.

Tại thời điểm này, chúng ta nên cố gắng hiểu lý do tại sao 'giả thuyết null' nên được kiểm tra khi mối quan tâm thực sự của chúng ta là kiểm tra một giả thuyết (giả thuyết thay thế, vì nó được gọi là) nói rằng có sự khác biệt giữa hai 'quần thể' đại diện bởi các mẫu.

Lý do là dễ dàng để đánh giá cao. Vì chúng ta không biết bức tranh thực sự trong 'dân số', điều tốt nhất chúng ta có thể làm là đưa ra những suy luận về nó trên cơ sở tìm kiếm mẫu của chúng ta.

Nếu chúng ta đang so sánh hai mẫu, tất nhiên, có hai khả năng:

(1) Hoặc, các quần thể được đại diện bởi mẫu giống nhau hoặc

(2) Chúng khác nhau.

Các mẫu của chúng tôi từ hai "quần thể" khác nhau về một số thuộc tính; giờ dành cho các nghiên cứu trong ví dụ của chúng tôi. Rõ ràng, điều này có thể xảy ra nếu hai "quần thể" mà các mẫu đại diện thực tế khác nhau về thuộc tính đã nói.

Tuy nhiên, điều này không tạo thành một bằng chứng rõ ràng cho thấy các 'quần thể' này khác nhau, vì luôn có khả năng các mẫu không tương ứng chính xác với 'quần thể' mà chúng có ý định đại diện.

Do đó, chúng ta phải cho phép khả năng rằng yếu tố cơ hội liên quan đến việc lựa chọn một mẫu có thể đã cho chúng ta các mẫu khác nhau mặc dù hai "quần thể" mà chúng được rút ra trên thực tế không khác nhau.

Câu hỏi mà chúng tôi có thể muốn hỏi, do đó, là:

Có thể chúng ta có thể có các mẫu khác nhau về mức độ chúng làm, ngay cả khi 'quần thể' mà chúng được rút ra không khác nhau? Đây chính xác là câu hỏi mà câu trả lời 'giả thuyết không'.

Giả thuyết không có giá trị 'giúp chúng ta ước tính khả năng hai mẫu khác nhau ở mức độ này sẽ được rút ra từ hai' quần thể 'giống nhau như thế nào: 5 trên 100? 1 trên 100? hay bất cứ cái gì.

Nếu thử nghiệm thống kê có ý nghĩa cho thấy rằng không thể có hai mẫu khác nhau ở mức độ này có thể được rút ra từ 'quần thể' thực tế giống nhau, thì chúng ta có thể kết luận rằng hai "quần thể" có thể khác nhau.

Một điểm cần lưu ý ở đây là tất cả các thử nghiệm thống kê có ý nghĩa và do đó, tất cả các khái quát từ mẫu đến quần thể đều dựa trên giả định rằng các mẫu không được chọn theo cách có thể có sự thiên vị trong quá trình vẽ mẫu.

Nói cách khác, giả định là mẫu mà chúng tôi đã chọn đã được rút ra sao cho tất cả các trường hợp hoặc vật phẩm trong 'dân số' đều có cơ hội tương đương hoặc có thể xác định được đưa vào mẫu.

Nếu giả định này không chính đáng, các thử nghiệm có ý nghĩa trở nên vô nghĩa và không thể áp dụng được. Nói cách khác, các thử nghiệm có ý nghĩa chỉ áp dụng khi nguyên tắc xác suất đã được sử dụng trong việc chọn mẫu.

Để trở lại minh họa của chúng tôi, giả sử, phát hiện của chúng tôi cho thấy không có sự khác biệt giữa hai mẫu: có nghĩa là cả sinh viên nam và nữ trong mẫu của chúng tôi được tìm thấy để dành thời gian bằng nhau cho nghiên cứu của họ.

Sau đó chúng ta có thể nói rằng hai "quần thể" của học sinh nam và nữ giống nhau về thuộc tính này không? Tất nhiên, chúng tôi không thể nói điều này với bất kỳ sự chắc chắn nào vì có khả năng các mẫu có thể giống nhau khi dân số thực sự khác nhau.

Nhưng để quay lại trường hợp hai mẫu khác nhau, chúng ta có thể khẳng định rằng hai quần thể mà chúng đại diện có thể khác nhau nếu chúng ta có thể bác bỏ 'giả thuyết khống'; nghĩa là, nếu chúng ta có thể chỉ ra rằng sự khác biệt giữa hai mẫu dường như không xuất hiện nếu các 'quần thể' ở trên không khác nhau.

Nhưng một lần nữa, có một số khả năng chúng ta có thể sai khi bác bỏ 'giả thuyết khống' vì bản chất của xác suất là những sự kiện thậm chí rất khó xảy ra đôi khi có thể xảy ra.

Có một mặt khác của nó, quá. Cũng như chúng ta có thể sai khi bác bỏ 'giả thuyết khống', cũng có khả năng là chúng ta có thể sai khi chấp nhận 'giả thuyết khống'. Đó là, ngay cả khi thử nghiệm thống kê có ý nghĩa của chúng tôi chỉ ra rằng sự khác biệt mẫu có thể dễ dàng phát sinh do tình cờ mặc dù 'quần thể' là tương tự nhau, tuy nhiên có thể đúng là 'quần thể' thực tế khác nhau.

Nói cách khác, chúng tôi luôn phải đối mặt với nguy cơ mắc bất kỳ một trong hai loại lỗi sau:

(1) Chúng tôi có thể bác bỏ 'giả thuyết khống' khi thực tế nó là sự thật,

(2) Chúng tôi có thể chấp nhận 'giả thuyết khống' khi thực tế nó sai.

Loại lỗi đầu tiên, chúng tôi có thể gọi là lỗi Loại I. Điều này bao gồm suy luận rằng hai "quần thể" khác nhau khi trên thực tế chúng giống nhau.

Loại lỗi thứ hai có thể được gọi là lỗi Loại II. Điều này bao gồm việc suy ra rằng hai "quần thể" giống nhau khi thực tế chúng khác nhau.

Rủi ro gây ra lỗi Loại I được xác định bởi mức độ quan trọng mà chúng tôi sẵn sàng chấp nhận trong thử nghiệm thống kê của mình, ví dụ: 0, 05, 0, 01, 0, 001, v.v. (nghĩa là 5 trong 100, 1 trên 100 và 1 trong 1000 Do đó, nếu chúng ta quyết định, chẳng hạn, quần thể thực sự khác nhau bất cứ khi nào một thử nghiệm có ý nghĩa cho thấy rằng sự khác biệt giữa hai mẫu sẽ xảy ra do tình cờ không quá 5 lần trong 100.

Điều này có nghĩa là nếu hai 'quần thể' được đại diện bởi mẫu trên thực tế giống nhau (về một thuộc tính nhất định), thì chúng tôi chấp nhận 5 cơ hội trong 100 rằng chúng tôi sẽ sai khi từ chối 'giả thuyết khống'. Tất nhiên, chúng tôi có thể giảm thiểu rủi ro mắc lỗi Loại I bằng cách đưa ra tiêu chí của chúng tôi để bác bỏ giả thuyết khống, chặt chẽ và chặt chẽ hơn.

Ví dụ, chúng tôi có thể quyết định mức ý nghĩa ở mức 0, 01, nghĩa là chúng tôi sẽ từ chối 'giả thuyết khống' chỉ khi thử nghiệm cho thấy sự khác biệt trong hai 'mẫu' có thể chỉ xuất hiện một lần trong một trăm.

Về bản chất, điều chúng tôi đang nói là chúng tôi sẽ từ chối 'giả thuyết khống' nếu thử nghiệm cho thấy trong số một trăm mẫu có kích thước được chỉ định được chọn từ 'quần thể' tương ứng bằng cách sử dụng nguyên tắc xác suất, chỉ một mẫu sẽ cho thấy sự khác biệt về mặt các thuộc tính đến mức độ này được thấy trong hai mẫu nghiên cứu.

Tiêu chí bác bỏ 'giả thuyết khống' có thể được thực hiện nghiêm ngặt hơn nữa bằng cách nâng cao hơn nữa mức độ quan trọng. Nhưng điều khó khăn ở đây là, các lỗi của Loại I và Loại II xảy ra có liên quan với nhau đến mức chúng ta càng tự bảo vệ mình khỏi lỗi Loại I, chúng ta càng dễ mắc lỗi Loại II.

Đã xác định mức độ rủi ro của lỗi loại I mà chúng tôi sẵn sàng chạy, cách duy nhất để giảm khả năng xảy ra lỗi Loại II là lấy các mẫu lớn hơn và sử dụng các thử nghiệm thống kê để sử dụng tối đa thông tin có liên quan.

Tình huống liên quan đến lỗi Loại II có thể được minh họa một cách rất chính xác bằng một đường cong đặc trưng mở ra. Một hành vi của đường cong này phụ thuộc vào độ lớn của mẫu. Mẫu càng lớn, càng ít có khả năng chúng ta sẽ chấp nhận một giả thuyết cho thấy một tình trạng cực kỳ xa rời trạng thái thực tế.

Trong chừng mực mối quan hệ giữa lỗi Loại I và Loại II là nghịch đảo, cần phải đạt được sự cân bằng hợp lý giữa hai loại rủi ro.

Trong khoa học xã hội, nó gần như đã trở thành một thông lệ hoặc quy ước được thiết lập để bác bỏ 'giả thuyết khống' khi thử nghiệm chỉ ra rằng sự khác biệt giữa các mẫu sẽ không xảy ra do tình cờ hơn 5 lần trong số 100. Nhưng các quy ước rất hữu ích khi có không có hướng dẫn hợp lý khác.

Nhà nghiên cứu phải đưa ra quyết định về việc cân bằng giữa hai loại lỗi như thế nào. Trong một số trường hợp, điều quan trọng hơn là phải chắc chắn từ chối một giả thuyết khi nó sai hơn là không chấp nhận nó khi nó đúng. Trong các trường hợp khác, điều ngược lại có thể đúng.

Ví dụ, ở một số quốc gia, việc từ chối một giả thuyết về tội lỗi khi nó sai được coi là quan trọng hơn là không chấp nhận giả thuyết này khi nó đúng, tức là một người được coi là không có tội miễn là có nghi ngờ hợp lý về cảm giác tội lỗi của mình. Ở một số quốc gia khác, một người bị buộc tội hình sự được coi là có tội cho đến khi anh ta chứng tỏ mình không có tội.

Trong nhiều nghiên cứu, tất nhiên, không có cơ sở rõ ràng để quyết định liệu lỗi Loại I hoặc Loại II sẽ tốn kém hơn và do đó, điều tra viên sử dụng mức độ thông thường để xác định ý nghĩa thống kê. Nhưng, có thể có một số nghiên cứu trong đó một loại lỗi rõ ràng sẽ tốn kém và có hại hơn loại kia.

Giả sử, trong một tổ chức, người ta đã gợi ý rằng một phương pháp phân công lao động mới sẽ hiệu quả hơn và giả sử rằng phương pháp này sẽ đòi hỏi rất nhiều chi phí.

Nếu một thử nghiệm cấu thành hai nhóm nhân sự - một nhóm hoạt động như nhóm thử nghiệm và nhóm kia, là nhóm kiểm soát - được thiết lập để kiểm tra xem phương pháp mới có thực sự có lợi cho các mục tiêu của tổ chức hay không và liệu có thể dự đoán rằng phương pháp mới sẽ đòi hỏi rất nhiều chi phí, tổ chức sẽ không muốn áp dụng nó trừ khi có sự đảm bảo đáng kể về tính ưu việt của nó.

Nói cách khác, sẽ rất tốn kém khi tạo ra lỗi Loại 1, nghĩa là, kết luận rằng phương pháp mới sẽ tốt hơn khi thực tế không phải vậy.

Nếu phương pháp mới đòi hỏi các chi phí giống như phương pháp cũ, thì lỗi loại II sẽ không mong muốn và gây thiệt hại nhiều hơn vì nó có thể dẫn đến sự thất bại của ban quản lý khi áp dụng phương pháp mới khi nó thực sự vượt trội và như vậy có lợi ích lâu dài trong cửa hàng cho tổ chức.

Bất kỳ khái quát hóa nào từ mẫu đến 'dân số' chỉ đơn giản là một tuyên bố về xác suất thống kê. Hãy để chúng tôi nói, chúng tôi đã quyết định làm việc với mức ý nghĩa 0, 05. Điều này có nghĩa là chúng ta sẽ từ chối 'giả thuyết khống' chỉ khi sự khác biệt mẫu về độ lớn mà chúng ta quan sát được có thể xảy ra do tình cờ không quá 5 lần trong 100.

Tất nhiên, chúng tôi sẽ chấp nhận 'giả thuyết khống' nếu sự khác biệt đó có thể xảy ra do tình cờ hơn 5 lần trong số 100. Bây giờ câu hỏi là: Phát hiện của chúng tôi có đại diện cho một trong 5 lần khi sự khác biệt đó có thể có tình cờ xuất hiện?

Câu hỏi này không thể được trả lời dứt khoát trên cơ sở một phát hiện bị cô lập. Tuy nhiên, chúng ta có thể nói điều gì đó về điều này khi chúng ta kiểm tra các mẫu trong các phát hiện của chúng ta.

Giả sử chúng ta quan tâm đến việc thử nghiệm hiệu ứng của một bộ phim về thái độ đối với một chương trình chính phủ cụ thể, theo kế hoạch hóa gia đình. Chúng tôi, chúng tôi đã nói, chăm sóc đầy đủ để giữ các điều kiện mong muốn cho thử nghiệm ở mức tối đa.

Bây giờ giả sử rằng chúng tôi sử dụng như một thước đo thái độ đối với chương trình, chỉ có một mục, viz., Thái độ đối với khoảng cách trẻ em và thấy rằng những người xem phim có khuynh hướng thiên về vấn đề này hơn những người không xem phim.

Bây giờ giả sử, thử nghiệm thống kê cho thấy sự khác biệt sẽ không xuất hiện do tình cờ do biến động lấy mẫu ngẫu nhiên nhiều hơn một lần trong hai mươi. Theo logic, điều đó cũng có nghĩa là nó có thể đã xuất hiện một cách tình cờ một lần trong hai mươi (hoặc 5 lần trong 100). Như chúng tôi đã chỉ ra, chúng tôi không có cách nào để biết liệu mẫu của chúng tôi có phải là một trong số năm trong số 100 hay không. Bây giờ, chúng tôi có thể làm gì tốt nhất?

Hãy để chúng tôi nói, chúng tôi đã hỏi 40 câu hỏi khác nhau cho người trả lời, đó là những chỉ số hợp lý về thái độ đối với chương trình chính phủ phúc lợi gia đình. Nếu chúng tôi đang sử dụng mức độ tin cậy là 5% và nếu chúng tôi hỏi 100 câu hỏi, chúng tôi có thể mong đợi tìm thấy sự khác biệt có ý nghĩa thống kê có thể quy cho 5 người trong số họ.

Do đó, trong số 40 câu hỏi của chúng tôi về các mặt hàng khác nhau, chúng tôi có thể mong đợi tìm thấy sự khác biệt có ý nghĩa thống kê trên 2 trong số chúng. Nhưng, giả sử chúng ta thực sự thấy rằng trên 25 trong số 40 câu hỏi về những người xem phim có thái độ thuận lợi hơn so với những người không xem phim.

Chúng tôi có thể, trong trường hợp này, cảm thấy an toàn hơn nhiều khi kết luận rằng có một sự khác biệt thực sự về thái độ (mặc dù bài kiểm tra thống kê chỉ ra rằng sự khác biệt có thể phát sinh do tình cờ trên mỗi câu hỏi 5 lần trong 100).

Bây giờ chúng ta hãy giả sử rằng trong số 40 câu hỏi, chỉ trả lời một, tức là về khoảng cách của trẻ em, cho thấy sự khác biệt có ý nghĩa thống kê giữa hai nhóm tiếp xúc với phim và những người không tiếp xúc với phim). Sự khác biệt này cũng có thể xảy ra do tình cờ.

Mặt khác, có thể nội dung của bộ phim thực sự đã ảnh hưởng đến ý kiến về điểm này nhưng không ảnh hưởng đến bất kỳ vấn đề nào khác (chẳng hạn như liên quan đến hoạt động vô trùng). Nhưng trừ khi giả thuyết của chúng tôi đã dự đoán cụ thể trước rằng bộ phim sẽ có nhiều khả năng ảnh hưởng đến thái độ đối với khoảng cách của trẻ em hơn là thái độ đối với bất kỳ 39 câu hỏi nào khác, chúng tôi không có lý do để đưa ra giải thích này.

Cách giải thích như vậy, tức là, người ta viện dẫn để giải thích những phát hiện sau khi chúng xuất hiện, được gọi là cách giải thích 'hậu thực tế', bởi vì điều này liên quan đến những giải thích được cung cấp để chứng minh cho những phát hiện đó là gì. Nó phụ thuộc vào sự khéo léo của nhà nghiên cứu, như cách giải thích mà anh ta có thể phát minh ra để biện minh cho phát hiện này. Do đó, anh ta có thể biện minh ngay cả những phát hiện ngược lại.

Merton đã rất sáng suốt chỉ ra rằng các diễn giải sau thực tế được thiết kế để giải thích các quan sát của Keith. Phương pháp giải thích hậu thực tế là hoàn toàn linh hoạt. Nếu nhà nghiên cứu nhận thấy rằng những người thất nghiệp có xu hướng đọc ít sách hơn so với trước đây, thì đây có thể là điều được giải thích bởi giả thuyết rằng sự lo lắng do thất nghiệp ảnh hưởng đến sự tập trung và do đó việc đọc trở nên khó khăn.

Tuy nhiên, nếu quan sát thấy rằng người thất nghiệp đọc nhiều sách hơn trước đây (khi có việc làm), một lời giải thích sau thực tế mới có thể được đưa ra; lời giải thích là những người thất nghiệp có nhiều thời gian rảnh rỗi hơn và do đó, họ đọc nhiều sách hơn.

Bài kiểm tra quan trọng về 'một mối quan hệ thu được (giữa các biến) không phải là lý do và giải thích hậu thực tế cho nó; nó đúng hơn là khả năng dự đoán nó hoặc dự đoán các mối quan hệ khác trên cơ sở của nó. Do đó, phát hiện trước đây của chúng tôi về sự khác biệt về thái độ đối với khoảng cách của trẻ em, mặc dù có ý nghĩa thống kê, không thể được coi là được thiết lập bởi nghiên cứu chúng tôi đã thực hiện.

Vì, báo cáo thống kê là tuyên bố xác suất, chúng tôi không bao giờ hoàn toàn có thể chỉ dựa vào bằng chứng thống kê để quyết định liệu chúng tôi có chấp nhận giả thuyết là đúng hay không.

Niềm tin vào việc giải thích kết quả nghiên cứu không chỉ đòi hỏi sự tin cậy về mặt thống kê về độ tin cậy của kết quả nghiên cứu (nghĩa là sự khác biệt không có khả năng xảy ra do tình cờ) mà ngoài ra, một số bằng chứng về tính hợp lệ của các giả định của nghiên cứu.

Bằng chứng này là nhất thiết phải gián tiếp. Nó xuất phát từ sự phù hợp của các kết quả nghiên cứu nhất định với các kiến thức khác đã vượt qua thử thách của thời gian và do đó, có sự đảm bảo đáng kể.

Ngay cả trong cuộc điều tra được kiểm soát chặt chẽ nhất, việc thiết lập niềm tin vào việc giải thích kết quả của một người hoặc trong việc đưa ra các mối quan hệ nhân quả đòi hỏi phải nhân rộng nghiên cứu và liên quan đến những phát hiện của những nghiên cứu khác.

Cần lưu ý rằng ngay cả khi kiểm tra thống kê và phát hiện của một số nghiên cứu cho thấy thực sự có sự khác biệt nhất quán giữa hai nhóm hoặc mối quan hệ nhất quán giữa hai biến, điều này vẫn không tạo thành bằng chứng về lý do của mối quan hệ.

Nếu chúng ta muốn rút ra các kết luận nguyên nhân (ví dụ: X tạo ra Y), chúng ta phải đáp ứng các giả định trên và trên các giả định cần thiết để thiết lập sự tồn tại của một mối quan hệ. Cũng đáng lưu ý rằng một kết quả không có ý nghĩa về mặt xã hội hoặc tâm lý chỉ vì nó có ý nghĩa thống kê. Nhiều khác biệt có ý nghĩa thống kê có thể là tầm thường trong cách nói xã hội thực tế.

Ví dụ, sự khác biệt trung bình dưới một điểm IQ giữa người dân thành thị và nông thôn có thể có ý nghĩa thống kê, nhưng không phải như vậy trong cuộc sống hàng ngày thực tế. Ngược lại, có những trường hợp một sự khác biệt nhỏ nhưng đáng tin cậy có ý nghĩa thực tiễn lớn.

Trong một cuộc khảo sát quy mô lớn, chẳng hạn, sự khác biệt một nửa hoặc một phần trăm có thể đại diện cho hàng trăm ngàn người và nhận thức về sự khác biệt có thể quan trọng đối với các quyết định chính sách quan trọng. Do đó, nhà nghiên cứu bên cạnh việc quan tâm đến ý nghĩa thống kê của những phát hiện của mình cũng phải quan tâm đến ý nghĩa xã hội và tâm lý của chúng.

Suy ra mối quan hệ nhân quả:

Do những khó khăn rõ ràng, các thiết kế thí nghiệm cứng nhắc như vậy hiếm khi có thể được thực hiện trong các cuộc điều tra khoa học xã hội. Hầu hết các câu hỏi trong khoa học xã hội là không thử nghiệm trong tính cách.

Trong các nghiên cứu như vậy, có những trở ngại thực nghiệm nhất định trong cách xác định liệu một mối quan hệ giữa các biến có phải là nguyên nhân hay không. Nó đã được đề cập nhiều lần rằng một trong những nhiệm vụ khó khăn nhất trong việc phân tích dữ liệu hành vi xã hội là thiết lập các mối quan hệ nguyên nhân và kết quả.

Một tình huống có vấn đề nợ nguồn gốc của nó và quá trình trở thành, không chỉ với một yếu tố mà còn phức tạp của một loạt các yếu tố và trình tự.

Quá trình tháo gỡ các yếu tố này đặt ra một thách thức lớn đối với trí tưởng tượng xã hội học và đặt ra để kiểm tra kỹ năng của các nhà nghiên cứu. Thật nguy hiểm khi làm theo lời giải thích 'một đường' dẫn đến nguyên nhân. Điều bắt buộc là phải tìm kiếm một bộ pin gồm các yếu tố nguyên nhân thường đóng vai trò quan trọng trong việc mang lại các tình huống xã hội phức tạp.

Như Karl Pearson quan sát một cách khéo léo, không có hiện tượng hay giai đoạn nào trong chuỗi chỉ có một nguyên nhân; tất cả các giai đoạn tiền đề là nguyên nhân kế tiếp nhau; Khi chúng ta nói một cách khoa học nguyên nhân, chúng ta thực sự mô tả các giai đoạn kế tiếp của một thói quen trải nghiệm.

Yule và Kendall đã nhận ra một thực tế là thống kê mà Google phải chấp nhận để phân tích, dữ liệu chịu ảnh hưởng của một loạt các nguyên nhân và phải cố gắng khám phá từ chính dữ liệu đó là những nguyên nhân quan trọng và mức độ ảnh hưởng quan sát được là do hoạt động của mỗi.

Paul Lazarsfeld đã lần theo các giai đoạn liên quan đến kỹ thuật mà ông gọi là 'sáng suốt'. Ông ủng hộ việc sử dụng nó trong việc xác định mối quan hệ nhân quả giữa các biến. Lazarsfeld đưa ra thủ tục này:

(a) Xác minh sự cố bị cáo buộc như dưới đây:

In order to verify this occurrence, it is necessary to ascertain if the person has actually experienced the alleged situations. If so, how does the occurrence manifest itself and under what conditions, in his immediate life?

What reasons are advanced for the belief that there is a specific interconnection between two variables, eg, loss of employment and loss of authority? How correct is the person's reasoning in this particular instance?

(b) Attempting to discover whether the alleged condition is consistent with objective facts of the past life of this person.

(c)Testing all possible explanation for the observed condition.

(d) Ruling out those explanations which are not in accord with the pattern of happenings.

It is quite understandable that most difficulties or obstacles to establishing causal relationships afflict non-experimental studies most sharply. In non-experimental studies where the interest is in establishing causal relationships among two variables, the investigator must find substitutes for safeguards that are patently built into the experimental studies.

Many of these safeguards enter at the time of planning data- collection, in the form of providing for the gathering of information about a number of variables that might well be the alternative conditions for producing the hypothesized effect.

By introducing such additional variables into the analysis, the researcher approximates some of the controls that are inherent in experiments. Nevertheless, the drawing of inferences of causality does always remain somewhat hazardous in non-experimental studies.

We shall now discuss some of the problems and the strategies to overcome them, relating to drawing inferences about causality in non-experimental studies. If a non-experimental study points to a relationship or association between two variables, say X and Y, and if the research interest is in causal relationships rather than in the simple fact of association among variables, the analysis has taken only its first step.

The researcher must further consider (besides association between X and Y) whether Y (effect) might have occurred before X (the hypothesized cause), in which case Y cannot be the effect of X.

In addition to this consideration, the researcher must ponder over the issue whether factors other than X (the hypothesized cause) may have produced Y (the hypothesized effect). This is generally taken care of by introducing additional variables into the analysis and examining how the relation between X and Y is affected by these further variables.

If the relationship between X and Y persists even when other presumably effective and possibly alternative variables are introduced, the hypothesis that X is the cause of Y remains tenable.

For example, if the relation between eating a particular seasonal fruit (X) and cold (Y) does not change even when other variables such as age, temperature, state of digestion, etc., are introduced into the analysis, we may accept the hypothesis that X leads to Y as tenable.

But it is possible in no small number of cases that the introduction of other additional variables may change the relationship between X and Y. It may reduce to totally eliminate the relationship between X and Y or it may enhance the relationship in one group and reduce it in another.

If the relationship between X (eating of seasonal fruit) and Y (cold) is enhanced in a sub-group characterized by Z (bad state of digestion) and reduced in sub-group not characterized by Z (normal state of digestion), we may conclude that Z is the contingent condition for the relationship between X and Y.

This means, in other words, that we have been able to specify condition (Z) under which the relation between X and Y holds. Now if introduction of Z in the analysis reduces or totally eliminates the relationship between X and Y, we shall be safe in concluding either that X is not a producer of Y, that is, the relation between X and Y is 'spurious' or that we have traced the process by which X leads to Y (ie, through Z).

Let us turn to consider the situation in which we can legitimately conclude that the relation between X and Y is spurious.

An apparent relationship between two variables X and Y is said to be spurious if their concomitant variation stems not from a connection between them but from the fact that each of them (X and Y) is related to some third variable (Z) or a combination of variables that does not serve as a link in the process by which X leads to Y.

The situation characterizing spurious relationship may be diagrammed as under:

The objective here is to determine the cause of Y, the dependent variable (let us say, the monetary expectation by college graduates). The relationship (broken line) between X the independent variable (let us say, the grades obtained by students) and the monetary expectation of graduates (Y) has been observed in the course of the analysis of data.

Another variable (Z) is introduced to see how the relation between X and Y behaves with the entry of this third factor. Z is the third factor (let us say, the income-level of the parents of students). We find that the introduction of this factor reduces the relationship between X and Y.

That is, it is found that the relation between higher grade in the examination and higher monetary expectations does not hold itself up, but is considerably reduced when we introduce the third variable, ie, the level of parents' income.

Such an introduction of Z brings to light the fact that not X but Z may probably be a determining factor of Y. So the relationship between X and Y (shown in the diagram by a dotted line) is a spurious one, whereas the relation between Z and Y is a real one. Let us illustrate this with the help of hypothetical data.

Suppose, in the course of the analysis of data in a study, it was seen that there is a significant correlation between the grades or divisions (I, II, III) that students secured in the examination and the salary they expect for a job that they might be appointed to.

It was seen, for instance, that generally the first divisioners among students expected a higher remuneration compared to the second divisioners and the second divisioners expected more compared to the third divisioners.

The following table illustrates the hypothetical state of affairs:

It is clearly seen from the table that there is a basis for hypothesizing that the grades of the students determine their expectations about salaries. Now, let us suppose that the researcher somehow hits upon the idea that the income-level of the parents (X) could be one of the important variables determining or influencing the students' expectations about salaries (Y). Thus, Z is introduced into the analysis.

Suppose, the following table represents the relationship among the variables:

Chú thích:

HML in the horizontal row, dividing each category of the students' grades, stand respectively for high parental level of income, moderate parental level of income and low parental level of income. The above table clearly shows that the relation between X and Y has become less significant compared to the relation between Z and Y. '

To get a clearer picture, let us see the following table (a version of Table B omitting the categories of X) showing the relationship between Z and, ie, parental income level and students' monetary expectations:

We can very clearly see from the table that, irrespective of their grades, the students' monetary expectations are very strongly affected by the parental levels of income (Z).

We see that an overwhelming number of students (ie, 91.5%) having high monetary expectations are from the high parental income group, 92% having moderate monetary expectations are from moderate parental income group and lastly, 97% having low monetary expectations are from the low parental income group.

Comparing this picture with the picture represented by Table A, we may say that the relation between X and Y is spurious, that is, the grade of the students did not primarily determine the level of the monetary expectations of the students.

It is noted in Table A that students getting a higher grade show a significant tendency toward higher monetary expectations whereas the lower grade students have a very marked concentration in the lower monetary expectation bracket.

But when we introduce the third variable of parental income, the emerging picture becomes clear enough to warrant the conclusion that the real factor responsible differential levels of monetary expectations is the level of parental income.

Trong Bảng C, chúng ta thấy sự tập trung rất mạnh mẽ và ghê gớm của các trường hợp học sinh tương ứng với ba trường hợp được đề cập, viz., Với kỳ vọng tiền tệ cao hơn và thu nhập của phụ huynh cao hơn, kỳ vọng tiền tệ vừa phải và thu nhập của phụ huynh vừa phải và kỳ vọng tiền tệ thấp hơn và thu nhập của cha mẹ thấp hơn, tức là 5%, 92, 1% và 1% tương ứng.

Theo dõi quá trình liên quan và mối quan hệ giữa các biến: Như đã nói trước đó, nếu yếu tố thứ ba Z làm giảm hoặc loại bỏ mối quan hệ giữa biến độc lập X và biến phụ thuộc Y, chúng ta có thể kết luận rằng mối quan hệ giữa X và Y là giả, hoặc rằng chúng tôi đã có thể theo dõi quá trình X dẫn đến Y.

Bây giờ chúng ta sẽ xem xét các trường hợp sẽ đảm bảo kết luận rằng quá trình quan hệ giữa X và Y đã được truy tìm thông qua yếu tố thứ ba Z.

Giả sử, trong một nghiên cứu, các nhà điều tra phát hiện ra rằng các cộng đồng nhỏ hơn có điểm thân mật trung bình cao hơn, điểm thân mật là thước đo sự thân mật của sự liên kết giữa các thành viên của cộng đồng được đưa ra bằng cách sử dụng thang đo thân mật.

Giả sử, họ cũng phát hiện ra rằng các cộng đồng cỡ trung bình có điểm thân mật thấp hơn so với các cộng đồng quy mô nhỏ và cộng đồng quy mô lớn có điểm thân mật trung bình ít nhất. Một phát hiện như vậy cho thấy quy mô của cộng đồng quyết định sự thân mật của sự liên kết giữa các thành viên của cộng đồng.

Nói cách khác, các quan sát đảm bảo kết luận rằng các thành viên sống trong một cộng đồng quy mô nhỏ có sự liên kết mật thiết hơn, trong khi các cộng đồng quy mô lớn được đặc trưng bởi sự liên kết ít thân mật hơn giữa các thành viên.

Bảng sau đây trình bày dữ liệu giả thuyết:

Trong cột thứ hai của bảng, các mẫu tương ứng với từng cộng đồng đã được hiển thị.

Trong cột thứ hai của bảng, các mẫu tương ứng với từng cộng đồng đã được hiển thị. Trong cột 3, điểm số thân mật trung bình tương ứng với các loại cộng đồng được tính toán trên cơ sở các câu trả lời được đưa ra cho một số mục nhất định theo thang điểm liên quan đến các hiệp hội hàng ngày giữa các thành viên đã được hiển thị.

Từ bảng này cho thấy điểm số thân mật trung bình thay đổi ngược với quy mô của cộng đồng, nghĩa là kích thước càng nhỏ, điểm thân mật càng lớn và ngược lại, kích thước càng lớn, điểm thân mật càng thấp.

Bây giờ, giả sử, các nhà điều tra đã có ý tưởng rằng ba loại cộng đồng sẽ khác nhau về cơ hội mà họ cung cấp cho sự tương tác giữa các thành viên, cũng như sự sắp xếp cuộc sống, khu dân cư, tiện ích chung, v.v., sẽ thúc đẩy sự liên kết đó.

Do đó, các nhà điều tra sẽ đưa yếu tố thứ ba vào phân tích tiềm năng tương tác, nghĩa là mức độ mà những người sống trong đó có khả năng cung cấp cơ hội cho sự tương tác giữa họ.

Để kiểm tra giả thuyết rằng phần lớn là do sự khác biệt trong cách bố trí nhà ở, sắp xếp cuộc sống, tiện nghi chung, v.v., ba loại cộng đồng đã tạo ra sự khác biệt trong tương tác giữa các thành viên của cộng đồng, các nhà điều tra sẽ xem xét quy mô của cộng đồng và tương tác-tiềm năng cùng liên quan đến điểm thân mật trung bình.

Do đó, tiềm năng vi phạm là biến thứ ba Z được đưa vào phân tích. Tiềm năng tương tác được phân loại, giả sử, tiềm năng tương tác thấp (b) tiềm năng tương tác trung bình và (c) tiềm năng tương tác cao.

Bảng sau đây biểu thị dữ liệu giả thuyết:

Đọc qua các hàng trong bảng, chúng tôi thấy rằng tiềm năng tương tác có liên quan mạnh mẽ đến điểm số thân mật của các thành viên cộng đồng, bất kể quy mô của cộng đồng.

Đó là, cho dù chúng ta xem xét hàng cho các cộng đồng quy mô nhỏ, cho các cộng đồng cỡ trung bình hoặc cho các cộng đồng quy mô lớn, trong mỗi trường hợp, sẽ có sự gia tăng điểm số thân mật trung bình với sự gia tăng tiềm năng tương tác. Hơn nữa, đọc các mục trên các hàng, có thể thấy rõ rằng quy mô của cộng đồng và tiềm năng tương tác mang một mối tương quan đáng kể.

Ví dụ, khoảng hai phần ba số người được hỏi trong một cộng đồng quy mô nhỏ đang sống trong điều kiện có tiềm năng tương tác cao; chúng tôi cũng thấy rằng một tỷ lệ nhỏ hơn nhiều cư dân cộng đồng có quy mô vừa phải sống trong điều kiện tiềm năng tương tác cao và một tỷ lệ rất nhỏ cư dân cộng đồng quy mô lớn trong điều kiện tiềm năng tương tác cao.

Bây giờ, chúng tôi đọc các điểm số thân mật xuống các cột chỉ để thấy rằng mối quan hệ giữa loại cộng đồng và sự thân mật của hiệp hội đã giảm đáng kể. Trong thực tế, đối với những người sống trong điều kiện tiềm năng tương tác cao, không có mối quan hệ nhất định giữa quy mô của cộng đồng và điểm số thân mật đạt được.

Từ tập hợp các mối quan hệ này, các nhà điều tra có thể kết luận rằng mối quan hệ nghịch đảo giữa quy mô của cộng đồng và điểm số thân mật là tốt, nhưng một trong những cách chính mà một loại cộng đồng cụ thể khuyến khích sự thân mật giữa các thành viên là cơ hội làm tăng tỷ lệ tương tác giữa chúng.

Nói cách khác, các cộng đồng có quy mô nhỏ được đặc trưng bởi điểm thân mật trung bình cao hơn vì kích thước nhỏ của chúng cung cấp một cơ hội cho nhiều cơ hội để có mức độ tương tác cao giữa các thành viên. Các cộng đồng có quy mô lớn, mặt khác, được đặc trưng bởi điểm số thân mật tương đối thấp hơn.

Nhưng điểm số thân mật thấp hơn không phải do quy mô của cộng đồng mà là do một cộng đồng quy mô lớn không thể tạo cơ hội cho sự tương tác cao hơn giữa các thành viên như các cộng đồng quy mô nhỏ làm.

Do đó, các nhà điều tra thay vì kết luận rằng mối quan hệ giữa quy mô cộng đồng và điểm thân mật trung bình giữa các thành viên là giả mạo, có thể kết luận rằng họ có thể theo dõi quá trình X {tức là loại cộng đồng) ảnh hưởng đến Y (điểm thân mật).

Cái trước bảo đảm kết luận rằng mối quan hệ giữa các biến X và Y là giả và kết luận sau đó là quá trình từ X đến Y có thể được truy tìm từ Z (X đến Z đến Y). Trong cả hai trường hợp, việc đưa vào biến thứ ba Z đã làm giảm hoặc loại bỏ mối quan hệ giữa chúng (X và Y).

Một sự khác biệt có thể, tuy nhiên, được lưu ý. Trong ví dụ đầu tiên, biến Z (nghĩa là mức thu nhập của phụ huynh) rõ ràng trước thời hạn so với hai biến số khác (cấp học sinh trong kỳ thi và kỳ vọng tiền tệ của học sinh).

Trong ví dụ thứ hai, biến thứ ba Z (tiềm năng tương tác được cộng đồng cung cấp) đã không xảy ra trước biến nhân quả giả định (quy mô của cộng đồng). Nó đồng thời với nó và có thể được coi là bắt đầu sau nó.

Trình tự thời gian của các biến, do đó, là một xem xét quan trọng trong việc quyết định liệu một mối quan hệ nhân quả rõ ràng là giả mạo. Nghĩa là, nếu biến thứ ba Z, loại bỏ hoặc loại bỏ mối quan hệ giữa các biến liên quan ban đầu X và Y, chúng ta thường kết luận rằng mối quan hệ nhân quả rõ ràng giữa các biến X và Y là giả.

Nhưng nếu biến thứ ba Z được biết hoặc giả sử đã xảy ra cùng thời điểm với X hoặc sau X, thì có thể kết luận rằng quá trình X dẫn đến Y đã được truy tìm. Vì vậy, để có một số đo nhất định niềm tin vào mối quan hệ nhân quả được suy ra từ các nghiên cứu không mang tính thử nghiệm, cần phải đưa chúng vào thử nghiệm quan trọng để loại bỏ các biến có liên quan khác.

Vì lý do này, điều quan trọng là thu thập trong quá trình nghiên cứu, dữ liệu về các biến có thể có ảnh hưởng khác với những biến mà giả thuyết của nghiên cứu được quan tâm tập trung.

Nó đã được tuyên bố trước đó rằng việc đưa một biến thứ ba vào phân tích có thể có tác dụng tăng cường mối quan hệ trong một nhóm phụ và giảm cùng một nhóm trong một nhóm phụ khác. Nếu đó là trường hợp, chúng tôi nói rằng chúng tôi đã chỉ định một điều kiện (Z) theo đó mối quan hệ giữa X và Y giữ.

Bây giờ chúng ta hãy minh họa quá trình đặc tả. Giả sử, trong một nghiên cứu cộng đồng, chúng tôi tình cờ xác định mối quan hệ giữa thu nhập và trình độ học vấn.

Điều này được hiển thị trong bảng được đưa ra dưới đây:

Chúng ta thấy trong bảng rằng mối quan hệ giữa giáo dục và thu nhập là một mối quan hệ khá rõ ràng. Giáo dục đại học, nói chung, cao hơn tỷ lệ các trường hợp có thu nhập hàng năm là 5, 5 rupee / - trở lên. Tuy nhiên, chúng tôi có thể quyết định rằng mối quan hệ yêu cầu đặc điểm kỹ thuật hơn nữa.

Đó là, chúng tôi có thể muốn biết thêm về các điều kiện mà mối quan hệ này có được. Giả sử, ý nghĩ này cho chúng ta thấy rằng thực tế những người được hỏi sống trong cộng đồng công nghiệp đô thị có thể ảnh hưởng tích cực đến lợi thế của giáo dục đối với việc làm thù lao và từ đó phản ánh thu nhập.

Với giả định này, chúng tôi giới thiệu yếu tố thứ ba Z, tức là những người được hỏi sống trong cộng đồng công nghiệp đô thị và những người sống trong cộng đồng phi công nghiệp nông thôn, vào phân tích và xem nó ảnh hưởng như thế nào đến mối quan hệ ban đầu giữa X và Y ( tức là giáo dục và thu nhập).

Giả sử chúng ta có một hình ảnh như trong bảng sau:

Chúng ta có thể thấy rõ rằng Bảng B phản ánh mối quan hệ rất khác nhau giữa thu nhập và giáo dục đối với những người sống trong cộng đồng phi công nghiệp ở nông thôn so với nhóm sống trong cộng đồng công nghiệp đô thị. Chúng tôi thấy rằng đối với những người sống ở các thành phố công nghiệp, mối quan hệ giữa giáo dục và thu nhập có phần cao hơn so với mối quan hệ ban đầu.

Nhưng, đối với những người sống trong các cộng đồng phi công nghiệp ở nông thôn, mối quan hệ trong bảng trên thấp hơn đáng kể so với mối quan hệ ban đầu.

Do đó, việc giới thiệu yếu tố thứ ba và phá vỡ mối quan hệ ban đầu trên cơ sở yếu tố thứ ba (Z) đã giúp xác định một điều kiện theo đó mối quan hệ giữa X và Y rõ ràng hơn cũng là điều kiện theo đó mối quan hệ ít rõ rệt hơn.

Tương tự, giả sử, chúng tôi tìm thấy trong quá trình nghiên cứu rằng những người thuộc nhóm thu nhập cao hơn thường có số lượng trẻ em ít hơn so với những người thuộc nhóm thu nhập thấp hơn. Giả sử, chúng tôi cảm thấy (trên cơ sở định hướng lý thuyết) rằng yếu tố cư trú trong thành phố có thể quan trọng trong việc ảnh hưởng đến mối quan hệ.

Giới thiệu yếu tố này, giả sử, chúng tôi thấy rằng mối quan hệ ban đầu giữa mức thu nhập và số trẻ em trở nên rõ rệt hơn ở thành phố và nó trở nên ít rõ rệt hơn ở người dân nông thôn, hơn là chúng tôi đã xác định được tình trạng Z (nghĩa là ở thành phố ) theo đó mối quan hệ trở nên tăng cường quyết định hoặc phát âm.

Giải thích kết quả của một nghiên cứu:

Cho đến nay, chúng tôi đã quan tâm chủ yếu đến các thủ tục bao gồm, những gì chúng tôi gọi là thông thường, phân tích dữ liệu. Tuy nhiên, nhiệm vụ của nhà nghiên cứu là không đầy đủ nếu anh ta dừng lại bằng cách trình bày những phát hiện của mình dưới dạng khái quát hóa theo kinh nghiệm mà anh ta có thể đi đến thông qua việc phân tích dữ liệu.

Một nhà nghiên cứu, ví dụ, kết thúc bài tập nghiên cứu của mình chỉ bằng cách tuyên bố rằng những người chưa lập gia đình có tỷ lệ tự tử cao hơn so với những người đã kết hôn, hầu như không hoàn thành nghĩa vụ chung đối với khoa học, mặc dù khái quát về kinh nghiệm mà anh ta đã đặt ra không có một số giá trị của chính nó.

Các nhà nghiên cứu vì lợi ích lớn hơn của khoa học cũng phải tìm cách chỉ ra rằng các điểm quan sát của anh ta đối với các mối quan hệ và quá trình đặt dưới nền tảng ban đầu được che giấu trước mắt. Nói cách khác, nhà nghiên cứu phải chỉ ra rằng quan sát của mình có ý nghĩa, rộng hơn và sâu hơn nhiều so với ý nghĩa mà nó dường như có ở cấp độ bề mặt.

Để trở lại ví dụ về tự tử của chúng tôi, nhà nghiên cứu có thể chỉ ra rằng quan sát của anh ấy rằng những người chưa lập gia đình được đặc trưng bởi tự tử, phản ánh mối quan hệ sâu sắc hơn giữa sự gắn kết xã hội và tỷ lệ tự tử (lý thuyết của Durkheim).

Một khi nhà nghiên cứu có thể vạch trần các mối quan hệ và quy trình làm nền tảng cho những phát hiện cụ thể của mình, anh ta có thể thiết lập các mối quan hệ trừu tượng giữa những phát hiện của mình và nhiều người khác.

Về bản chất, công việc của nhà nghiên cứu vượt xa việc thu thập và phân tích dữ liệu. Nhiệm vụ của anh mở rộng để diễn giải những phát hiện của nghiên cứu của mình. Thông qua giải thích, nhà nghiên cứu có thể hiểu được ý nghĩa thực sự của những phát hiện của mình, tức là anh ta có thể đánh giá cao tại sao những phát hiện đó là những gì họ đang có.

Như đã nêu trước đó, giải thích là tìm kiếm ý nghĩa rộng hơn và trừu tượng hơn của các kết quả nghiên cứu. Tìm kiếm này liên quan đến việc xem các kết quả nghiên cứu dưới ánh sáng của kiến thức đã được thiết lập khác, một lý thuyết hoặc một nguyên tắc. Tìm kiếm này có hai khía cạnh chính.

Khía cạnh đầu tiên liên quan đến nỗ lực thiết lập tính liên tục trong nghiên cứu thông qua việc liên kết các kết quả của một nghiên cứu nhất định với các nghiên cứu khác. Thông qua giải thích, nhà nghiên cứu có thể làm sáng tỏ hoặc hiểu được nguyên tắc trừu tượng bên dưới các quan sát thực nghiệm cụ thể.

Mẫu số chung trừu tượng này đã được phát hiện, nhà nghiên cứu có thể dễ dàng tiến hành liên kết các phát hiện của mình với các nghiên cứu khác được thực hiện trong các môi trường khác nhau, đa dạng về các vấn đề chi tiết nhưng phản ánh cùng một nguyên tắc trừu tượng ở cấp độ phát hiện.

Không cần phải nói rằng các nhà nghiên cứu có thể trên cơ sở công nhận nguyên lý lý thuyết trừu tượng dựa trên phát hiện của mình, đưa ra những dự đoán khác nhau về thế giới cụ thể của các sự kiện dường như không liên quan đến lĩnh vực phát hiện của ông. Do đó, các yêu cầu mới có thể được kích hoạt để kiểm tra dự đoán và dễ hiểu, các nghiên cứu như vậy sẽ có mối quan hệ với nghiên cứu ban đầu của nhà nghiên cứu.

Theo một nghĩa khác, giải thích nhất thiết phải tham gia vào quá trình chuyển đổi từ nghiên cứu thăm dò sang nghiên cứu thực nghiệm. Việc giải thích những phát hiện của loại nghiên cứu trước đây thường dẫn đến những giả thuyết cho cái sau.

Vì, một nghiên cứu khám phá không có giả thuyết để bắt đầu, nên những phát hiện hoặc kết luận của một nghiên cứu như vậy phải được giải thích theo cách giải thích 'hậu thực tế' thường là một trò chơi nguy hiểm đầy ẩn ý nguy hiểm. Giải thích như vậy liên quan đến việc tìm kiếm một bố già trong bản chất của một số lý thuyết hoặc nguyên tắc sẽ áp dụng (nghĩa là giải thích) những phát hiện của nghiên cứu.

Nhiệm vụ này thường trở thành một bài tập về phía nhà nghiên cứu để biện minh cho phát hiện của mình bằng cách xác định một số lý thuyết phù hợp để phù hợp với phát hiện của mình. Kết quả là khá thường xuyên kết luận mâu thuẫn có thể tìm thấy 'bố già' của họ trong các lý thuyết đa dạng.

Khía cạnh này của việc giải thích sau thực tế, bao gồm những nỗ lực hợp lý hóa các kết quả nghiên cứu, nên được ghi nhớ rõ ràng khi tiến hành nó. Tuy nhiên, trong những dịp, không có sự thay thế nào khác.

Thứ hai, giải thích dẫn đến việc thiết lập các khái niệm giải thích. Như đã được chỉ ra, việc giải thích các phát hiện liên quan đến nỗ lực giải thích tại sao các quan sát hoặc phát hiện là, chúng là gì. Trong việc hoàn thành nhiệm vụ này, lý thuyết đảm nhận tầm quan trọng trung tâm.

Nó là một chất nhạy cảm và một hướng dẫn cho các yếu tố và quy trình cơ bản (cơ sở giải thích) bên dưới các phát hiện. Bên dưới những quan sát của nhà nghiên cứu trong quá trình nghiên cứu, nằm ở một tập hợp các yếu tố và quy trình có thể giải thích những quan sát của ông về thế giới thực nghiệm. Giải thích lý thuyết phát hiện ra các yếu tố này.

Nhiệm vụ của nhà nghiên cứu là giải thích các mối quan hệ mà anh ta đã quan sát được trong quá trình nghiên cứu, bằng cách đưa ra các quy trình cơ bản giúp anh ta hiểu sâu hơn về các mối quan hệ này và chỉ ra vai trò của các yếu tố cơ bản nhất định hoạt động trong lĩnh vực nghiên cứu của anh ta.

Do đó, giải thích phục vụ một mục đích gấp đôi. Đầu tiên, nó cung cấp cho sự hiểu biết về các yếu tố chung dường như giải thích những gì đã được quan sát trong quá trình nghiên cứu và thứ hai, nó cung cấp một quan niệm lý thuyết có thể lần lượt là một hướng dẫn cho nghiên cứu tiếp theo.

Theo cách này, khoa học đã giải phóng tích lũy thành công hơn các quá trình cơ bản, hình thành nên một phần của thế giới thực nghiệm mà một nhà nghiên cứu quan tâm.

Giải thích đan xen chặt chẽ với phân tích đến mức nó nên được quan niệm đúng đắn hơn như là một khía cạnh đặc biệt của phân tích hơn là một hoạt động riêng biệt hoặc riêng biệt. Để kết thúc, chúng tôi muốn trích dẫn Giáo sư C. Wright Mills, người đã tuyên bố chính bản chất của tất cả những gì liên quan đến phân tích (liên quan đến giải thích) dữ liệu.

Nói, Miller, bạn sẽ khám phá và mô tả, thiết lập các loại để đặt hàng những gì bạn đã tìm ra, tập trung và tổ chức kinh nghiệm bằng cách phân biệt các mục theo tên. Tìm kiếm theo thứ tự này sẽ khiến bạn tìm kiếm các mô hình và xu hướng và tìm các mối quan hệ có thể là điển hình và nhân quả. Bạn sẽ tìm kiếm trong thời gian ngắn, với ý nghĩa của những gì bạn đã gặp hoặc những gì có thể được hiểu là một mã thông báo hữu hình của một cái gì đó có vẻ liên quan đến bất cứ điều gì bạn đang cố gắng hiểu; bạn sẽ cắt giảm nó xuống các yếu tố cần thiết; sau đó cẩn thận và có hệ thống, bạn sẽ liên kết những thứ này với nhau để tạo thành một mô hình làm việc

Tuy nhiên, trong số tất cả các chi tiết, bạn sẽ tìm kiếm các chỉ số có thể chỉ ra sự trôi dạt chính, đến các hình thức và xu hướng cơ bản của phạm vi xã hội trong thời kỳ cụ thể của nó. Sau khi một phần của nghiên cứu bị chấm dứt, tuyên bố điều đó đặt ra một loạt các câu hỏi và vấn đề mới có thể được thực hiện.

Một số câu hỏi mới tạo thành nền tảng cho các chủ trương nghiên cứu mới và xây dựng các lý thuyết mới sẽ sửa đổi hoặc thay thế những lý thuyết cũ. Đây thực sự là những gì nghiên cứu có nghĩa. Nó phục vụ để mở ra những con đường mới và rộng hơn cho cuộc phiêu lưu trí tuệ và mô phỏng cuộc tìm kiếm thêm kiến thức cũng như sự khôn ngoan hơn trong việc sử dụng nó.