Các xét nghiệm không tham số: Khái niệm, biện pháp phòng ngừa và lợi thế

Sau khi đọc bài viết này, bạn sẽ tìm hiểu về: - 1. Khái niệm về các thử nghiệm không tham số 2. Giả định về các thử nghiệm không tham số 3. Thận trọng 4. Một số thử nghiệm không tham số 5. Ưu điểm 6. Nhược điểm.

Khái niệm về các xét nghiệm không tham số:

Gần đây, chúng ta đã thấy sự phát triển của một số lượng lớn các kỹ thuật suy luận không đưa ra nhiều giả định nghiêm ngặt hoặc nghiêm ngặt về dân số mà chúng ta đã lấy mẫu dữ liệu. Những kỹ thuật phân phối miễn phí hoặc không tham số này dẫn đến kết luận đòi hỏi ít bằng cấp hơn.

Khi đã sử dụng một trong số chúng, chúng ta có thể nói rằng, bất kể hình dạng của dân số, chúng ta có thể kết luận rằng.

Hai tên thay thế thường được đưa ra cho các thử nghiệm này là:

Phân phối miễn phí:

Các thử nghiệm không tham số là loại phân phối miễn phí của hoàng tử. Họ không cho rằng điểm số được phân tích được rút ra từ một dân số được phân phối theo một cách nhất định, ví dụ, từ một dân số phân phối bình thường.

Khi thực hiện các thử nghiệm về tầm quan trọng của sự khác biệt giữa hai phương tiện (ví dụ về CR hoặc t chẳng hạn), chúng tôi giả định rằng điểm số dựa trên số liệu thống kê của chúng tôi thường được phân phối trong dân số. Điều gì thực sự làm nên theo giả thuyết null null là ước tính từ thống kê mẫu của chúng tôi xác suất của sự khác biệt thực sự giữa hai tham số.

Khi N khá nhỏ hoặc dữ liệu bị sai lệch, do đó, giả định về tính quy tắc là đáng nghi ngờ, các phương pháp tham số của Hồi giáo có giá trị đáng ngờ hoặc hoàn toàn không áp dụng được. Những gì chúng ta cần trong những trường hợp như vậy là các kỹ thuật sẽ cho phép chúng ta so sánh các mẫu và đưa ra các kết luận hoặc kiểm tra có ý nghĩa mà không cần phải đưa ra sự bình thường trong dân số.

Các phương pháp như vậy được gọi là không tham số hoặc phân phối miễn phí. Ví dụ, phép thử chi ² vuông X ² là một kỹ thuật không tham số. Tầm quan trọng của X ² chỉ phụ thuộc vào mức độ tự do trong bảng; không cần giả định về hình thức phân phối cho các biến được phân loại thành các loại của bảng X ² .

Hệ số tương quan chênh lệch thứ hạng (rho) cũng là một kỹ thuật không tham số. Khi p được tính từ các điểm được xếp theo thứ tự công đức, phân phối mà điểm số được thực hiện có thể bị sai lệch và N gần như luôn luôn nhỏ.

Kiểm tra xếp hạng:

Ngoài ra, nhiều trong số các bài kiểm tra này được xác định là các bài kiểm tra xếp hạng của Cameron, và tiêu đề này cho thấy giá trị chính khác của chúng: các kỹ thuật không tham số có thể được sử dụng với điểm số không chính xác theo bất kỳ ý nghĩa số nào, nhưng thực tế chỉ là xếp hạng.

Giả định của các xét nghiệm không tham số:

Một thử nghiệm thống kê không tham số dựa trên một mô hình chỉ xác định các điều kiện rất chung và không liên quan đến hình thức phân phối cụ thể mà từ đó mẫu được rút ra.

Một số giả định nhất định có liên quan đến hầu hết các thử nghiệm thống kê phi tham số, cụ thể là:

1. Rằng các quan sát là độc lập;

2. Biến đang nghiên cứu có tính liên tục cơ bản;

3. Các thủ tục không tham số kẻo giả thuyết khác nhau về dân số so với các thủ tục tham số;

4. Không giống như các thử nghiệm tham số, có những thử nghiệm không tham số có thể được áp dụng phù hợp với dữ liệu được đo theo thang đo thứ tự và các thử nghiệm khác đối với dữ liệu theo thang đo danh nghĩa hoặc phân loại.

Các biện pháp phòng ngừa trong việc sử dụng các xét nghiệm không tham số:

Trong việc sử dụng các bài kiểm tra không tham số, học sinh nên thận trọng trước các sai sót sau:

1. Khi các phép đo tính theo tỷ lệ khoảng và tỷ lệ, việc chuyển đổi các phép đo trên thang đo danh nghĩa hoặc thứ tự sẽ dẫn đến việc mất nhiều thông tin. Do đó, càng nhiều thử nghiệm tham số càng tốt nên được áp dụng trong các tình huống như vậy. Khi sử dụng một phương pháp không tham số làm lối tắt, chúng tôi đang vứt bỏ đô la để tiết kiệm xu.

2. Trong các tình huống mà các giả định làm cơ sở cho một thử nghiệm tham số được thỏa mãn và cả hai thử nghiệm tham số và không tham số đều có thể được áp dụng, nên lựa chọn trong thử nghiệm tham số vì hầu hết các thử nghiệm tham số có sức mạnh lớn hơn trong các tình huống như vậy.

3. Các thử nghiệm không tham số, không nghi ngờ gì, cung cấp một phương tiện để tránh giả định về tính quy tắc của phân phối. Nhưng những phương pháp này không làm gì để tránh những giả định về sự độc lập đối với tính đồng nhất ở bất cứ nơi nào có thể áp dụng.

4. Nhà khoa học hành vi nên chỉ định giả thuyết khống, giả thuyết thay thế, kiểm tra thống kê, phân phối mẫu và mức độ quan trọng trước khi thu thập dữ liệu. Săn lùng xung quanh để kiểm tra thống kê sau khi dữ liệu được thu thập có xu hướng tối đa hóa ảnh hưởng của bất kỳ sự khác biệt cơ hội nào có lợi cho thử nghiệm này hơn thử nghiệm khác.

Do đó, khả năng bác bỏ giả thuyết khống khi nó đúng (lỗi loại I) được tăng lên rất nhiều. Tuy nhiên, sự thận trọng này được áp dụng như nhau đối với các xét nghiệm tham số cũng như không tham số.

5. Chúng tôi không có vấn đề chọn các bài kiểm tra thống kê cho các biến phân loại. Các xét nghiệm không tham số một mình là phù hợp cho dữ liệu liệt kê.

6. Các thử nghiệm F và t thường được coi là thử nghiệm mạnh mẽ vì việc vi phạm các giả định cơ bản không làm mất hiệu lực các suy luận.

Đó là thông lệ để biện minh cho việc sử dụng một bài kiểm tra lý thuyết bình thường trong một tình huống mà tính bình thường không thể được đảm bảo, bằng cách lập luận rằng nó mạnh mẽ dưới sự phi quy tắc.

Một số xét nghiệm không tham số:

Chúng ta sẽ thảo luận về một vài thử nghiệm không tham số phổ biến.

1. Kiểm tra dấu hiệu:

Kiểm tra dấu hiệu là đơn giản nhất trong tất cả các thống kê miễn phí phân phối và mang một mức độ áp dụng chung rất cao. Nó được áp dụng trong các tình huống trong đó tỷ lệ quan trọng, t, thử nghiệm cho các mẫu tương quan có thể được sử dụng vì các giả định về tính quy tắc và tính đồng nhất không được đáp ứng.

Các sinh viên nhận thức được thực tế rằng một số điều kiện nhất định trong cài đặt thí nghiệm giới thiệu yếu tố quan hệ giữa hai bộ dữ liệu.

Những điều kiện này thường là một tình huống tiền kiểm tra, hậu kiểm; một tình huống kiểm tra và kiểm tra lại; kiểm tra một nhóm đối tượng trong hai bài kiểm tra; hình thành 'các nhóm phù hợp' bằng cách ghép nối một số biến không liên quan không phải là đối tượng điều tra, nhưng có thể ảnh hưởng đến các quan sát.

Trong kiểm tra ký hiệu, chúng tôi kiểm tra tầm quan trọng của dấu hiệu của sự khác biệt (dưới dạng cộng hoặc trừ). Thử nghiệm này được áp dụng khi N nhỏ hơn 25.

Ví dụ sau đây sẽ cho chúng tôi rõ về kiểm tra ký hiệu:

Thí dụ:

Điểm số thường là các môn học trong hai điều kiện khác nhau, A và B được đưa ra dưới đây. Áp dụng kiểm tra dấu hiệu và kiểm tra giả thuyết rằng A vượt trội hơn B.

Không tính 0 (không), chúng ta có chín điểm khác biệt trong đó bảy điểm cộng.

Bây giờ chúng ta phải mở rộng nhị thức, (p + q) ⁹

(p + q) ⁹ = p ⁹ + 9p ⁸ q + 36p ⁷ q ² + 84p ⁶ q ³ + 126 p ⁵ q ⁴ + 126 p ⁴ q ⁵ + 84p ³ q ⁶ + 36 p ² q ⁷ + 9 pq ⁸ + q ⁹ .

Tổng số kết hợp là 2 ⁹ hoặc 512. Thêm 3 thuật ngữ đầu tiên (cụ thể là p ⁹ + 9p ⁸ q + 36 p ⁷ q ² ), chúng tôi có tổng cộng 46 kết hợp (nghĩa là 1 trong 9, 9 của 8 và 36 trên 7) có chứa 7 dấu cộng trở lên.

Khoảng 46 lần trong 512 thử nghiệm, 7 hoặc nhiều dấu cộng trong số 9 sẽ xảy ra khi số dấu + trung bình theo giả thuyết null là 4, 5. Do đó, xác suất của 7 dấu hiệu trở lên + là 46/512 hoặc .09 và rõ ràng là không đáng kể.

Đây là thử nghiệm một đầu, vì giả thuyết của chúng tôi nói rằng A tốt hơn B. Nếu giả thuyết ban đầu là A và B khác nhau mà không xác định cái nào tốt hơn, chúng tôi sẽ có thử nghiệm 2 đuôi mà P = .18.

Các bảng có sẵn trong đó đưa ra số lượng các dấu hiệu cần thiết cho mức độ quan trọng ở các mức độ khác nhau, khi N thay đổi kích thước. Khi số lượng cặp lớn tới 20, đường cong thông thường có thể được sử dụng như một xấp xỉ với khai triển nhị thức hoặc thử nghiệm x ² được áp dụng.

2. Kiểm tra trung bình:

Thử nghiệm trung vị được sử dụng để so sánh hiệu suất của hai nhóm độc lập, ví dụ như nhóm thử nghiệm và nhóm kiểm soát. Đầu tiên, hai nhóm được ném với nhau và tính trung bình chung được tính toán.

Nếu hai nhóm được rút ngẫu nhiên từ cùng một dân số, 1/2 số điểm trong mỗi nhóm nên nằm trên và 1/2 dưới điểm trung bình chung. Để kiểm tra giả thuyết null này, chúng ta cần vẽ một bảng 2 x 2 và tính x ² .

Phương pháp được hiển thị trong ví dụ sau:

Thí dụ:

Một nhà tâm lý học lâm sàng muốn điều tra tác dụng của thuốc an thần khi bị run tay. Mười bốn bệnh nhân tâm thần được cho dùng thuốc, và 18 bệnh nhân khác được cho liều vô hại. Nhóm đầu tiên là thử nghiệm, nhóm thứ hai là nhóm kiểm soát.

Có phải thuốc tăng tính ổn định như thể hiện bởi điểm số thấp hơn trong nhóm thử nghiệm? Vì chúng tôi chỉ quan tâm nếu thuốc làm giảm run, đây là thử nghiệm một đầu.

Thử nghiệm trung vị áp dụng cho các nhóm thử nghiệm và kiểm soát. Dấu cộng cho thấy điểm trên trung vị chung, trừ dấu điểm dưới điểm trung bình chung.

N = 14 N = 18

Trung bình chung = 49, 5

Trung bình chung là 49, 5. Trong nhóm thử nghiệm, 4 điểm ở trên và 10 dưới trung bình chung thay vì 7 ở trên và 7 dưới đây được dự đoán là tình cờ. Trong nhóm kiểm soát, 12 điểm ở trên và 6 dưới trung bình chung thay vì 9 điểm dự kiến trong mỗi thể loại.

Các tần số này được nhập vào bảng sau và X ² được tính theo công thức (được nêu dưới đây) với hiệu chỉnh liên tục:

AX ² c 3, 17 với 1 bậc tự do mang lại ap nằm ở 0, 08 khoảng giữa 0, 05 đến 0, 10. Chúng tôi muốn biết liệu trung vị của nhóm thử nghiệm có thấp hơn đáng kể so với kiểm soát hay không (do đó cho thấy sự ổn định hơn và ít run hơn).

Đối với giả thuyết này, thử nghiệm một đầu, p / 2, xấp xỉ 0, 04 và X ² c có ý nghĩa ở mức 0, 5. Nếu giả thuyết của chúng tôi là hai nhóm khác nhau mà không chỉ định hướng, chúng tôi sẽ có một thử nghiệm hai đuôi và X ² sẽ được đánh dấu là không đáng kể.

Kết luận của chúng tôi, được đưa ra một cách ngập ngừng, là thuốc tạo ra một số giảm run. Nhưng do các mẫu nhỏ và thiếu một phát hiện có ý nghĩa cao, nhà tâm lý học lâm sàng gần như chắc chắn sẽ lặp lại thí nghiệm - có lẽ nhiều lần.

X ² thường được áp dụng trong thử nghiệm trung bình. Tuy nhiên, khi N ₁ và N ₂ nhỏ (ví dụ nhỏ hơn khoảng 10) và thử nghiệm X ² không chính xác và nên sử dụng phương pháp tính toán chính xác.

Ưu điểm của xét nghiệm không tham số:

1. Nếu cỡ mẫu rất nhỏ, có thể không có cách nào khác để sử dụng phép thử thống kê không tham số trừ khi bản chất của phân bố dân số được biết chính xác.

2. Các thử nghiệm không tham số thường đưa ra ít giả định hơn về dữ liệu và có thể phù hợp hơn với một tình huống cụ thể. Ngoài ra, giả thuyết được kiểm tra bằng thử nghiệm không tham số có thể phù hợp hơn cho nghiên cứu nghiên cứu.

3. Các kiểm tra thống kê không tham số có sẵn để phân tích dữ liệu vốn có trong các cấp bậc cũng như dữ liệu có điểm số dường như bằng số có sức mạnh của các cấp bậc. Đó là, nhà nghiên cứu chỉ có thể nói về đối tượng của mình rằng người này có ít nhiều đặc điểm hơn người khác, mà không thể nói được nhiều hay ít.

Ví dụ, khi nghiên cứu một biến như lo lắng, chúng ta có thể nói rằng đối tượng A lo lắng hơn đối tượng B mà không biết chính xác A lo lắng hơn bao nhiêu.

Nếu dữ liệu vốn đã được xếp hạng hoặc thậm chí nếu chúng chỉ có thể được phân loại thành cộng hoặc trừ (nhiều hơn hoặc ít hơn, tốt hơn hoặc xấu hơn), chúng có thể được xử lý bằng các phương pháp không tham số, trong khi chúng không thể được xử lý bằng các phương pháp tham số trừ khi bấp bênh và, có lẽ, các giả định không thực tế được thực hiện về các phân phối cơ bản.

4. Các phương pháp không tham số có sẵn để xử lý dữ liệu đơn giản là phân loại hoặc phân loại, nghĩa là được đo theo thang đo danh nghĩa. Không có kỹ thuật tham số áp dụng cho dữ liệu đó.

5. Có các xét nghiệm thống kê phi tham số phù hợp để xử lý các mẫu được tạo thành từ các quan sát từ một số quần thể khác nhau. Các thử nghiệm tham số thường không thể xử lý dữ liệu đó mà không yêu cầu chúng tôi đưa ra các giả định dường như không thực tế hoặc yêu cầu tính toán rườm rà.

6. Các xét nghiệm thống kê phi tham số thường dễ học và dễ áp dụng hơn nhiều so với các xét nghiệm tham số. Ngoài ra, việc giải thích của họ thường trực tiếp hơn so với việc giải thích các xét nghiệm tham số.

Nhược điểm của các xét nghiệm không tham số:

1. Trên thực tế, nếu tất cả các giả định của phương pháp thống kê tham số được đáp ứng trong dữ liệu và giả thuyết nghiên cứu có thể được kiểm tra bằng một thử nghiệm tham số, thì các thử nghiệm thống kê không tham số là lãng phí.

2. Mức độ lãng phí được thể hiện bằng hiệu suất năng lượng của thử nghiệm không tham số.

3. Một phản đối khác đối với các thử nghiệm thống kê không tham số là chúng không có hệ thống, trong khi các thử nghiệm thống kê tham số đã được hệ thống hóa, và các thử nghiệm khác nhau chỉ đơn giản là các biến thể của một chủ đề trung tâm.

4. Một phản đối khác đối với các xét nghiệm thống kê không tham số phải được thực hiện với sự thuận tiện. Các bảng cần thiết để thực hiện các thử nghiệm không tham số được phân tán rộng rãi và xuất hiện trong các định dạng khác nhau.