Lỗi tiêu chuẩn của giá trị trung bình
Sau khi đọc bài viết này, bạn sẽ tìm hiểu về tiêu chuẩn của giá trị trung bình.
Suy luận thống kê cũng giúp chúng tôi kiểm tra giả thuyết rằng thống kê dựa trên mẫu không khác biệt đáng kể so với tham số dân số và sự khác biệt nếu có bất kỳ lưu ý nào chỉ là do biến đổi cơ hội .
Lỗi tiêu chuẩn của giá trị trung bình (SE M hoặc M )
Lỗi tiêu chuẩn của giá trị trung bình (SE M ) là khá quan trọng để kiểm tra tính đại diện hoặc độ tin cậy hoặc tầm quan trọng của giá trị trung bình.
Giả sử rằng chúng tôi đã tính được điểm trung bình của 200 nam sinh lớp 10 của Delhi trong Bài kiểm tra năng lực số là 40. Do đó, 40 là trung bình của chỉ một mẫu được rút ra từ dân số (tất cả các nam sinh đọc trong lớp X ở Delhi).
Chúng tôi cũng có thể vẽ các mẫu ngẫu nhiên khác nhau của 200 chàng trai trong dân số. Giả sử rằng chúng tôi chọn ngẫu nhiên 100 mẫu khác nhau, mỗi mẫu bao gồm 200 bé trai từ cùng một quần thể và tính giá trị trung bình của từng mẫu.
Mặc dù 'n' là 200 trong mỗi trường hợp, 200 chàng trai được chọn ngẫu nhiên để tạo thành các mẫu khác nhau không giống nhau và do sự biến động trong lấy mẫu, chúng tôi sẽ nhận được 100 giá trị trung bình từ 100 mẫu khác nhau này.
Các giá trị trung bình này sẽ có xu hướng khác nhau và chúng sẽ tạo thành một chuỗi. Các giá trị này tạo thành phân phối mẫu của phương tiện. Có thể diễn đạt một cách toán học rằng các phương tiện mẫu này được phân phối bình thường.
100 giá trị trung bình (trong ví dụ của chúng tôi) sẽ rơi vào phân phối bình thường xung quanh M pop, M pop là giá trị trung bình của phân phối mẫu của phương tiện. Độ lệch chuẩn của 100 phương tiện mẫu này được gọi là SE M hoặc Sai số chuẩn của giá trị trung bình sẽ bằng độ lệch chuẩn của dân số chia cho căn bậc hai của (cỡ mẫu).
SE M cho thấy sự lan truyền của mẫu có nghĩa là xung quanh M pop . Do đó SE M là thước đo độ biến thiên của phương tiện mẫu. Nó là thước đo độ phân kỳ của phương tiện mẫu từ M pop . SE M cũng được viết là σ M.
Sai số chuẩn của giá trị trung bình (SE M hoặc M ) được tính bằng cách sử dụng công thức (đối với các mẫu lớn)
(A) Tính toán SE M trong các mẫu lớn :
Trong đó σ = độ lệch chuẩn của dân số và
n = số trường hợp có trong mẫu
(Vì chúng ta hiếm khi có thể có SD của dân số, vì chúng ta sử dụng giá trị SD của phương tiện mẫu).
Mức độ tin cậy:
Hai khoảng tin cậy tức là 95% và 99% được sử dụng chung. RA Fisher đặt tên cho các giới hạn của khoảng tin cậy có chứa tham số là giới hạn ủy thác của Hồi giáo và đặt tên cho độ tin cậy được đặt trong khoảng đó là xác suất ủy thác.
(a) 95% Khoảng tin cậy:
Nhắc đến bảng diện tích theo đường cong thông thường, chúng ta thấy rằng 95% trường hợp nằm giữa M ± 1, 96 SE M. Rằng chúng tôi tự tin hoặc đúng 95% khi nói M pop sẽ nằm trong khoảng M + 1.96 SE M và M + 1.96 SE M và chúng tôi sai 5% khi nói rằng M pop sẽ nằm ngoài khoảng này.
Nói cách khác, xác suất của M pop nằm trong phạm vi M ± 1, 96 SE M là 95% (hoặc 0, 95) và xác suất M pop nằm ngoài phạm vi là 5% (hoặc 0, 05). Giá trị, 1, 96 là giá trị tới hạn ở mức 0, 05 có ý nghĩa.
(b) 99% khoảng tin cậy:
Nhắc đến bảng diện tích theo đường cong thông thường, chúng ta thấy rằng 99% trường hợp nằm giữa M ± 2, 58 SE M. Rằng chúng tôi tự tin hoặc đúng 99% khi nói M pop sẽ nằm trong khoảng M - 2.58 SE M và M + 2.58 SE M và chúng tôi sai 1% khi nói rằng M pop sẽ nằm ngoài khoảng này.
Nói cách khác, xác suất của M pop nằm trong phạm vi M ± 2.58 SE M là 99% (hoặc 0, 99) và xác suất M pop nằm ngoài phạm vi là 1% (hoặc 0, 01). Giá trị, 2, 58 là giá trị tới hạn ở mức ý nghĩa 0, 01.
Ở đây chúng tôi thấy rằng mức độ quan trọng có liên quan nghịch với mức độ chính xác. Trong 05 mức ý nghĩa, chúng tôi sẽ chính xác trong 95% trường hợp và ở mức 0, 01 mức ý nghĩa, chúng tôi sẽ chính xác trong 99% mức giảm.
Bảng được nêu dưới đây sẽ đi trước bạn hơn nữa:
Ví dụ 1:
Giá trị trung bình và SD của 225 nam sinh lớp XII của Delhi trong bài kiểm tra Khả năng số lần lượt là 48 và 6. Điều này có nghĩa như thế nào đại diện cho M pop hoặc ước tính M pop . (n = 225, = 6, Trung bình = 48]
Bằng cách tham khảo bảng phân phối bình thường (Bảng A), chúng tôi thấy rằng hầu hết tất cả các trường hợp (99, 7) nằm trong khoảng ± 3. Trong trường hợp ví dụ của chúng tôi, tất cả các phương tiện mẫu sẽ nằm giữa M pop + 3σ m và M pop - 3σ M. Vì vậy, bất kỳ giá trị trung bình mẫu nào cũng sẽ thấp hơn 3σ m so với M pop trên 3 M so với M pop .
Do đó, nếu chúng ta biết giá trị của σ M, chúng ta có thể suy ra M pop từ mẫu trung bình của chúng ta. Ở đây 4 là độ lệch chuẩn của phân phối phương tiện mẫu mà giá trị trung bình của chúng tôi là một. Tất cả các mẫu có nghĩa là thường được phân phối xung quanh M pop sẽ nằm giữa M pop + 3 SE M và M pop - 3 SE M.
3 SE M = 3 x .4 = 1, 2
Mặc dù chúng tôi không biết giá trị chính xác của M pop nhưng ít nhất chúng tôi có thể nói với sự tự tin rằng M pop nằm ở giữa
(48 -1.2) và (48 + 1.2) hoặc 46.8 → 49.2
Từ Bảng A, chúng tôi thấy rằng 95% mức giảm nằm trong khoảng từ 1, 96 96. Trong trường hợp ví dụ về khoảng tin cậy 95% của chúng tôi cho M pop dao động từ M - 1.96 SE M đến M + 1.96 SE M.
Bây giờ, 1, 96 SE M = 1, 96 x .4 = .78
. . . M- 1, 96 SE M = 48 - .78 = 47, 22 và M + 1, 96 SE M = 48 + .78 = 48, 78
. . . Khoảng tin cậy 95% nằm trong khoảng từ 47, 22 đến 48, 78. Khoảng tin cậy 99% cho M pop dao động từ M - 2.58 SE M đến M + 2.58 SE M.
Bây giờ 2, 58 SE M = 2, 58 X .4 = 1, 03
. . . M - 2, 58 SE M = 48 -1, 03 = 46, 97 và M + 2, 58 SE M = 48 + 1, 03 = 49, 03
. . . Khoảng tin cậy 99% cho M pop dao động từ 46, 97 đến 49, 03.
Ví dụ 2:
Giá trị trung bình và SD của 400 học sinh trong một bài kiểm tra được tìm thấy là 42 và 8. Bạn có thể ước tính Điểm trung bình của dân số ở cả khoảng tin cậy 99% và 95% không?
Dung dịch:
(i) Khoảng tin cậy 95% cho M pop dao động từ M - 1.96 SE M đến M + 1.96 SE M.
Bây giờ 1, 96 SE M = 1, 96 x .4 = .784
. . . M-1.96 SE M = 42-.784 = 41, 22
và M + 1, 96 SE M = 42 + .784 = 42, 78 (tối đa hai số thập phân).
Do đó, khoảng tin cậy 95% nằm trong khoảng từ 41, 22 đến 42, 78. Chúng tôi chính xác 95% rằng M pop nằm trong khoảng từ 41, 22 đến 42, 78.
(ii) khoảng tin cậy 99% cho M pop dao động từ M - 2.58 SE M đến M + 2.58 SE M
Bây giờ 2, 58 SE M = 2, 58 x 4 = 1, 03
. . . M - 2, 58 SE M = 42- 1, 03 = 40, 97
và M +2, 58 SE M = 42 + 1, 03 = 43, 03
Do đó, khoảng tin cậy 99% nằm trong khoảng từ 40, 97 đến 43, 03. Chúng tôi tự tin 99% rằng M pop nằm trong khoảng từ 40, 97 đến 43, 03.
Ví dụ 3:
Phương tiện và SD của một mẫu gồm 169 chàng trai trong bài kiểm tra Khả năng Số lần lượt là 50 và 6:
(i) Xác định khoảng 95% cho trung bình dân số và giải thích nó.
(ii) Xác định lỗi lấy mẫu chấp nhận được ở mức ý nghĩa 0, 05 và 0, 01.
(iii) Xác định khoảng tin cậy 99% cho M pop .
Dung dịch:
M = 50
(i) Khoảng tin cậy 95% cho Mp 0p nằm trong khoảng từ M - 1.96 SE M đến M + 1.96 SE M.
Bây giờ 1, 96 SE m = 1, 96 x .46 = .90
Do đó M-1.96 SE M = 50-.90 = 49.10
và M + 1, 96 SE M = 50 +, 90 = 50, 90
. . . Khoảng tin cậy 95% cho M pop dao động từ 49, 10 đến 50, 90. Từ các phương tiện mẫu của 50, chúng tôi ước tính M pop có giá trị cố định trong khoảng 49, 10 đến 50, 90 và nói như vậy chúng tôi tự tin 95%.
Nói cách khác, trung bình mẫu của chúng tôi là 50 sẽ không bỏ lỡ M pop hơn 0, 90 và điều này sẽ đúng với 95 trường hợp trong 100. Ngoài ra, chỉ trong 5 trường hợp trong 100 trường hợp trung bình mẫu của chúng tôi là 50 sẽ bỏ lỡ M pop hơn 0, 90.
(ii) Giá trị tới hạn ở mức 0, 05 có ý nghĩa = 1, 96
Giá trị tới hạn ở mức 0, 01 mức ý nghĩa = 2, 58
Lỗi lấy mẫu của người dùng = Giá trị tới hạn
Do đó, sai số lấy mẫu ở mức ý nghĩa 0, 05 là 1, 96 SE M và ở mức 0, 01 mức ý nghĩa là 2, 58 SE M
Lỗi lấy mẫu chấp nhận được ở mức 0, 05 = 1, 96 SE M = 1, 96 x .46 = .90
Lỗi lấy mẫu cho phép ở mức 0, 01 = 2, 58 SE M = 2, 58 X .46 = 1, 19
(iii) Khoảng tin cậy 99% nằm trong khoảng từ M - 2, 58 SE M đến M + 2, 58 SE M
Bây giờ 2, 58 SE M = 2, 58 X .46 = 1, 19
Do đó M-2.58 SE M = 50- 1.19 = 48.81
và M +2, 58 SE M = 50 + 1, 19 = 51, 19
Khoảng tin cậy 99% nằm trong khoảng từ 48, 81 đến 51, 19.
Ví dụ 4:
Đối với một nhóm 500 binh sĩ nhất định, điểm AGCT trung bình là 95, 00 và SD là 25.
(ii) Xác định khoảng tin cậy 0, 99 cho giá trị trung bình thực.
(ii) Không chắc là giá trị trung bình thực lớn hơn giá trị nào?
Dung dịch:
(i) Khoảng tin cậy 99% nằm trong khoảng từ M - 2, 58 SE M đến M + 2, 58 SE M.
Bây giờ 2, 58 SE M = 2, 58 x 1, 12 = 2, 89
Do đó M-2.58 SE M = 95.0-2, 89 = 92, 11
và M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89
. . . Khoảng tin cậy 99% nằm trong khoảng từ 92, 11 đến 97, 89.
Từ phương tiện mẫu 95.0 của chúng tôi, chúng tôi ước tính giá trị trung bình thực là một số giá trị cố định trong khoảng từ 92, 11 đến 97, 89 và nói như vậy, chúng tôi tự tin 99%.
(ii) Giá trị trung bình mẫu 95.0 của chúng tôi sẽ không bỏ lỡ giá trị trung bình thực hơn 2, 89, tức là giá trị thực không lớn hơn 97, 89.
(B) Tính toán SE M trong mẫu nhỏ:
Người ta thường gọi bất kỳ mẫu nào lớn hơn 30 là mẫu lớn. Khi N lớn, nó không đáng để thực hiện chỉnh sửa. Nhưng khi N là một số nhỏ (ít hơn 30), thì nên sử dụng (N - 1) và điều bắt buộc khi N khá nhỏ, chưa đến 10.
Học sinh phải nhớ (i) rằng về mặt lý thuyết (N - 1) phải luôn luôn được sử dụng khi SD là ước tính của dân số a; và rằng (ii) sự khác biệt giữa các số liệu thống kê mẫu lớn của Cameron và các số liệu thống kê mẫu nhỏ của Cameron và về số điểm cắt N = 30 là tùy ý và một phần là vấn đề thuận tiện.
Khi N nhỏ hơn khoảng 30, công thức cho σ M hoặc SE M nên đọc:
Ví dụ 5:
Sau năm học sinh có điểm an toàn trong một bài kiểm tra:
Xác định các giới hạn của giới hạn tin cậy 95% cho trung bình dân số.
Điểm số là - 11, 13, 9, 12, 15:
Dung dịch:
M = 12
Ở đây df = n- 1 = 5-1 = 4
Tham chiếu Bảng D, với df = 4, giá trị t ở mức 0, 05 có ý nghĩa (nghĩa là mức tin cậy 95%) là 2, 78.
Khoảng tin cậy 95% xác định M ± 2, 78 SE M
2, 78 SE M = 2, 78 x 1, 0 = 2, 78
M - 2, 78 SE M = 12 - 2, 78 x1.0 = 9, 22 và
M + 2, 78 SE M = 12 + 2, 78 x1.0 = 14, 78
. . . Giới hạn của khoảng tin cậy 95% là 9, 22 và 14, 78.
Điều này có nghĩa là P = 0, 95 mà M pop nằm trong khoảng 9, 22 đến 14, 78.
Ví dụ 6:
Mười biện pháp thời gian phản ứng với ánh sáng được lấy từ một người quan sát thực tế. Giá trị trung bình là 175, 50 ms (mili giây) và S là 5, 82 ms. Xác định khoảng tin cậy 0, 95 cho M pop ; khoảng tin cậy 0, 99.
Dung dịch:
n = 10, S = 5, 82 ms, M = 175, 50 ms
Df (bậc tự do) có sẵn để xác định t là (n - 1) hoặc (10 - 1) = 9
(i) Xác định khoảng tin cậy 95% (hoặc 95):
Bước vào Bảng D với 9 df, chúng ta đọc rằng t = 2, 26 tại điểm 0, 05.
Khoảng tin cậy 95% cho M pop dao động từ M - 2.26 SE M đến M + 2.26 SE M.
Bây giờ 2, 26 SE M = 2, 26 x 1, 84 = 4, 16
Do đó M - 2, 26 SE M = 175, 50 -4, 16 = 171, 34
và M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66
. . . Khoảng tin cậy 95% cho M pop dao động từ 171, 34 đến 179, 66. P là 0, 95 mà M pop không nhỏ hơn 171, 34 cũng không lớn hơn 179, 66. Nếu chúng ta suy ra rằng M pop nằm trong khoảng này, qua một loạt các thử nghiệm dài, chúng ta sẽ đúng 95% thời gian và sai 5%.
(ii) Xác định khoảng tin cậy 99% (hoặc 0, 99):
Bước vào Bảng D với 9 df, chúng ta đọc rằng t = 3, 25 tại 0, 01 điểm. Khoảng tin cậy 99% cho M pop dao động từ M - 3.25 SE M đến M + 3.25 SE M.
Bây giờ 3, 25 SE M = 3, 25 x 1, 84 = 5, 98
Do đó M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52
và M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48
. . . Khoảng tin cậy 99% cho M pop dao động từ 169, 52 đến 181, 48.
P là 0, 99 mà M pop không nhỏ hơn 169, 52 cũng không lớn hơn 181, 48. Nếu chúng ta suy ra rằng M pop nằm trong khoảng này, qua một loạt các thử nghiệm dài, chúng ta sẽ đúng -99% thời gian và sai 1%.
Suy luận về các thống kê khác:
Vì tất cả các số liệu thống kê đều có phân phối mẫu và sai số chuẩn, tầm quan trọng của Trung bình, Độ lệch tứ phân vị, Độ lệch chuẩn, Tỷ lệ phần trăm và các thống kê khác có thể được hiểu như giá trị trung bình và chúng tôi có thể ước tính tham số.
(i) Lỗi tiêu chuẩn của trung vị (hoặc SE Mdn -):
Về mặt SD và Q, SE của trung vị cho các mẫu lớn có thể được tính thông qua các công thức sau:
trong đó σ = SD của mẫu, n = kích thước của mẫu và Q = Độ lệch tứ phân của mẫu.
Một ví dụ sẽ minh họa việc sử dụng và giải thích các công thức:
Ví dụ 7:
Trên thang điểm ngôn ngữ Trabue A, 801 cậu bé mười một tuổi đã lập kỷ lục sau:
Trung vị = 21, 40 và Q = 4, 90. Làm thế nào tốt trung bình này đại diện cho trung bình của dân số mà mẫu này được rút ra?
Dung dịch:
n = 801, MDN = 21, 40, Q = 4, 90.
Bằng cách áp dụng công thức thứ hai,
Do N lớn, phân phối lấy mẫu có thể được lấy là bình thường và khoảng tin cậy được tìm thấy từ dòng cuối cùng trong Bảng D. Khoảng tin cậy 0, 99 cho pop Mdn là 21, 40 ± 2, 58 x .32 hoặc 21, 40 ± 0, 83.
Chúng tôi có thể tự tin rằng trung vị của dân số không dưới 20, 57 cũng không quá 22, 23. Phạm vi hẹp này cho thấy mức độ tin cậy cao trong trung vị mẫu.
(ii) Lỗi tiêu chuẩn về độ lệch chuẩn (SE):
Lỗi tiêu chuẩn của độ lệch chuẩn, như SE M, được tìm thấy bằng cách tính toán độ phân kỳ có thể xảy ra của SD mẫu từ tham số của nó (SD dân số). Công thức cho SE là
Ví dụ 8:
n = 400, σ = 6
SD này đại diện cho SD của dân số từ đó mẫu được rút ra như thế nào?
Dung dịch:
Khi các mẫu lớn và được rút ngẫu nhiên từ quần thể của chúng, công thức trên có thể được áp dụng và diễn giải theo cách tương tự như SE M.
Vì N lớn, khoảng tin cậy 0, 99 cho pop SD có thể được lấy một cách an toàn ở các giới hạn ± 2, 58. Thay thế cho σ σ chúng ta có 6 ± 2, 58 x .21 tức là các giới hạn giữa (6 - .54) và (6 + .54) hoặc 5.46 và 6.54.
Nếu chúng ta giả sử rằng pop SD nằm giữa các giới hạn 5, 46 và 6, 54, chúng ta sẽ đúng 99% và sai 1%.
(iii) Lỗi tiêu chuẩn của độ lệch tứ phân vị (hoặc SE Q hoặc σ q ):
SE Q có thể được tìm thấy từ các công thức:
Ví dụ 9:
n = 801, Q = 4, 90
Làm thế nào tốt Q này đại diện cho độ lệch Quartile dân số?
Dung dịch:
Bằng cách áp dụng công thức
Khoảng tin cậy 0, 99 cho Q pop là từ 4, 90 ± 2, 58 x .203 tức là từ 4, 38 đến 5, 42. Phạm vi này cho thấy mẫu Q là một số liệu thống kê rất đáng tin cậy.
(iv) Lỗi tiêu chuẩn về tỷ lệ phần trăm (hoặc SE% hoặc%):
Đưa ra tỷ lệ phần trăm xuất hiện của một hành vi, câu hỏi thường được đặt ra là chúng ta có thể đặt bao nhiêu niềm tin vào con số. Làm thế nào đáng tin cậy một chỉ số là tỷ lệ phần trăm của chúng tôi về tỷ lệ hành vi mà chúng tôi quan tâm? Để trả lời câu hỏi này,
Chúng ta phải tính SE theo tỷ lệ phần trăm theo công thức:
trong đó
p = tỷ lệ xuất hiện của hành vi, q = (1 - p)
n = số trường hợp.
Ví dụ 10:
Trong một nghiên cứu về gian lận ở trẻ em tiểu học, 100 hoặc 25% trong số 400 trẻ em từ nhà có tình trạng kinh tế xã hội cao đã bị phát hiện gian lận trong các bài kiểm tra khác nhau. Làm thế nào tốt nó đại diện cho tỷ lệ phần trăm dân số?
Dung dịch:
p = 25% (tỷ lệ xuất hiện)
q = 75% (100% - 25%)
Khoảng tin cậy 99% cho tỷ lệ phần trăm dân số từ
25% ± 2, 58 x 2, 17%.
25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%
và 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%
Chúng ta có thể tin tưởng với 99% rằng trẻ em tiểu học có tình trạng kinh tế xã hội cao sẽ gian lận với ít nhất 19, 4% và sẽ không lớn hơn 30, 60%.
(v) Lỗi tiêu chuẩn của hệ số tương quan (SE r hoặc σ r ):
Công thức cổ điển cho SE của a- là
(SE của hệ số tương quan r khi N lớn)
Ví dụ 11:
n = 120, r = .60.
Các giới hạn của khoảng tin cậy 99% cho dân số r là gì
Dung dịch:
Khoảng tin cậy 99%
= r ± 2, 58 SE r = .60 ± 2.58 SE r
= .60 ± .15 hoặc .45 đến .75
Điều khoản thống kê quan trọng:
(i) Cấp độ:
0, 05:
Xác suất đi sai trong 5 mẫu trong số 100 mẫu.
.01:
Xác suất đi sai trong 1 mẫu trong số 100 mẫu.
(ii) Tự tin:
Ở mức 0, 05 mức ý nghĩa, người thí nghiệm có độ tin cậy 95% rằng dữ liệu phải đại diện cho dân số.
Ở mức 0, 01 mức ý nghĩa, người thí nghiệm có độ tin cậy 99% rằng thống kê mẫu phải đại diện cho dân số.
(iii) Mức độ quan trọng:
Trước khi kiểm tra giả thuyết, chúng tôi phải quyết định các tiêu chí mà chúng tôi muốn chấp nhận hoặc từ chối giả thuyết khống. Chúng tôi phải thiết lập mức độ quan trọng trước khi thử nghiệm. Hai mức ý nghĩa nói chung là sử dụng viz., 0, 05 và 0, 01 cấp.
(a) 0, 05 mức ý nghĩa:
Chúng tôi đọc từ Bảng A rằng 95% các trường hợp trong phân phối bình thường nằm trong giới hạn ± 1, 96 SE M. Nếu chúng tôi thực hiện các giới hạn được chỉ định bởi M ± 1.96 SE M, chúng tôi sẽ xác định khoảng thời gian mà mức độ tin cậy là 0, 95. Dựa trên phán đoán của chúng tôi là lo kích thước của M pop trên các giới hạn này, chúng tôi đứng đúng 95% và sai 5%.
Vùng giữa - 1, 96 SE M và + 1, 96 SE M được gọi là vùng chấp nhận H o và vùng nằm ngoài - 1, 96 SE M và + 1, 96 SE M được gọi là vùng từ chối. Nếu bất kỳ mẫu có nghĩa là nằm trong khu vực chấp nhận, chúng tôi chấp nhận H o . Khi từ chối H o, chúng tôi thừa nhận rằng giá trị trung bình của mẫu có thể nằm ngoài ± 1, 96 SE M.
Do đó, trong việc từ chối H o, chúng tôi mắc lỗi 5% vì trong 5% trong số 100 lần giảm có nghĩa là có thể xảy ra. Chúng tôi sẵn sàng chấp nhận rủi ro tới 5% khi từ chối H o khi điều đó là đúng. Do đó, các tiêu chí để từ chối H o được coi là mức độ quan trọng.
(b) .01 mức ý nghĩa:
Chúng tôi đọc từ Bảng A rằng 99% mức giảm trong phân phối bình thường nằm trong giới hạn ± 2, 58 SE M. Nếu chúng ta xác định các giới hạn được chỉ định bởi M ± 2.58 SE M, chúng ta sẽ xác định một khoảng mà mức độ tin cậy là 0, 99. Dựa trên đánh giá của chúng tôi về kích thước của M pop theo các giới hạn này, chúng tôi có thể đúng 99% và sai 1%.
Vùng giữa - 2, 58 SE M và + 2, 58 SE M sẽ là khu vực chấp nhận H 0 và khu vực nằm ngoài nó sẽ là khu vực từ chối H o . Chúng tôi sẵn sàng chấp nhận rủi ro 1% khi từ chối H o khi điều đó là đúng.
Mức ý nghĩa 0, 01 chính xác hơn mức 0, 05 vì ở mức 0, 01, lỗi từ chối H o là 1% trong khi ở mức 0, 05 thì sai số đó là 5%.
(iv) t-Phân phối:
Bất cứ khi nào N nhỏ hơn khoảng 30, khi mẫu nhỏ, phân phối lấy mẫu được gọi là Lít phân phối.
Phân bố t không khác nhiều so với bình thường trừ khi N khá nhỏ. Khi N tăng kích thước, phân phối t tiếp cận ngày càng gần với dạng thông thường.
Thuộc tính của phân phối t:
1. Nó trông giống như một đường cong hình chuông. Nhưng phân phối của nó có nhiều thay đổi với độ lệch bằng 0 và 'Ku' lớn hơn 3.
2. Đó là đối xứng về dòng t = 0.
3. Nó không đồng nhất với số thứ tự tối đa tại t = 0.
4. Khi N nhỏ, phân phối t nằm dưới đường cong thông thường, nhưng đuôi hoặc đầu của đường cong cao hơn các phần tương ứng của đường cong thông thường.
5. Các đơn vị dọc theo đường cơ sở của phân phối t thực sự là σ điểm, nghĩa là,
(v) Độ tự do (df):
Khái niệm mức độ tự do là rất quan trọng trong thống kê mẫu nhỏ. Nó là rất quan trọng, trong phân tích phương sai và trong các thủ tục khác. Độ tự do có nghĩa là tự do để thay đổi.
Chúng ta hãy chọn năm điểm có giá trị trung bình là 15. Bây giờ, giả sử bốn điểm là 18, 10, 20, 15. Để trung bình bằng 15, điểm thứ năm phải là 12. Tất nhiên, chúng ta có tự do lựa chọn bất kỳ bốn điểm.
Nhưng chúng tôi không có quyền tự do chọn điểm số 5 vì điểm số 5 thực hiện các điều chỉnh về biến thể do bốn điểm số đầu tiên mang lại và với giả định rằng giá trị trung bình sẽ là 15. Ở đây, N = 5 và một hạn chế được áp đặt, tức là trung bình phải là 15. Do đó, mức độ tự do là N - 1 hoặc 4.
Nếu chúng ta có 5 điểm 5, 6, 7, 8 và 9, giá trị trung bình là 7; và độ lệch của điểm số của chúng tôi từ 7 là - 2, - 1, 0, 1 và 2. Tổng các độ lệch này bằng không. Trong số 5 độ lệch, chỉ có thể chọn 4 (N - 1) một cách tự do, vì điều kiện là tổng bằng 0 ngay lập tức hạn chế giá trị của độ lệch thứ 5.
SD, tất nhiên, dựa trên bình phương của độ lệch lấy xung quanh giá trị trung bình. Có N df để tính giá trị trung bình, nhưng chỉ (N - 1) khả dụng cho 'S' (SD) khi một df bị mất khi tính giá trị trung bình.
Trong một ví dụ khác, trong đó N = 10, df có sẵn để ước tính M pop được đưa ra là 9 hoặc (N - 1), tức là một ít hơn số lượng quan sát, cụ thể là, 10. Một df bị mất khi tính toán M và theo đó chỉ còn lại 9 để ước tính M pop theo 'S' và phân phối t.
Bất cứ khi nào, một thống kê được sử dụng để ước tính một tham số, quy tắc là df có sẵn bằng N trừ đi số lượng tham số đã được ước tính từ mẫu. M là ước tính của M pop và trong tính toán, chúng ta mất 1 df .
Trong việc ước tính độ tin cậy của một r, ví dụ (phụ thuộc vào độ lệch so với hai phương tiện), df là (N - 2). Trong trường hợp kiểm tra chi bình phương và phân tích các thủ tục riêng biệt phương sai được theo sau trong việc xác định df .
(vi) Giả thuyết không:
Giả thuyết null là một công cụ hữu ích trong việc kiểm tra tầm quan trọng của sự khác biệt. Giả thuyết này khẳng định rằng không có sự khác biệt thực sự giữa hai phương tiện dân số và sự khác biệt được tìm thấy giữa các phương tiện mẫu là, do đó, vô tình và không quan trọng.
Giả thuyết khống có liên quan đến nguyên tắc pháp lý rằng một người đàn ông vô tội cho đến khi anh ta bị chứng minh là phạm tội. Nó tạo thành một thách thức và chức năng của một thí nghiệm là tạo cơ hội để bác bỏ (hoặc không bác bỏ) thách thức này.
Để minh họa, giả sử người ta cho rằng các tiêu chuẩn giảng dạy của các trường học ca đơn là tốt hơn so với các trường ca đôi. Giả thuyết này được nêu một cách mơ hồ và không thể được kiểm tra chính xác.
Nếu chúng tôi khẳng định rằng các trường chuyển ca đơn lẻ không mang lại các tiêu chuẩn giảng dạy tốt hơn so với các trường ca đôi, thì sự khác biệt thực sự là 0 Giả thuyết khống này là chính xác và có thể được kiểm tra. Nếu giả thuyết null của chúng tôi là không chịu thuế, nó phải bị từ chối. Tuyên bố không khác biệt giả định rằng hai nhóm sẽ được kiểm tra và được tìm thấy bằng nhau.
Các hình thức null được ưa thích bởi hầu hết các nhân viên nghiên cứu có kinh nghiệm. Hình thức tuyên bố này dễ dàng xác định mô hình toán học sẽ được sử dụng trong kiểm tra thống kê giả thuyết.
Một giả thuyết khống không bao giờ được chứng minh hay bác bỏ. Nó có thể được chấp nhận hoặc từ chối với mức độ tin cậy nhất định (hoặc ở mức độ quan trọng nhất định).
Trước khi kiểm tra một giả thuyết, chúng ta phải tính đến những điều sau đây:
1. Cho dù mẫu lớn hay nhỏ.
2. Mức độ ý nghĩa là gì.
3. Thử nghiệm là thử nghiệm hai đuôi hay thử nghiệm một đuôi.
(vii) Lỗi khi đưa ra suy luận:
Trong khi chấp nhận hoặc bác bỏ giả thuyết khống, có khả năng phạm hai loại lỗi và ham muốn được các nhân viên nghiên cứu tính toán.
Những gì được gọi là lỗi Loại I và Loại II có thể được giải thích dưới đây:
Lỗi loại I:
Những lỗi như vậy được cam kết khi chúng ta bác bỏ giả thuyết khống bằng cách đánh dấu sự khác biệt đáng kể, mặc dù không có sự khác biệt thực sự. Giả sử rằng sự khác biệt giữa hai phương tiện dân số (M pop - M pop = 0) thực sự bằng không. (Ví dụ, bé trai và bé gái có thể được coi là thành lập cùng một dân số đối với hầu hết các bài kiểm tra tâm thần). Nếu việc kiểm tra tầm quan trọng của hai phương tiện mẫu phản ánh một thực tế rằng sự khác biệt về phương tiện dân số là đáng kể, thì chúng tôi phạm phải lỗi Loại I.
Lỗi loại II:
Loại lỗi như vậy được cam kết khi chúng tôi chấp nhận một giả thuyết không bằng cách đánh dấu một sự khác biệt không đáng kể, mặc dù có một sự khác biệt thực sự. Giả sử có một sự khác biệt thực sự giữa hai phương tiện dân số.
Nếu thử nghiệm về tầm quan trọng của chúng tôi áp dụng cho hai mẫu có nghĩa là chúng tôi tin rằng sự khác biệt về dân số có nghĩa là không đáng kể, chúng tôi đã phạm phải lỗi Loại II.
Các biện pháp phòng ngừa khác nhau có thể được thực hiện để tránh cả hai loại lỗi. Nếu chúng tôi thiết lập mức ý nghĩa thấp (P lớn hơn 0, 05), chúng tôi sẽ tăng khả năng xảy ra lỗi Loại I; trong khi đó, nếu chúng ta thiết lập mức ý nghĩa cao (P nhỏ hơn 0, 05), các lỗi Loại I sẽ ít hơn. Khả năng vẽ các suy luận sai lầm của loại II được tăng cường khi chúng ta đặt mức ý nghĩa rất cao.
(viii) Các thử nghiệm hai đuôi và một đuôi có ý nghĩa:
Trong giả thuyết khống, sự khác biệt giữa các phương tiện thu được (nghĩa là M 1 - M 2 ) có thể là cộng hoặc trừ. Để xác định xác suất, chúng tôi lấy cả hai đuôi của phân phối lấy mẫu.
(ix) Tỷ lệ quan trọng (CR):
Tỷ lệ quan trọng (CR) được tìm thấy bằng cách chia sự khác biệt giữa các phương tiện mẫu với sai số chuẩn của nó (CR = D / SE D ). Khi N của các mẫu lớn (30 hoặc nhiều hơn là Lớn lớn), phân phối CR được biết là bình thường xung quanh sự khác biệt thực sự giữa các phương tiện dân số, t là một tỷ lệ quan trọng trong đó ước tính chính xác hơn về D Được sử dụng. Phân phối lấy mẫu của t không bình thường khi N nhỏ (dưới 30, giả sử), t là CR; nhưng tất cả CR không phải là của.
Thử nghiệm hai đuôi:
1. Trong thử nghiệm hai đuôi, chúng tôi xem xét cả hai đuôi của đường cong thông thường.
2. Trong trường hợp giả thuyết thay thế không có đuôi, chúng tôi thực hiện một thử nghiệm hai đuôi.
3. Ví dụ:
Một bài kiểm tra quan tâm được thực hiện cho một số chàng trai trong một nghề. Lớp đào tạo và một số chàng trai trong một lớp học tiếng Latin. Là sự khác biệt trung bình giữa hai nhóm có ý nghĩa ở mức 0, 05?
4. Mẫu có nghĩa là lệch khỏi M pop theo hướng + hoặc -.
5. H 0 : M 1 - M 2 = 0
H A : M 1 = M 2
6. Giá trị đáng kể:
1, 96 ở mức 0, 05
2, 58 ở mức 0, 01
7. Vùng loại bỏ được phân chia ở cả hai đầu (đuôi) của đường cong thông thường (tức là 05 thành .025 và .025, 01 thành .005 và .005).
Kiểm tra một đuôi:
1. Chúng ta phải tính một chiều cao tức là ở bên trái hoặc bên phải của đường cong thông thường.
2. Trong trường hợp giả thuyết thay thế định hướng, chúng tôi thực hiện thử nghiệm một đầu, M 1 > M 2 . Trong trường hợp như vậy, hướng rất rõ ràng - một mặt.
3. Ví dụ:
Mười môn học được đưa ra 5 con đường liên tiếp trong một bài kiểm tra ký hiệu chữ số trong đó chỉ có điểm số cho các con đường 1 và 5 được hiển thị. Là mức tăng trung bình từ thử nghiệm ban đầu đến thử nghiệm cuối cùng có ý nghĩa?
4. Trung bình mẫu lệch khỏi dân số có nghĩa là theo một hướng.
5. H 0 : M 1 = M 2
H A : M 1 > M 2 hoặc M 1 <m 2
6. Giá trị đáng kể:
1, 62 ở mức 0, 05
2, 33 ở mức 0, 01
7. Có một khu vực từ chối ở đuôi bên phải của phân phối hoặc đuôi bên trái của phân phối.