Mẫu tối ưu: Định nghĩa và các yếu tố

Sau khi đọc bài viết này, bạn sẽ tìm hiểu về định nghĩa và các yếu tố ảnh hưởng đến mẫu tối ưu cho một nghiên cứu.

Định nghĩa của một mẫu tối ưu:

Một mẫu tối ưu cho một nghiên cứu có thể được định nghĩa là mẫu đó đáp ứng các yêu cầu về hiệu quả, tính đại diện, độ tin cậy và tính linh hoạt. Nghĩa là, mẫu phải đủ nhỏ để đảm bảo chi phí không cần thiết và đủ lớn để giúp nhà nghiên cứu tránh được lỗi mẫu vượt quá giới hạn cho phép.

Nó phải đủ lớn để mang lại đại diện thống kê và kết quả quan trọng trong tất cả các bảng của bất kỳ nhập khẩu nào, nhưng nó không cần quá lớn để gây lãng phí tiền, giữ lại dự án và đạt độ chính xác cao không cần thiết. Mẫu phải mang lại các ước tính mong muốn với mức độ tin cậy cần thiết với chi phí tối thiểu.

Cần nhớ rằng trong thực tế lấy mẫu hiệu quả bao gồm tận dụng tối đa các nguồn lực sẵn có về mặt kỹ thuật và tổ chức dữ liệu thống kê và điều chỉnh, tốt nhất có thể, theo giới hạn của thời gian, kinh phí và nhân sự, ban đầu được áp dụng cho nghiên cứu.

Ngoài ra, trong một số trường hợp, có thể mở rộng hoặc ký hợp đồng cỡ mẫu để đáp ứng các trường hợp không lường trước phát sinh trong quá trình nghiên cứu. Trong một số trường hợp nhất định, độ tin cậy và hiệu quả có thể được cải thiện bằng cách thực hiện các thay đổi mong muốn về kích thước của mẫu.

Ở cấp độ thực hành, những lý tưởng này có thể được tiếp cận nhưng hiếm khi được nhận ra và do đó người ta không thể mong đợi để chọn kích thước mẫu chính xác.

Các yếu tố ảnh hưởng đến mẫu tối ưu:

Việc lựa chọn cỡ mẫu cho một nghiên cứu nhất định bị ảnh hưởng bởi một số yếu tố. Các yếu tố này có liên quan với nhau và khác nhau rất nhiều trong các nghiên cứu khác nhau về tầm quan trọng tương đối của chúng trong việc xác định cỡ mẫu.

(1) Bản chất của dân số (Đồng nhất-Không đồng nhất):

Kích thước của mẫu trong một nghiên cứu sẽ phụ thuộc vào mức độ đồng nhất của dân số. Dân số càng đồng nhất, càng ít trường hợp cần thiết để đưa ra một mẫu đáng tin cậy của nó và ngược lại, dân số càng không đồng nhất thì càng có nhiều trường hợp cần thiết để tạo thành một mẫu đáng tin cậy của nó.

Kích thước của mẫu cần thiết cho một nghiên cứu thỏa đáng về dân số không đồng nhất có thể được cắt giảm bằng cách phân loại dân số thành các tầng. Một số tầng lớp này sẽ đồng nhất hơn và những tầng khác thì ít hơn. Các tầng đồng nhất hơn có thể được biểu diễn bằng các mẫu nhỏ hơn các mẫu tương đối không đồng nhất.

Điều này là như vậy bởi vì một tầng càng đồng nhất, một mẫu ngẫu nhiên có kích thước nhất định có thể đại diện cho nó càng tốt, nghĩa là, các trường hợp trong mẫu sẽ càng giống nhau, do đó, ít có nghĩa là biến đổi của chúng.

(2) Độ phức tạp của việc lập bảng:

Khi đưa ra quyết định về kích thước của mẫu, người ta cũng phải tính đến số lượng các loại và các lớp mà các phát hiện sẽ được nhóm lại và phân tích. Số lượng danh mục càng nhiều, tổng số mẫu cần thiết để đưa ra các biện pháp thống kê đáng tin cậy càng lớn.

Mặc dù một mẫu có vẻ khá đầy đủ cho bảng chính, số lượng có thể sẽ giảm đi rất nhanh khi chuẩn bị các bảng chi tiết.

Ví dụ, một mẫu gồm 1.000 sinh viên có vẻ như là một con số thích hợp cho một cuộc khảo sát được thiết kế để xác định tỷ lệ sinh viên ủng hộ đồng giáo dục. Hãy để chúng tôi nói rằng chỉ có 25% được ủng hộ (250 sinh viên).

Nếu nhà nghiên cứu muốn đi xa hơn và biết loại sinh viên ưa thích đồng giáo dục, anh ta sẽ phải phân loại những người trả lời này hơn nữa, trên các khía cạnh như, liệu họ có kinh nghiệm trước đây của tổ chức hợp tác không? Họ đến từ tầng lớp xã hội nào? Họ có loại nền tảng gia đình nào? Bản chất của kinh nghiệm của họ (nếu có) của tổ chức hợp tác là gì? Và như vậy.

Do đó, nhà nghiên cứu cuối cùng chỉ có thể tìm thấy 10 hoặc 15 trường hợp thuộc một loại cụ thể (viz., Không có kinh nghiệm trước đây về đồng giáo dục, tầng lớp trung lưu, nền tảng gia đình chính thống, v.v.). Một mẫu như vậy chỉ có thể đủ khả năng cho một cơ sở rất mỏng manh để đi đến kết luận quan trọng và khái quát về mối quan hệ giữa các biến.

Kích thước của mẫu được chọn phải đủ lớn để đưa ra các biện pháp đáng tin cậy của các hạng mục quan trọng nhỏ nhất. Khi dữ liệu được chia thành các lớp con nhỏ hơn và nhỏ hơn, số lượng các trường hợp rơi vào các ô khác nhau sẽ sớm trở nên nhỏ đến mức các biện pháp thống kê được tính toán từ các mục của ô có thể không đáng tin cậy.

Do đó, cường độ của việc lập bảng là một yếu tố có tầm quan trọng đối với quyết định liên quan đến cỡ mẫu.

(3) Các vấn đề liên quan đến việc thu thập dữ liệu:

Thông thường, kích thước của mẫu phải được giữ trong giới hạn số lượng của các trường hợp có thể được bảo đảm bằng tiền và thời gian nhất định. Khối lượng dữ liệu bị ảnh hưởng bởi độ dài của bảng câu hỏi / lịch trình, số lượng công nhân hiện trường, sự phân tán hoặc tập trung các trường hợp trong một khu vực địa lý, tỷ lệ từ chối, tổn thất của các trường hợp, loại lấy mẫu được sử dụng và cuối cùng phương pháp thu thập dữ liệu.

Chi phí vận chuyển liên quan đến việc đi từ địa chỉ này sang địa chỉ khác và trong các cuộc gọi lại (cuộc gọi thứ hai hoặc thứ ba) phải được xem xét khi quyết định kích thước của mẫu. Trong khi lập kế hoạch cỡ mẫu, nhà nghiên cứu phải luôn dự đoán rằng anh ta có thể bị hụt trong bộ sưu tập số được chỉ định để đặt câu hỏi.

Mọi người di cư, chết, không thể cung cấp thông tin do bệnh tật, đi nghỉ mát hoặc đi công tác, không thể được định vị, từ chối trả lời, địa chỉ chứng minh sai, và như vậy.

Đó là một chính sách tốt để lập kế hoạch để có được thông tin từ mọi trường hợp trong mẫu nếu có thể. Điều này có nghĩa là sẽ cần nhiều thời gian hơn so với những gì sẽ được yêu cầu nếu chỉ có các trường hợp hợp tác và có thể truy cập được. Tuy nhiên, tốt hơn là có một mẫu nhỏ hơn mà không có sai lệch so với một mẫu lớn có khả năng không thể hiện được trong vũ trụ vì lý do sai lệch.

(4) Loại lấy mẫu:

Nói chung, một mẫu nhỏ hơn sẽ đủ khi phân tầng được sử dụng. Điều này là do tác dụng của phân tầng là giải quyết tổng thể tương đối không đồng nhất thành một số mẫu phụ đồng nhất riêng lẻ. Dân số càng không đồng nhất, nền kinh tế của các trường hợp càng lớn thông qua sự phân tầng.

Trong lấy mẫu được gọi là lấy mẫu kép, nhà nghiên cứu kết hợp một mẫu ngẫu nhiên lớn (để thu thập một vài mục thông tin cơ bản) với một mẫu được kiểm soát hoặc phân tầng rất nhỏ (từ đó thông tin chi tiết hoặc phức tạp được bảo mật).

Yêu cầu ở đây là kích thước của mẫu ngẫu nhiên phải đủ lớn để mang lại trọng lượng đáng tin cậy cho các tầng khác nhau. Bản thân mẫu phân tầng yêu cầu ít trường hợp hơn so với mẫu ngẫu nhiên đơn giản vì mẫu trong mỗi tầng cần phải đại diện cho tầng đó chứ không phải của 'vũ trụ'.

Một yếu tố quan trọng trong việc xác định số lượng các trường hợp cần thiết là kích thước của các đơn vị lấy mẫu. Trong thực tế, đơn vị lấy mẫu càng lớn, số lượng các trường hợp cần thiết cho việc lập bảng riêng lẻ càng lớn.