Phân tích dữ liệu: 4 bước

Bài viết này đưa ra ánh sáng theo bốn bước chính liên quan đến phân tích dữ liệu. Các bước là: 1. Thiết lập danh mục hoặc phân loại dữ liệu 2. Mã hóa 3. Lập bảng 4. Phân tích thống kê dữ liệu.

Bước # 1. Thiết lập danh mục hoặc phân loại dữ liệu :

Nghiên cứu khoa học xã hội nói chung liên quan đến rất nhiều câu trả lời cho các loại câu hỏi hoặc kích thích khác nhau được trình bày cho mẫu hoặc 'dân số' của người trả lời. Những phản hồi này có thể bằng lời nói hoặc không bằng lời nói.

Rõ ràng, nếu một số lượng lớn các loại câu trả lời khác nhau được tổ chức sao cho chúng có thể được sử dụng để trả lời các câu hỏi nghiên cứu hoặc trong việc vẽ khái quát, chúng phải được nhóm thành một số loại hoặc lớp giới hạn. Lấy một ví dụ đơn giản, giả sử một câu hỏi được đặt ra cho người trả lời, bạn có ủng hộ việc kiểm tra loại mục tiêu cho sinh viên đại học không?

Câu trả lời của người trả lời có thể có thể được nhóm lại theo bốn loại lớn, như dưới đây:

(a) Các câu trả lời của Yes Có.

(b) Không có phản hồi nào.

(c) Không biết gì về phạm lỗi, vì không thể nói, v.v.

(d) Không trả lời.

Giả sử một câu hỏi khác được hỏi cho những người được hỏi là, Bạn sẽ nói bạn thuộc tầng lớp xã hội nào?

Câu trả lời của người trả lời có thể được nhóm thành các loại sau:

(a) Tầng lớp thượng lưu.

(b) Tầng lớp trung lưu.

(c) Lớp dưới.

(d) Không thể nói.

(e) Những phản hồi khác (như, tôi không tin vào các tầng lớp xã hội. Hầu như không quan trọng khi tôi thuộc về v.v.).

Một điều kiện tiên quyết để đưa ra quyết định về các loại được lập ra để phân nhóm dữ liệu là nhà nghiên cứu phải chọn một số nguyên tắc phân loại thích hợp. Câu hỏi nghiên cứu hoặc giả thuyết, nếu có đã được xây dựng, cung cấp một cơ sở logic tốt để chọn một nguyên tắc phân loại.

Giả sử, giả thuyết trong một nghiên cứu là:

Học sinh đã có kinh nghiệm học tập tại các trường đồng học sẽ có thái độ thuận lợi hơn đối với hệ thống đồng giáo dục.

Rõ ràng, ở đây, một trong những nguyên tắc phân loại câu trả lời sẽ là liệu người được hỏi có kinh nghiệm trước đây về hệ thống đồng giáo dục hay không. Một cơ sở khác của việc phân loại các câu trả lời sẽ là mức độ phù hợp hoặc không phù hợp thể hiện đối với hệ thống đồng giáo dục. Các cơ sở phân loại khác cũng có thể được viện dẫn, tùy thuộc vào những liên kết nào sẽ được xem xét kỹ lưỡng.

Cơ sở đầu tiên của phân loại sẽ mang lại hai loại phản ứng:

(a) Cho biết, họ đã có kinh nghiệm trước đây về đồng giáo dục;

(b) Cho biết, họ không có bất kỳ kinh nghiệm nào trước đây về đồng giáo dục.

Hai loại này chứa trong toàn bộ phạm vi phản hồi (tất nhiên, giả sử rằng không có người trả lời từ chối trả lời hoặc không trả lời hoặc đưa ra một số 'phản hồi khác.' Không có phản hồi nào về giả định trên nằm ngoài phạm vi của hai loại này. Hai danh mục này kết hợp với nhau tạo thành một tập hợp thể loại.

Một "tập hợp danh mục" phải đáp ứng ba yêu cầu sau:

(1) Tập hợp các danh mục nên được bắt nguồn từ một nguyên tắc phân loại duy nhất. Yêu cầu này khá dễ hiểu bởi vì nếu có nhiều hơn một nguyên tắc phân loại được sử dụng, một phản hồi có thể được yêu cầu bởi nhiều hơn một loại.

Do đó, các danh mục sẽ không độc lập với nhau. Ví dụ: nếu chúng ta có ba loại cấu thành tập hợp thể loại, ví dụ: nam, nữ, trẻ em, xuất phát rõ ràng, từ hai nguyên tắc phân loại, cụ thể là giới tính và độ tuổi, thì bất kỳ trường hợp nào (người trả lời) có thể được bao phủ bởi hơn một thể loại trong tập hợp thể loại.

Chẳng hạn, một đứa trẻ cũng có thể là nam, nữ cũng có thể là trẻ con, v.v. Tuy nhiên, nguyên tắc phân loại có thể là một hợp chất, nghĩa là, được tạo thành từ hai hoặc nhiều tiêu chí, nghĩa là trẻ em nam, trẻ em nữ, v.v.

(2) Yêu cầu thứ hai là tập hợp danh mục phải đầy đủ, nghĩa là có thể đặt mọi phản hồi trong một trong các danh mục trong tập hợp. 'Không có phản hồi' nên được bỏ qua vì muốn có một danh mục phù hợp trong bộ sẽ bao gồm nó.

Dù là câu trả lời, nó phải được bao phủ bởi một số loại trong tập hợp. Ví dụ: nếu mọi người trên thế giới được phân loại dựa trên cơ sở chủng tộc của họ, thì tập hợp thể loại được cấu thành từ ba loại, cụ thể là, (a) Caikaoid, (b) Negroid và (c) Mongoloid, rõ ràng là không là một danh mục đầy đủ được thiết lập phù hợp với yêu cầu được nêu ở trên, vì nó không chứa một danh mục duy nhất trong đó nhiều người Ấn Độ (và một số người khác) có thể tìm thấy một địa điểm.

(3) Yêu cầu cuối cùng là một hệ quả của điều thứ nhất, cụ thể là các danh mục trong tập hợp phải loại trừ lẫn nhau; đó là, các danh mục không nên chồng chéo. Do đó, không có phản hồi nào được yêu cầu bởi nhiều hơn một danh mục trong tập hợp.

Việc thiết lập các danh mục cho đặc trưng dữ liệu của khoa học xã hội không phải lúc nào cũng là một nhiệm vụ dễ dàng. Nguyên tắc phân loại thường có thể là một hợp chất (trái ngược với đơn giản, đơn nhất). Nhiệm vụ rút ra tất cả các thể loại loại trừ lẫn nhau sẽ cùng nhau làm cạn kiệt toàn bộ vũ trụ của các phản ứng, trên cơ sở nguyên tắc phân loại hỗn hợp, thực sự là một thể loại chính xác, đòi hỏi trí tưởng tượng.

Đó là một sự trợ giúp tuyệt vời trong các trường hợp như vậy để giảm các thuộc tính cấu thành nguyên tắc tổng hợp phân loại thành các ký hiệu hoặc mã và rút ra bằng phương pháp kỹ thuật mở rộng Boolean, toàn bộ phạm vi các thể loại có thể bao gồm tập hợp thể loại.

Hãy để chúng tôi lấy một ví dụ rất đơn giản. Giả sử nhà nghiên cứu coi ba thuộc tính, ví dụ: giới tính (nam của nữ), tuổi (dưới 21 tuổi hoặc trên 21 tuổi) và tình trạng hôn nhân (đã kết hôn hoặc độc thân) là thành phần của nguyên tắc phân loại đơn (nhưng hợp chất) của anh ta và giảm chúng thành các biểu tượng như dưới đây:

Nam = S, nữ = S̅

Dưới 21 tuổi = A, Trên 21 tuổi = A̅

Đã kết hôn = M, Độc thân = M̅

Tập hợp thể loại kết quả sẽ là tổng thể toàn diện bao gồm tất cả các kết hợp có thể có của ba thuộc tính này bao gồm nguyên tắc phân loại hỗn hợp. Các kết hợp có thể, nghĩa là, các loại, sẽ có 2 3 = 2 x 2 x 2 = 8 về số lượng.

Đây là như dưới:

(1) SAM

(2) sáng

(3) S A̅ M

(4) SA M̅

(5) S̅ A̅ M

(6) S̅ A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

Giải mã, nghĩa là thay thế các ý nghĩa thực sự cho các biểu tượng, chúng ta có tám danh mục loại trừ lẫn nhau được đọc như sau:

(1) Nam dưới 21 tuổi và đã kết hôn.

(2) Nữ giới dưới 21 tuổi và đã kết hôn.

(3) Nam trên 21 tuổi và đã kết hôn.

(4) Nam dưới 21 tuổi và chưa lập gia đình.

(5) Nữ giới trên 21 tuổi và đã kết hôn.

(6) Nữ giới dưới 21 tuổi và chưa kết hôn.

(7) Nam trên 21 tuổi và chưa lập gia đình.

(8) Nữ giới trên 21 tuổi và chưa kết hôn.

Với cùng một mã thông báo, nếu nguyên tắc phân loại hỗn hợp được cấu thành từ bốn thuộc tính, chúng ta sẽ có 2 4 = 2x 2 x 2 x 2, tức là 16 loại loại trừ lẫn nhau. Bây giờ cần phải rõ ràng làm thế nào phương pháp thiết lập danh mục này, thay vì trực giác, làm cho nhiệm vụ phân loại dễ dàng hơn và không bị lừa.

Rõ ràng là việc thiết lập một tập hợp các danh mục tương đối dễ dàng nếu các câu trả lời thu được từ những người trả lời trong nghiên cứu khá đơn giản và rõ ràng và do đó các danh mục có thể dễ dàng được xác định một cách rõ ràng. Mặc dù đây là cách các danh mục phải luôn được xác định, nhưng nhiệm vụ khó khăn hơn nhiều với một số loại nội dung nhất định.

Giả sử trong một nghiên cứu, nhà nghiên cứu đã hỏi các sinh viên nam, Bạn sẽ nói các sinh viên nữ cảm thấy thế nào khi học cùng trường với các sinh viên nam như bạn? Câu trả lời có thể nằm trong các chỉ dẫn về thái độ rất thuận lợi (đối với sinh viên nữ ) để tranh luận về thái độ rất bất lợi. Giả sử, đây là một số câu trả lời nhận được từ người trả lời.

(1) Họ thích ý tưởng. '

(2) 'Tôi không nghĩ họ bận tâm.'

(3) 'Họ nghĩ rằng nó hạ thấp họ.'

(4) Tôi không tiếp xúc với họ, vì vậy tôi sẽ không biết. '

(5) 'Họ ghét nó.'

(6) 'Một số người trong số họ thích nó, một số thì không.'

(7) 'Họ muốn học ở đây để họ có thể nói rằng họ không kém gì nam giới.'

(8) 'Trong một trường đại học nữ thuần túy' họ sẽ bỏ lỡ nhiều, vì vậy họ dường như thích nó ở đây. '

Đối với các câu trả lời trên, sẽ không khó để phát triển một tập hợp các danh mục đơn giản dựa trên nguyên tắc phân loại thuận lợi so với thái độ bất lợi đối với học sinh nữ. Nhưng chúng tôi thấy rằng cả hai câu trả lời thuận lợi và không thuận lợi đều truyền tải các sắc thái ý nghĩa khác nhau.

Học sinh nam nói, họ Họ (học sinh nữ) muốn học ở đây nên có thể nói họ không kém gì nam giới Truyền đạt một cái gì đó khác với người nói, họ thích ý tưởng đó., Voi Họ nghĩ rằng họ hạ thấp họ lại một lần nữa nói điều gì đó khác với người nói, họ ghét điều đó.

Vì vậy, chúng ta thấy rằng hai thuộc tính, nghĩa là:

(1) Tranh cãi về thái độ thuận lợi hoặc bất lợi cho các cô gái, và

(2) Tham chiếu rõ ràng hoặc không có tham chiếu đến lợi ích hoặc tác hại hỗ trợ thái độ thuận lợi hoặc bất lợi là hai thành phần quan trọng của một nguyên tắc phân loại gộp.

Các danh mục trong bộ danh mục phù hợp với các yêu cầu lý tưởng của bộ danh mục được thảo luận trước đó, có thể được đưa xuống như dưới đây:

(1) Thái độ thuận lợi đối với sinh viên nữ, được giải thích về lợi ích họ có được từ việc học cùng trường với sinh viên nam (ví dụ: câu trả lời thứ 7 và thứ 8).

(2) Thái độ thuận lợi đối với các cô gái mà không cần tham khảo rõ ràng về lợi ích thu được từ việc học cùng trường với nam giới (ví dụ, tuyên bố số 1).

(3) Thái độ trung lập hoặc thích nghi đối với các cô gái (ví dụ, tuyên bố số 1).

(4) Thái độ không thuận lợi đối với các cô gái, được giải thích về những bất lợi (lợi ích tiêu cực) mà họ có được từ việc học cùng trường với các sinh viên nam.

(5) Thái độ không thuận lợi đối với các cô gái mà không tham khảo rõ ràng về những bất lợi hoặc mất mát do đồng giáo dục (ví dụ, tuyên bố số 5).

(6) Các câu trả lời khác, không thể nói, không trả lời, không biết (ví dụ: tuyên bố số 4).

Hình minh họa trên sẽ đưa ra một ý tưởng về việc phân loại trong khoa học xã hội có thể rất phức tạp. Làm việc với các danh mục phức tạp như vậy đòi hỏi sự chăm sóc và nỗ lực đáng kể trong phân loại. Ngay cả khi các danh mục đã được xử lý cẩn thận, việc sử dụng chúng sẽ gây ra nhiều vấn đề hơn so với việc sử dụng các danh mục được xác định hẹp hơn và chính xác hơn.

Nếu một học sinh nam trong ví dụ trên nói, thì họ thích nó ở đây, họ biết tại sao đó là một câu hỏi tranh luận liệu câu nói này có ngụ ý lợi ích hay không. Do đó, các quy tắc bổ sung sẽ phải được thiết lập để đối phó với các câu trả lời như vậy.

Phải nói ngay cả với chi phí của một số lần lặp lại rằng mặc dù về nguyên tắc, có thể sử dụng nhiều thuộc tính của phản hồi để xây dựng các tập hợp thể loại, trong thực tế, điều này thường không cần thiết, không kinh tế và không được thực hiện vì không phải tất cả các nguyên tắc phân loại này dựa trên mục tiêu của nghiên cứu

Bây giờ chúng ta chuyển sang xem xét vấn đề chọn nguyên tắc phân loại để phân loại vật liệu phi cấu trúc (nghĩa là thông tin được thu thập bởi các công cụ phi cấu trúc).

Trong các nghiên cứu sử dụng các công cụ có cấu trúc để thu thập dữ liệu liên quan đến các câu hỏi hoặc giả thuyết nghiên cứu được xây dựng rõ ràng, nguyên tắc thích hợp để phân loại các câu trả lời được quy định khá rõ ràng bởi bản chất của các câu hỏi và các câu trả lời được bảo đảm.

Tuy nhiên, khi làm việc với vật liệu hoặc dữ liệu phi cấu trúc, vấn đề đầu tiên là đưa ra quyết định về các khía cạnh của vật liệu sẽ được phân loại, nghĩa là, các nguyên tắc phân loại nào sẽ được sử dụng trong việc thiết lập các danh mục.

Trong các nghiên cứu thăm dò mà theo định nghĩa không bắt đầu với một vấn đề được xây dựng tốt hoặc giả thuyết rõ ràng, quyết định về các nguyên tắc phân loại là khó khăn để đi đến. Tại thời điểm thu thập dữ liệu, điều tra viên không biết khía cạnh nào có thể trở nên quan trọng nhất.

Do đó, anh ta phải thu thập một lượng lớn dữ liệu thuộc loại không có cấu trúc. Trong quá trình phân tích, nhà nghiên cứu phải đối mặt với vấn đề xử lý không chỉ với các vật liệu không có cấu trúc mà còn với một khối lượng lớn trong số đó.

Đó là khuyến khích khi phân tích dữ liệu của một nghiên cứu thăm dò để phát triển giả thuyết làm việc sẽ mang lại các nguyên tắc phân loại thỏa đáng khả thi. Nhà nghiên cứu được yêu cầu đọc kỹ thông qua tất cả các tài liệu của mình, luôn luôn cảnh giác với các manh mối tiềm ẩn trong dữ liệu. Những manh mối như vậy thường được bảo đảm thông qua các tài liệu nghiên cứu về các đối tượng hoặc tình huống tương phản với những gì anh ta đang nghiên cứu.

Một nghiên cứu như vậy giúp điều tra viên thấy sự khác biệt quan trọng giữa hai tình huống. Một thủ tục khác để có được manh mối như vậy là tập hợp các trường hợp của một người thành các nhóm dường như có mối quan hệ họ hàng gần gũi hoặc dường như thuộc về nhau và sau đó tự hỏi điều gì khiến anh ta cảm thấy rằng các trường hợp anh ta đặt trong một nhóm giống nhau.

Tuy nhiên, một cách tiếp cận khác có thể kích thích các đầu mối để hình thành giả thuyết làm việc là lưu ý các vấn đề có vẻ đáng ngạc nhiên khi xem một số kỳ vọng lý thuyết hoặc ý thức chung và sau đó tìm kiếm lời giải thích có thể về hiện tượng đáng ngạc nhiên hoặc không lường trước được.

Tuy nhiên, nên nhớ rằng ngay cả với giả thuyết rõ ràng, việc phân tích vật liệu phi cấu trúc trình bày các vấn đề đặc biệt. Thứ nhất, luôn có khả năng thông tin về một điểm nhất định có thể bị thiếu trong một số tài liệu.

Cũng có khả năng rất nhiều tài liệu không có liên quan trực tiếp đến giả thuyết. Ngoài ra, có vấn đề quyết định kích thước của các đơn vị vật liệu mà các loại sẽ được áp dụng.

Ví dụ: nếu một nhà nghiên cứu đang sử dụng hồ sơ vụ án được lưu giữ bởi các cơ quan phúc lợi, anh ta phải quyết định đơn vị nào (ví dụ: khách hàng, tuyên bố, hành vi, nhân viên xã hội, phiên với khách hàng hoặc toàn bộ hồ sơ) là phù hợp nhất trong việc cung cấp câu trả lời cho anh ta câu hỏi nghiên cứu cụ thể.

Bước # 2. Mã hóa:

Mã hóa bao gồm việc gán các ký hiệu, thường là các chữ số cho mỗi câu trả lời thuộc một lớp được xác định trước. Nói cách khác, mã hóa có thể được coi là quá trình phân loại cần thiết cho việc lập bảng tiếp theo. Thông qua mã hóa, dữ liệu thô được chuyển thành các ký hiệu có thể được lập bảng và đếm.

Tuy nhiên, sự chuyển đổi này không phải là tự động, nó liên quan đến sự phán xét rất lớn từ phía người viết mã. 'Bộ giải mã' là tiêu đề chính thức cho một người được giao trách nhiệm đưa ra các mã cụ thể cho các phản hồi sau khi các ghi chú được ghi lại được mang đến văn phòng.

Tuy nhiên, cần nhớ rằng thường thì việc đánh giá phản hồi nào sẽ được gán một mã cụ thể, được thực hiện bởi một người không phải là người đi theo chỉ định chính thức của 'coder'.

Mã hóa có thể diễn ra tại ba điểm khác nhau trong một nghiên cứu tại mỗi điểm, các loại người khác nhau có thể chịu trách nhiệm gán mã cho dữ liệu thô. Trong nhiều nghiên cứu, bản thân người được hỏi có thể được yêu cầu gán mã cho phản ứng hoặc tình huống của chính mình.

Điều này đúng cho nhiều câu hỏi kiểu thăm dò ý kiến ​​và trắc nghiệm. Ví dụ, khi người được hỏi được yêu cầu cho biết nhóm nào (nói nhóm thu nhập) mà anh ta thuộc về, ví dụ: (a) dưới 3000 rupee chiều, (b) R. 3001 / - đến R. 6000 / - chiều, (c) R. 6001 / - đến R. 9000 / - chiều, (d) R. 9001 / - trở lên, người trả lời mã hóa câu trả lời của anh ta chỉ bằng cách đánh dấu vị trí của anh ta trong số các lựa chọn thay thế đã cho.

Điểm thứ hai mà mã hóa có thể diễn ra là khi trong quá trình thu thập dữ liệu, người phỏng vấn hoặc người quan sát phân loại các câu trả lời của các đối tượng. Đây là những gì đang được thực hiện khi người phỏng vấn hoặc người quan sát sử dụng thang đánh giá để mô tả phản ứng hoặc hành vi của một người.

Tất nhiên, điểm cuối cùng mà mã hóa có thể diễn ra là khi dữ liệu thô chưa được phân loại (được thu thập đặc biệt thông qua các công cụ thu thập dữ liệu không có cấu trúc) được gửi trong văn phòng dự án và các lập trình viên chính thức ở đây thực hiện phán quyết để gán mã cụ thể cho cụ thể phản hồi hoặc dữ liệu.

Chúng ta hãy so sánh ngắn gọn và đối chiếu những ưu và nhược điểm của mã hóa bởi các lập trình viên chính thức trong văn phòng và mã hóa bởi những người phỏng vấn hoặc quan sát viên thực hiện trong quá trình thu thập dữ liệu trong lĩnh vực này.

Người phỏng vấn hoặc quan sát viên có thể chú ý đến tình huống cũng như hành vi của cá nhân. Do đó, họ có nhiều thông tin hơn để dựa vào các phán đoán của mình liên quan đến việc phân loại phản hồi phù hợp so với các lập trình viên làm việc trên cơ sở các hồ sơ bằng văn bản có thể không đưa ra ý tưởng hoàn chỉnh về ý nghĩa thực sự của phản hồi.

Một lợi thế khác của mã hóa bởi chính người thu thập dữ liệu là, cả thời gian và lao động đều có thể được lưu.

Ngược lại, mã hóa trong văn phòng bởi các lập trình viên có những lợi thế tín hiệu nhất định. Việc mã hóa dữ liệu phức tạp đòi hỏi thời gian phản ánh nên được thực hiện bởi các lập trình viên văn phòng. Phán quyết mã hóa tại chỗ được thực hiện bởi những người thu thập dữ liệu có thể không sáng suốt như những phán đoán được đưa ra với thời gian cân nhắc nhiều hơn.

Phán quyết của người thu thập dữ liệu có thể được tô màu bởi nhiều yếu tố, viz., Sự xuất hiện của người trả lời, giọng nói và câu trả lời cho các câu hỏi trước đây, cách cư xử, v.v. Thứ hai, có một nguy cơ người thu thập dữ liệu thiếu tính đồng nhất khi phản hồi mã hóa.

Do đó, việc so sánh dữ liệu thu được từ một số lượng lớn người được hỏi bị cản trở. Thứ ba, người phỏng vấn hoặc quan sát viên có thể phát triển các khung tham chiếu cá nhân của riêng họ đối với tài liệu mà họ đang mã hóa. Điều này sẽ có xu hướng làm cho phân loại của họ không đáng tin cậy, sau một thời gian. Một khung tham chiếu chung dễ dàng có được và duy trì trong hoạt động mã hóa văn phòng hơn trong lĩnh vực này.

Hãy để chúng tôi thảo luận về một số vấn đề quan trọng liên quan đến độ tin cậy trong mã hóa. Có nhiều điều có thể hoạt động để làm cho sự đánh giá của các lập trình viên không đáng tin cậy. Một số yếu tố có thể phát sinh từ dữ liệu được phân loại, một số yếu tố từ bản chất của các danh mục sẽ được áp dụng và vẫn còn các yếu tố khác có thể xuất phát từ chính các lập trình viên.

Bây giờ chúng ta sẽ xem xét ngắn gọn một số yếu tố này và cách chúng có thể được bảo vệ chống lại.

Nhiều khó khăn xảy ra trong mã hóa là kết quả của sự bất cập của dữ liệu. Thông thường, dữ liệu không cung cấp đủ thông tin liên quan cho một mã hóa đáng tin cậy. Điều này có thể là do các thủ tục thu thập dữ liệu thiếu và không đầy đủ. Tuy nhiên, những khó khăn này thường có thể được khắc phục bằng cách chỉnh sửa dữ liệu cẩn thận. Quá trình bao gồm việc xem xét dữ liệu để cải thiện chất lượng của chúng để mã hóa được gọi là chỉnh sửa.

Khi người thu thập dữ liệu trao tài liệu của mình cho văn phòng dự án, khả năng loại bỏ nhiều khó khăn mã hóa tiềm năng vẫn còn tồn tại. Một cuộc kiểm tra cẩn thận về dữ liệu ngay khi chúng được thu thập và nếu cần thiết, một câu hỏi có hệ thống của người phỏng vấn hoặc người quan sát giúp tránh được nhiều vấn đề mã hóa.

Chỉnh sửa không chỉ giúp tránh các vấn đề mã hóa sau này, nó còn có thể cải thiện đáng kể chất lượng thu thập dữ liệu bằng cách chỉ ra nơi người phỏng vấn hoặc người quan sát có thể đã hiểu sai hướng dẫn hoặc có thể không ghi lại dữ liệu chi tiết.

Trong thực tế, chỉnh sửa nên được thực hiện trong quá trình kiểm tra trước cuộc phỏng vấn hoặc lịch trình quan sát đào tạo người phỏng vấn hoặc quan sát viên và trên thực tế trong suốt thời gian thu thập dữ liệu. Chỉnh sửa tại văn phòng dự án đi một chặng đường dài trong việc loại bỏ các vấn đề mã hóa.

Vì vậy, chỉnh sửa phải được thực hiện trong khi người phỏng vấn hoặc quan sát viên có thể dễ dàng có sẵn để đặt câu hỏi. Chỉnh sửa liên quan đến việc xem xét cẩn thận các cuộc phỏng vấn hoặc lịch trình quan sát.

Chúng nên được kiểm tra:

(1) Tính đầy đủ: Các biên tập viên cần thấy rằng tất cả các mục đều được điền đầy đủ. Ví dụ, một khoảng trống bên cạnh một câu hỏi trong lịch phỏng vấn có thể có nghĩa là 'không trả lời' hoặc 'Không biết' hoặc từ chối trả lời hoặc không thể áp dụng câu hỏi, hoặc câu hỏi đã bị bỏ qua do giám sát, v.v.

(2) Biên tập viên nên kiểm tra lịch phỏng vấn hoặc lịch quan sát để tìm hiểu xem chữ viết tay hoặc ký hiệu hoặc mã được chỉ định bởi người phỏng vấn hoặc người quan sát có thể dễ dàng hiểu được bởi người viết mã.

Luôn luôn nên kiểm tra mức độ dễ đọc khi tài liệu được đưa vào và nếu cần thiết để người phỏng vấn hoặc người quan sát viết lại nó. Nếu điều này không được thực hiện, mã hóa có thể bị kẹt ở giai đoạn khi người phỏng vấn hoặc người quan sát có thể không dễ dàng bị thu hồi để đặt câu hỏi.

(3) Chỉnh sửa cũng liên quan đến việc kiểm tra lịch trình để hiểu toàn diện. Nó thường xảy ra rằng một phản hồi được ghi lại là hoàn toàn dễ hiểu đối với người phỏng vấn hoặc người quan sát, nhưng không dễ hiểu đối với người viết mã bởi vì bối cảnh của hành vi hoặc phản ứng không được biết đến với người viết mã. Câu hỏi có hệ thống của những người thu thập dữ liệu sẽ xóa tan sự nhầm lẫn và sự mơ hồ và cải thiện đáng kể chất lượng mã hóa.

(4) Dữ liệu cũng cần được kiểm tra hoặc kiểm tra để tìm hiểu xem có sự không nhất quán nào liên quan đến các phản hồi được ghi trong lịch trình hay không.

Ví dụ, một người được hỏi có thể đã trả lời một trong những câu hỏi trước đó rằng anh ta chưa bao giờ gặp những người thuộc nhóm cụ thể nào, và để trả lời một câu hỏi sau đó, anh ta có thể đã nói điều gì đó về việc đến thăm một số người trong nhóm này trong quá trình của anh ta vòng. Nếu đó là trường hợp, có một nhu cầu rõ ràng để tìm hiểu sự không nhất quán này, và làm cho nó được làm rõ thông qua việc đặt câu hỏi cho người thu thập dữ liệu.

(5) Cũng cần kiểm tra mức độ đồng nhất mà người phỏng vấn đã làm theo hướng dẫn trong việc thu thập và ghi lại dữ liệu. Mã hóa có thể bị cản trở nếu một phản hồi được ghi lại trong các đơn vị khác với các đơn vị được chỉ định trong hướng dẫn.

(6) Cần lưu ý rằng một số phản hồi có thể chỉ đơn giản là không liên quan cho mục đích điều tra. Điều này có thể xảy ra nếu một câu hỏi không được làm việc rõ ràng hoặc không được hỏi một cách thông minh. Do đó, dữ liệu cần được kiểm tra cẩn thận nhằm tách biệt các phản hồi không phù hợp với các phản hồi phù hợp.

Giá trị của việc phân loại dữ liệu phụ thuộc một cách tự nhiên vào sự đúng đắn của các danh mục được sử dụng. Điều cần thiết là các phạm trù bên cạnh việc liên quan đến mục đích nghiên cứu cũng được xác định theo quan điểm khái niệm.

Mã hóa sẽ không đáng tin cậy nếu các danh mục không được xác định rõ ràng về các chỉ số áp dụng cho dữ liệu, tại đây và ngay bây giờ. Trong thực tế, các danh mục được xác định bằng các ví dụ từ dữ liệu trong tay. Sẽ rất hữu ích nếu hình minh họa từ dữ liệu không chỉ thể hiện loại phản ứng nào tiêu biểu cho danh mục mà còn giúp phân biệt ranh giới giữa các danh mục có vẻ giống nhau.

Rõ ràng là chất lượng mã hóa bị ảnh hưởng bởi năng lực của các lập trình viên. Do đó, đào tạo lập trình viên là một bước quan trọng trong bất kỳ nghiên cứu nào.

Việc đào tạo lập trình viên có thể tiến hành theo các giai đoạn sau:

Đầu tiên, các mã khác nhau được giải thích cho thực tập sinh (lập trình viên) và được minh họa bằng các ví dụ từ dữ liệu sẽ được phân loại.

Thứ hai, tất cả các lập trình viên thực tập sau đó thực hành trên một mẫu dữ liệu, các vấn đề phát sinh được các lập trình viên thảo luận như một nhóm với người giám sát để phát triển các quy trình và định nghĩa chung.

Thứ ba, các manh mối do mã hóa thực hành được sử dụng để thực hiện các sửa đổi trong các danh mục để làm cho chúng có thể áp dụng tốt hơn cho tài liệu và để viết các quy trình và định nghĩa đã phát triển trong quá trình mã hóa sơ bộ.

Thứ tư, tại một số thời điểm trong giai đoạn thực hành khi có tương đối ít vấn đề mới phát sinh, các lập trình viên làm việc trên một phần dữ liệu giống hệt nhau mà không hỏi ý kiến ​​nhau hoặc người giám sát. Tính nhất quán hoặc độ tin cậy của mã hóa sau đó được tính toán để xác định xem có khả thi để bắt đầu mã hóa một cách nghiêm túc hay không.

Tùy thuộc vào kết quả kiểm tra độ tin cậy hoặc tính nhất quán, có thể quyết định loại bỏ các danh mục có vẻ không đáng tin cậy hoặc dành nhiều thời gian hơn cho việc đào tạo lập trình viên hoặc loại bỏ các lập trình viên không nhất quán và v.v.

Cuối cùng, kiểm tra định kỳ được thực hiện để đảm bảo rằng các lập trình viên không trở nên bất cẩn với nhiều kinh nghiệm hơn hoặc họ không phát triển các phương pháp cá nhân để xử lý các vấn đề mới trong tài liệu. Để đảm bảo tính đồng nhất và quyết định được đưa ra sau khi mã hóa đã bắt đầu nên được truyền đạt tới tất cả các lập trình viên không chậm trễ.

Rõ ràng, tính nhất quán và phù hợp mà một loại câu trả lời nhất định được gán cho một loại nhất định sẽ có ảnh hưởng quan trọng đến kết quả phân tích, do đó, điều quan trọng là phải kiểm tra độ tin cậy của mã hóa và tăng sự thỏa thuận giữa các lập trình viên càng tốt

Tất nhiên, rất khó để đặt bất kỳ mức độ tin cậy nhất định nào làm tiêu chuẩn cần đạt được. Các loại vật liệu khác nhau thể hiện mức độ khó khác nhau trong việc đạt được độ tin cậy. Theo quy định, vật liệu được cấu trúc càng nhiều và do đó các danh mục được sử dụng càng đơn giản thì độ tin cậy càng cao.

Cần lưu ý rằng các loại mã được sử dụng trong một nghiên cứu sẽ khác nhau tùy thuộc vào việc dữ liệu sẽ được lập bảng bằng máy hay bằng tay. Nếu dữ liệu được sắp xếp theo cách thủ công, một mô tả từ của các lớp là thỏa đáng.

Ngoài ra, có thể sử dụng các chữ viết tắt hoặc chữ cái của alpha-bates, ví dụ: 'Y for Yes, ' N 'cho No, v.v. Mặt khác, việc lập bảng máy đòi hỏi các lớp phải được biểu thị bằng các ký hiệu số, vì các máy chỉ có thể được cung cấp bằng dữ liệu số.

Lập bảng cơ học yêu cầu sử dụng thẻ đục lỗ. Tuy nhiên, số lượng các lớp khác nhau có thể được hiển thị trên thẻ đục lỗ bị hạn chế. Trong mọi trường hợp, tất cả các mã được sử dụng cho lập bảng máy cũng có thể được sử dụng cho lập bảng tay.

Nếu các mã được đặt trên thẻ đục lỗ có hai kích cỡ được sử dụng chung, nghĩa là thẻ 80 cột và thẻ cột 54, thì nên sử dụng mười mã cho ít loại / loại hơn cho hầu hết các mục thông tin hoặc phản hồi.

Thẻ đục lỗ chứa 10 khoảng trắng được đánh số và một X và Y trong mỗi cột tạo ra tổng cộng 12 mã có thể được sử dụng. Đây là một thủ tục khá phức tạp để có được nhiều hơn một loại mặt hàng trong một cột. Ví dụ, mã tự nhiên và tuổi không thể được bấm trong một cột trừ khi chỉ có sáu nhóm tuổi được sử dụng cho mỗi nhóm.

Bước # 3. Lập bảng:

Tabulation là một phần của quy trình kỹ thuật trong phân tích thống kê dữ liệu. Yếu tố thiết yếu trong lập bảng là tổng hợp kết quả dưới dạng bảng thống kê.

Chỉ khi dữ liệu thô được chia thành các nhóm và số lượng được tạo thành từ số trường hợp thuộc các nhóm khác nhau, thì nhà nghiên cứu mới có thể xác định kết quả của mình có ý nghĩa gì và truyền đạt kết quả của mình cho người tiêu dùng ở dạng có thể dễ hiểu

Việc lập bảng tự nhiên phụ thuộc vào việc thiết lập các danh mục cho dữ liệu thô, chỉnh sửa và mã hóa phản hồi (đục lỗ và chạy thẻ thông qua các máy để lập bảng cơ học và sắp xếp và kiểm đếm để lập bảng tay).

Các nhà nghiên cứu có kinh nghiệm thường phát triển các kế hoạch lập bảng cùng lúc với việc họ phác thảo hoặc xây dựng các công cụ thu thập dữ liệu và lập kế hoạch lấy mẫu. Các nhà nghiên cứu thiếu kinh nghiệm hiếm khi quan tâm đến kế hoạch lập bảng cho đến khi dữ liệu được thu thập. Tất nhiên, nhà nghiên cứu không thể thấy trước toàn bộ phạm vi lập bảng sẽ được mong muốn sau đó.

Anh ta nên đủ quen thuộc với vấn đề nghiên cứu của mình hoặc đối tượng điều tra để có thể đưa ra các bảng sẽ cung cấp câu trả lời cho các câu hỏi làm phát sinh nghiên cứu. Nhà nghiên cứu sẽ có thể chuẩn bị các kế hoạch lập bảng đầy đủ nếu anh ta sử dụng các kết quả từ các nghiên cứu trước đó có các yếu tố chung với kế hoạch được vẽ.

Trong các nghiên cứu thăm dò, một quy trình tốt hơn và an toàn hơn là giả định công cụ thu thập dữ liệu trên một mẫu dân số thuộc loại sẽ được đề cập trong nghiên cứu cuối cùng. Bằng cách này, một số manh mối liên quan đến loại bảng nào sẽ có ý nghĩa nói chung có thể thu được.

Việc lập bảng, có thể được thực hiện hoàn toàn bằng phương pháp thủ công; điều này được gọi là lập bảng tay. Ngoài ra, nó có thể được thực hiện bằng các phương pháp cơ học sử dụng máy điện tự động và nhanh cho phần lớn dữ liệu, quá trình này được gọi là lập bảng cơ học.

Nhà nghiên cứu phải quyết định trước khi anh ta vạch ra kế hoạch lập bảng chi tiết cho nghiên cứu của mình, anh ta sẽ sử dụng phương pháp lập bảng nào. Quyết định này sẽ dựa trên những cân nhắc khác nhau như chi phí, thời gian, nhân sự, v.v.

Cả việc lập bảng bằng tay cũng như các quy trình lập bảng cơ học đều có những ưu điểm và hạn chế tương ứng. Cảnh báo của các nhà nghiên cứu về những ưu điểm và nhược điểm này là một cách tốt hơn để quyết định phương pháp nào sẽ phù hợp với vấn đề của anh ta.

Chúng tôi sẽ xem xét ngắn gọn giá trị của hai phương pháp lập bảng này:

(1) Lập bảng cơ học bao gồm nhiều công việc văn thư và hoạt động chuyên ngành. Tất nhiên, nó tạo điều kiện cho tốc độ nhưng tốc độ có thể không phải lúc nào cũng là một sự bù đắp thỏa đáng cho công việc văn thư thêm.

(2) Nếu số lượng và loại bảng mong muốn không được quyết định trước khi bắt đầu công việc lập bảng, . lập bảng máy có thể là nhanh chóng hơn. Nhưng, nếu lập bảng bằng tay được coi là hiệu quả, thứ tự sắp xếp các loại và số lượng khác nhau sẽ được xác định trước khi lập bảng.

(3) Một lợi thế lớn của việc lập bảng máy là nó tạo điều kiện phân loại chéo. Trong các nghiên cứu quy mô lớn, nơi có nhiều biến số được tương quan hoặc phân loại chéo, lập bảng máy là hợp lý hơn.

Vì lý do này, việc lập bảng cơ học được sử dụng trong các nghiên cứu đòi hỏi nhiều mối tương quan giữa các biến. Nhưng, nếu tổng số người trả lời là nhỏ, việc đếm thủ công theo nguyên tắc phân loại chéo có thể tương đối kinh tế.

(4) Khi có rất nhiều thông tin được mã hóa và một số thẻ đục lỗ cần thiết cho mỗi trường hợp, việc lập bảng bằng tay có thể được ưa thích hơn.

(5) Nếu muốn giữ dữ liệu ở dạng sẵn sàng cho việc lập bảng mới với thẻ đục lỗ thông báo tương đối ngắn thường hữu ích. Lập bảng cơ học là hữu ích cho các nghiên cứu hoặc khảo sát định kỳ trong đó cùng loại thông tin được yêu cầu phải được thu thập trong khoảng thời gian thường xuyên.

(6) Quá trình phân loại và đếm ít có khả năng gây ra lỗi nếu được thực hiện bằng máy hơn là thực hiện bằng tay. Lỗi, tất nhiên, có thể và phát sinh trong lập bảng máy và khi chúng xảy ra, chúng thường rất khó xác định và kiểm tra.

Bất kỳ lỗi nào được phát hiện ở giai đoạn mã hóa, chỉnh sửa hoặc công việc hiện trường của khảo sát đều có thể cản trở công việc lập bảng máy. Do đó, nó thường được mong muốn để tiến hành lập bảng tay cùng với công việc hiện trường.

(7) Chi phí cho hoạt động lập bảng là mối quan tâm quan trọng của nhà nghiên cứu. Việc lập bảng máy thường liên quan đến chi phí lớn hơn nhiều vì hầu hết các thẻ đục lỗ, phí bấm lỗ và xác minh, phí máy phân loại và lập bảng và chi phí thuê dịch vụ chuyên biệt của các loại vận hành máy cụ thể thường tăng thêm nhiều hơn so với các dịch vụ liên quan trong tay lập bảng.

(8) Một cân nhắc quan trọng khác là thời gian. Trong lập bảng cơ học, công việc lập bảng như vậy được thực hiện trong một thời gian rất ngắn, nhưng các giai đoạn chuẩn bị cũng như đào tạo, giám sát và có thể không có sẵn một số loại máy cho thuê dẫn đến việc trật tự công việc chắc chắn có thể góp phần gây lãng phí của thời gian

(9) Những cân nhắc về sự thuận tiện khó có thể bỏ qua. Nếu lập bảng cơ học yêu cầu gửi dữ liệu thô đến một số văn phòng ở xa văn phòng dự án, thì sự bất tiện liên quan đến việc đóng gói, vận chuyển, v.v.

(10) Cuối cùng, số lượng tài liệu bình luận được ghi lại và phân tích cũng có thể ảnh hưởng đến việc lựa chọn phương pháp lập bảng. Trong một số khảo sát ý kiến, ý kiến ​​nguyên văn của người cung cấp thông tin là quan trọng. Chỉ riêng thẻ mã được sử dụng trong lập bảng tay có thể cung cấp không gian cho những nhận xét hoặc nhận xét như vậy.

Máy xử lý công việc lập bảng có nhiều loại. Sự phát triển trong lĩnh vực này đã vô cùng nhanh chóng trong những năm gần đây. Một số máy chỉ đơn giản là sắp xếp và đếm thẻ, số khác sắp xếp, đếm và in kết quả, vẫn còn những máy khác được trang bị để thực hiện hầu hết các hoạt động thống kê hoặc tính toán phức tạp.

Những máy được đề cập cuối cùng này cực kỳ phức tạp và chúng phải được lập trình cho một hoạt động nhất định bởi một chuyên gia trong dây chuyền. Bảng là một triển lãm của dữ liệu số được sắp xếp một cách có hệ thống trong các cột có nhãn (dọc) và hàng (ngang).

Bảng đơn giản hoặc sơ cấp cho biết số lượng tần số đơn giản mà các loại khác nhau trong mỗi bộ xuất hiện trong dữ liệu, ví dụ: số người trong mẫu đã học trung học nhưng không qua, số người đã tham dự đại học nhưng không tốt nghiệp và như vậy. Bảng được đưa ra dưới đây chỉ đơn giản chỉ ra tần suất truy cập của năm mươi người trả lời cho rạp chiếu phim.

Trong nghiên cứu, chúng tôi thường quan tâm đến việc tìm ra mối tương quan giữa hai hoặc nhiều biến số, ví dụ: giáo dục và thu nhập và khả năng sinh sản, các bảng đơn giản (minh họa ở trên) cho thấy phân phối tần suất của người trả lời theo một đặc điểm duy nhất, ví dụ: giáo dục hoặc thu nhập hoặc khả năng sinh sản, không giúp chúng ta thấy mối quan hệ giữa hai hoặc nhiều biến.

Cách để xem mối quan hệ là bằng cách chuẩn bị các bảng chéo hoặc bảng phân tích. Các bảng như vậy có thể phân nhóm các trường hợp xảy ra chung trong hai hoặc nhiều loại, ví dụ, lập bảng số lượng các trường hợp có trình độ học vấn cao, thu nhập thấp và có từ 2 đến 3 trẻ em hoặc số trường hợp trình độ học vấn thấp, thu nhập thấp và có từ 4 đến 5 trẻ em, v.v. Hình thức cơ bản nhất của bảng chéo mà học sinh quen thuộc là bảng thời gian học đại học.

Giả sử một nhà nghiên cứu muốn thấy mối quan hệ giữa ba biến số, viz., Nghề nghiệp, thu nhập và khả năng sinh sản. Anh ta phải sử dụng một sơ đồ lập bảng sẽ đủ khả năng cho tất cả các kết hợp có thể có của các loại khác nhau của ba biến này.

Việc lập bảng chéo dữ liệu trên một mẫu giả thuyết gồm 100 người có thể được trình bày như sau:

Trong bảng trên, chúng tôi đã chỉ ra số lượng trẻ em trong các hàng. Biến số sinh này đã được chia thành năm loại, tức là không có vấn đề, 1 đến 2 vấn đề, 3 đến 4, 5 đến 6, 7 trở lên. Vì vậy, ở lề bên trái, chúng ta có 5 loại khả năng sinh sản này. Chúng tôi đã chỉ ra thu nhập của 100 người trả lời trong các cột.

Biến thu nhập đã được chia thành năm loại, tức là, dưới rupee, R.201-400, 401-600, 601-800, 801-1000. Như vậy, chúng ta có năm cột tương ứng với các loại này.

Một lần nữa vì chúng ta có thêm một biến số, tức là nghề nghiệp để phù hợp, các cột cho thu nhập từng được chia thành hai phần tương ứng với hai loại trong đó các nghề nghiệp đã được chia, tức là nghề nghiệp cổ trắng và nghề nghiệp cổ áo xanh .

Như vậy, chúng ta có mười cột dọc, tương ứng với thu nhập và nghề nghiệp. Số lượng hàng ngang chúng ta có cho các loại biến số sinh là năm. Như vậy, chúng ta có mười cột được bắt chéo bởi năm hàng tạo thành phần thân của bảng.

Giao điểm của các cột và hàng đã ảnh hưởng đến 50 (năm mươi) ô hoặc hộp. Mỗi hộp hoặc ô này chứa một số trường hợp cụ thể khác với các ô trong các ô khác về thu nhập hoặc nghề nghiệp, về khả năng sinh sản hoặc trong bất kỳ hai trong số này hoặc trong tất cả các trường hợp này. Chúng ta hãy đọc bảng để có một số ý tưởng về những gì nó đại diện.

Trong tổng số 100 trường hợp mẫu, có 25 người có từ 3 đến 4 vấn đề. Trong số 25 người này, đọc từ phía bên tay trái, 5 người (có từ 3 đến 4 trẻ em) có thu nhập dưới 300 rupee / - và được tuyển dụng trong các ngành nghề cổ trắng.

Hai người (có từ 3 đến 4 trẻ em) có thu nhập dưới 300 rupee và được làm việc trong các ngành nghề cổ áo xanh. Bây giờ chúng ta hãy đi hàng thứ hai. Trong tổng số người được hỏi, 38 người có từ 1 đến 2 con. 11 (trong ô thứ 7) có từ 1 đến 2 con là từ nhóm thu nhập.601 rupee đến.800 rupee và được tuyển dụng trong nghề nghiệp cổ trắng.

Bài tập này cần làm rõ rằng lập bảng chéo là một bước thiết yếu trong việc khám phá hoặc kiểm tra mối quan hệ giữa các biến có trong dữ liệu.

Tabulation là một phương tiện để trình bày dữ liệu ở dạng tóm tắt theo cách tạo điều kiện cho các tính toán thống kê cần thiết. Tuy nhiên, dữ liệu có thể được trình bày theo những cách khác, tức là thay vì trình bày chúng dưới dạng bảng, nhà nghiên cứu có thể trình bày chúng dưới dạng sơ đồ hoặc đồ thị. Các biểu diễn sơ đồ hoặc đồ họa như vậy có giá trị dễ hiểu đối với người đọc ít hiểu biết.

Nhưng họ bị giới hạn rằng chúng không hữu ích như là một cơ sở cho các tính toán thống kê. Bây giờ chúng ta hãy tiến hành thảo luận về hoạt động tiếp theo, tức là phân tích thống kê dữ liệu. Tabulation là một điều kiện tiên quyết hoặc bước đầu tiên theo hướng này.

Bước # 4. Phân tích thống kê dữ liệu :

Trong nghiên cứu, chúng tôi không quan tâm đến từng người trả lời. Mục đích nghiên cứu rộng hơn thế này. Đó là, chúng tôi muốn biết nhiều hơn chỉ đơn giản là một người được hỏi, chẳng hạn, có thái độ cực kỳ thuận lợi đối với việc giải trừ quân bị và rằng một người trả lời khác có thái độ bất lợi vừa phải đối với cùng một vấn đề. Nhưng thông tin này là không đủ.

Các nghiên cứu khoa học xã hội thường hướng tới việc cung cấp thông tin về một nhóm người trả lời cụ thể chủ yếu thông qua một mẫu. Mẫu của tổng số có thể được hỏi một số câu hỏi nhất định liên quan đến vấn đề nghiên cứu của chúng tôi, hoặc phải chịu một số hình thức quan sát.

Chúng ta hãy giả sử rằng chúng ta đã hỏi một mẫu của một ngàn sinh viên đại học đang học trong các lớp 'sau đại học' một loạt các câu hỏi nhằm đảm bảo thông tin về thói quen học tập của họ. Do đó, nghiên cứu của chúng tôi sẽ được hướng tới việc cung cấp thông tin về 'dân số' sinh viên 'sau đại học' trong đó hàng nghìn trường hợp là một mẫu.

Là một bước cần thiết để mô tả 'dân số' này, chúng tôi sẽ phải mô tả hoặc tóm tắt thông tin về thói quen học tập mà chúng tôi đã thu được trên mẫu. Tabulation chỉ là một phần của bước này. Ngoài ra, chúng tôi phải ước tính độ tin cậy của các khái quát về 'dân số' từ dữ liệu thu được. Phương pháp thống kê rất hữu ích trong việc thực hiện cả hai kết thúc này.