Kỹ thuật sử dụng trong thống kê

Trong bài viết này, chúng tôi sẽ thảo luận về một số kỹ thuật thống kê. Một số kỹ thuật là: 1. Các biện pháp của xu hướng trung tâm 2. Tính biến đổi 3. Xác suất 4. Phân phối tần số 5. ​​Chuỗi thời gian.

Các biện pháp của xu hướng trung ương:

Trung bình:

Bất kỳ biện pháp thống kê nào đưa ra ý tưởng về vị trí của điểm xung quanh cụm quan sát khác được gọi là thước đo của xu hướng trung tâm. Phép đo được sử dụng phổ biến nhất là 'Trung bình' hoặc trung bình số học.

Thu nhập hàng ngày của hai công nhân trong một tuần như sau:

Công nhân thứ 1 70, 50, 100, 90, 50 Thu nhập trung bình = 76 Rupi

Công nhân thứ 2 200, 250, 50, 300, 150 Thu nhập trung bình = 190 Rupi

Do đó, từ ví dụ trên, chúng ta có thể kết luận rằng trung bình người lao động thứ hai kiếm được nhiều hơn người thứ nhất. Đối tượng tính trung bình - như người ta có thể dễ dàng nhìn thấy - là thay thế chuỗi các quan sát bằng một giá trị duy nhất, được coi là đại diện cho tất cả các quan sát. Từ ví dụ đã nêu ở trên, có thể thấy rằng giá trị trung bình số học là một giá trị gần giữa và một số quan sát lớn hơn nó trong khi một số nhỏ hơn.

Vì vậy, có thể nói rằng giá trị trung bình số học của các quan sát trên một biến được định nghĩa là tổng của các quan sát chia cho số lượng quan sát.

Đối với công nhân đầu tiên, giá trị trung bình số học đã được tính như sau:

(70 rupee + 50 + 100 + 90 + 50) 5 = 76 rupee

Ý nghĩa hình học (GM) Ý nghĩa hình học của một nhóm các quan sát được định nghĩa là gốc thứ n của sản phẩm của tất cả các quan sát. Giả sử các quan sát là x 1, x 2, x 3, Rọ, x n .

GM có thể được tính như sau:

Điều này có thể được tính toán với sự trợ giúp của một bảng nhật ký.

Chế độ:

Chế độ được định nghĩa là giá trị của các biến hoặc quan sát xảy ra thường xuyên nhất. Chẳng hạn, nếu các quan sát là Đích2, 9, 6, 2, 8, 2, 2, 7, 2 và 3, thì chế độ được xem là 2, xảy ra với số lần tối đa, tức là 5 lần

Trung bình:

Trung vị là giá trị của biến trung bình nhất, khi các quan sát được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Rõ ràng là một nửa các giá trị sẽ nhỏ hơn trung bình và một nửa các giá trị sẽ lớn hơn. Do đó, nếu các quan sát là 3, 9, 6, 4, 5, 7 và 10, sau đó sắp xếp các giá trị theo thứ tự tăng dần 3, 4, 5, 6, 7, 9 và 10, giá trị trung bình được xem là Quan sát thứ 4 và bằng 6.

Tuy nhiên, nếu số lượng quan sát là chẵn thì có hai giá trị trung gian và theo thông lệ là lấy giá trị trung bình số học của hai giá trị đó. Chẳng hạn, nếu quan sát 10 bị bỏ qua trong các biến trên, có hai giá trị trung bình nhất là 5 và 6 và giá trị trung bình là 5 + 6 2 = 5, 5.

Các công cụ thống kê quan trọng khác để đo lường và phân tích dữ liệu và yếu tố biến thiên trong đó bao gồm tính toán của (i) Phạm vi, (ii) Phạm vi bán tứ phân vị, (iii) Độ lệch tuyệt đối trung bình, (iv) Độ lệch chuẩn, (v) ) Phân phối tần số (cả Đối xứng và Không đối xứng).

Phân bố đối xứng được đặc trưng bởi sự tồn tại của một dòng đối xứng, chia biểu đồ thành hai phần và một phần là hình ảnh phản chiếu của phần kia. Tuy nhiên, hầu hết các phân phối trong thương mại và kinh tế không thuộc loại này. Phân phối bất đối xứng còn được gọi là phân phối lệch. Skewness có nghĩa là thiếu sự đối xứng và phân phối lệch được đặc trưng bởi một đuôi dài hơn ở một bên của biểu đồ.

Đo lường sự thay đổi:

Phương tiện số học và hình học hoặc trung bình là cơ sở để so sánh hai hoặc nhiều quần thể hoặc quan sát. Nhưng các biện pháp khác về độ biến thiên hoặc độ lệch cũng rất quan trọng trong việc thể hiện mức độ quan sát khác nhau. Trong thống kê, độ phân tán đồng nghĩa với độ biến thiên hoặc độ lệch.

Sau đây là các biện pháp quan trọng của sự thay đổi:

Phạm vi:

Sự khác biệt giữa các giá trị lớn nhất và nhỏ nhất của một tập hợp các quan sát được gọi là 'phạm vi'.

Phạm vi bán tứ phân :

Sự khác biệt giữa giá trị của các quan sát trong phần tư thứ 2 và thứ 3 được gọi là phạm vi bán phần tư. Điều này loại bỏ ảnh hưởng của các giá trị rất thấp và rất cao của các quan sát, rất ít về số lượng.

Có nghĩa là độ lệch tuyệt đối:

Độ lệch tuyệt đối trung bình có nghĩa là sự biến đổi của các quan sát từ trung bình số học của các quan sát.

Ví dụ: Các quan sát là x 1, x 2io x n và trung bình số học là x.

Công thức là:

và, do đó, trung bình là

Nhưng (x 1 - x̅) = 0, dù là giá trị của x 1, x 2, thì .x n

Do đó, công thức (x i - x̅) không thể được sử dụng làm thước đo độ biến thiên. Khó khăn này có thể tránh được nếu các dấu hiệu (+ hoặc -) bị bỏ qua. Điều này là hợp lý, vì dấu hiệu của một độ lệch cụ thể x i - x̅ chỉ cho biết quan sát x i, nằm bên trái của x hay bên phải của nó và điều này không liên quan đến việc tính toán độ lệch, từ điểm trung tâm (x), của bất kỳ quan sát.

Độ lệch chuẩn:

Độ lệch của các quan sát so với trung bình số học của chúng (x̅) có thể là dương (+) hoặc âm (-). Trong thống kê, các dấu hiệu sai lệch so với trung bình số học chỉ cho thấy hướng quan sát từ xu hướng trung tâm (x) và do đó bị bỏ qua. Cũng có thể tránh được các dấu âm (-) trong số độ lệch so với x nếu thay vì lấy các giá trị tuyệt đối, các bình phương của độ lệch được lấy như dưới đây:

Do số đo độ biến thiên phải ở cùng đơn vị với các quan sát ban đầu, độ lệch chuẩn được tính theo công thức sau:

Đối với phân phối tần số, với x 1 x 2, Hoài, x n là giá trị trung bình của các lớp và f 1 f 2, thì, f n là tần số, Độ lệch chuẩn (SD) được tính theo sự cải thiện sau của công thức trên:

Độ lệch chuẩn cho đến nay là thước đo biến thiên được sử dụng rộng rãi nhất trong thống kê. Nó có nhiều tính chất làm cho nó trở thành biện pháp ưa thích nhất trong các vấn đề thống kê.

Thí dụ:

Mức IQ của năm sinh viên ngành Quản trị kinh doanh như sau:

do đó, độ lệch chuẩn là: 13, 22

13, 22 là Độ lệch chuẩn được biểu thị theo cùng đơn vị với các quan sát. Giá trị 13, 22 là một điểm trên cùng một thang số.

Độ lệch chuẩn trên đã được tính toán từ phương sai của dân số 5 sinh viên. Tuy nhiên, trong thực tế, Độ lệch chuẩn thường không thể được tính từ dân số, vì phần lớn thời gian dân số quá lớn nên thường lấy mẫu cho mục đích tính toán độ lệch.

Đối với dữ liệu mẫu, độ biến thiên được đo bằng phương sai mẫu và độ lệch chuẩn được tính bằng cách sử dụng công thức sau:

Cần lưu ý, vì dữ liệu mẫu đã được sử dụng, 'n' biểu thị kích thước mẫu thay cho 'N' biểu thị mức độ quan sát của dân số.

Khái niệm về xác suất:

Thông thường, trong cuộc sống hàng ngày của chúng tôi, chúng tôi dự đoán một số sự kiện trong tương lai bằng những từ như - điều này có thể sẽ xảy ra ', ' khả năng điều này rất cao ', hoặc' điều này sẽ xảy ra trong mọi khả năng ', với một sự mơ hồ nhất định trong đó các câu lệnh. Những tuyên bố này chủ yếu ở mức độ chủ quan và chủ yếu phụ thuộc vào sức mạnh của chúng ta để phân tích các tình huống tương tự trong quá khứ. Tầm quan trọng của khái niệm xác suất của một sự kiện và một số phương tiện đo lường nó bằng các công cụ thống kê là vô cùng lớn đối với các ngân hàng thương mại.

Trong khi cho khách hàng vay tiền, nhân viên ngân hàng muốn biết xác suất vỡ nợ của khách hàng nói trên, được đo trên cơ sở nghiên cứu xác suất bằng các tính toán thống kê. Mặc dù khá khó để xác định chính xác xác suất ở cấp tiểu học, một nỗ lực có thể được thực hiện để dự báo tương tự bằng cách sử dụng các kỹ thuật của thí nghiệm ngẫu nhiên và xác định tần số.

Thử nghiệm ngẫu nhiên có nghĩa là một thử nghiệm có tất cả các kết quả có thể được biết và có thể được lặp lại trong các điều kiện giống hệt nhau, nhưng dự đoán chính xác về kết quả là không thể. Giá của một mặt hàng vào các ngày khác nhau có thể được coi là kết quả của một thử nghiệm ngẫu nhiên. Các kết quả thường sẽ được ký hiệu là E 1, E 2, E 3, E n và người ta cho rằng chúng là hữu hạn về số lượng.

Phân phối tần số:

Nếu kết quả E 1 xảy ra r lần khi thử nghiệm ngẫu nhiên được lặp lại n lần, thì xác suất của E 1 được xác định theo tỷ lệ 'r / n', vì số lần lặp lại tăng vô thời hạn. Do đó, xác suất được xác định là giới hạn tần số tương đối khi thử nghiệm được lặp lại với số lần vô hạn.

Chuỗi thời gian:

Một loạt các quan sát tại các thời điểm khác nhau trên một biến - phụ thuộc vào thời gian - tạo thành một chuỗi thời gian. Do đó, một loạt các quan sát như vậy đưa ra các thay đổi hoặc biến thể của một lượng trong một khoảng thời gian và thường được gọi là dữ liệu lịch sử hoặc theo thời gian. Đối với loại dữ liệu này, một trong các biến là thời gian được biểu thị bằng 't' và biến còn lại phụ thuộc vào thời gian được biểu thị bằng 'Yt.'

Ví dụ, năng suất cây trồng trong các mùa khác nhau, sản xuất thép trong các tháng khác nhau, xuất khẩu chè hàng quý, bán kem trong các tháng khác nhau trong năm, v.v ... Tất cả các ví dụ nêu trên đề cập đến một số hoạt động kinh tế hoặc kinh doanh và một loạt các quan sát về các biến như vậy thường được gọi là dữ liệu chuỗi thời gian kinh tế. Một ví dụ khác về dữ liệu chuỗi thời gian là lượng mưa tính bằng inch vào các ngày khác nhau trong năm.

Vì vậy, rõ ràng là bất kỳ biến nào, phụ thuộc vào thời gian, tạo thành dữ liệu chuỗi thời gian. Các kết luận có giá trị được rút ra bởi các bên quan tâm như cộng đồng doanh nghiệp, chủ ngân hàng, nhà công nghiệp, v.v., từ chuỗi thời gian dẫn đến đo lường xu hướng từ dữ liệu, ảnh hưởng đáng kể đến quyết định của họ.