Module statistics trong Python

Phân tích số liệu thống kê giúp chúng ta hiểu được toàn bộ thông tin. Điều này ứng dụng trong rất nhiều lĩnh vực như thống kê sinh vật học và phân tích kinh doanh. Nhận ra những nhu cầu này, Python đã cung cấp cho chúng ta module statistics. Để tìm hiểu rõ hơn về nó, mời bạn đọc tham khảo bài viết dưới đây.

Module statistics trong Python

Module statistics trong Python cung cấp các hàm để thống kê toán học của dữ liệu số. Có một số hàm thống kê phổ biến được định nghĩa trong Module này.

1. Hàm statistics.mean()

Hàm mean() được sử dụng để tính giá trị trung bình số học của các số trong danh sách.

import statistics   
# danh sách số nguyên dương
datasets = [1, 2, 7, 4, 2, 6, 8, 10]    
x = statistics.mean(datasets)    
# In giá trị trung bình của danh sách 
print("Giá trị trung bình của datasets là:", x) 

Kết quả:

Giá trị trung bình của datasets là: 5

2. Hàm statistics.median()

Hàm median() được sử dụng để trả về giá trị giữa của dữ liệu số trong danh sách.

import statistics    
datasets = [4, -5, 6]     
print("Giá trị median của datasets là : % s " % (statistics.median(datasets)))

Kết quả:

Giá trị median của datasets là : 4 

3. Hàm statistics.mode()

Trả về phần tử xuất hiện nhiều lần nhất trong danh sách.

import statistics
dataset =[2, 4, 7, 7, 2, 2, 3, 6, 6, 8]
print("Phần tử xuất hiện nhiều nhất là: % s" % (statistics.mode(dataset)))

Kết quả:

Phần tử xuất hiện nhiều nhất là 2

4. Hàm statistics.stdev()

Hàm stdev() được sử dụng để tính độ lệch chuẩn trên một mẫu nhất định có sẵn ở dạng danh sách.

import statistics 
sample = [7, 8, 9, 10, 11]
print("Độ lệch chuẩn là: % s " % (statistics.stdev(sample)))

Kết quả:

Độ lệch chuẩn là: 1.5811388300841898 

5. Hàm statistics.median_low()

Hàm median_low() được sử dụng để trả về giá trị trung bình thấp của dữ liệu số trong danh sách.

import statistics    
set1 = [4, 6, 2, 5, 7, 7]    
print("Giá trị trung bình thấp của data-set là: % s "
      % (statistics.median_low(set1)))

Kết quả:

Giá trị trung bình thấp của data-set là: 5 

6. Hàm statistics.median_high()

Hàm median_high() được sử dụng để trả về giá trị trung bình cao của dữ liệu số trong danh sách.

mport statistics
# list of set of the integers
dataset = [2, 1, 7, 6, 1, 9]
print("Giá trị trung bình cao của data-set là: %s " %
  (statistics.median_high(dataset)))

Kết quả:

Giá trị trung bình cao của data-set là: 6 

Trên đây là bài viết của eLib.VN về Module statistics trong Python. Hy vọng qua bài này bạn sẽ hiểu và vận dụng trong quá trình học tập và làm việc với Python. Chúc các bạn thành công!

Ngày:26/10/2020 Chia sẻ bởi:

CÓ THỂ BẠN QUAN TÂM