Python实战:对鸢尾花数据集中的萼片和花瓣长度进行排序、去重和统计分析

1.导入数据
import numpy as np
import csv
2.获取数据
iris_data=[]
with open("iris.csv") as csvfile:
    csv_reader=csv.reader(csvfile)  #用csv.reader读取csvfile文件
    birth_header=next(csv_reader)   #读取第一行各列标题
    for row in csv_reader:
        iris_data.append(row)
3.数据清理,去掉索引号
iris_list=[]
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list
4.数据统计
(1)创建数据类型
datatype=np.dtype([("Sepal.Length",np.str_,40),
                   ("Sepal.Width",np.str_,40),
                   ("Petal.Length",np.str_,40),
                   ("Petal.Width",np.str_,40),
                   ("Species",np.str_,40)])
datatype
(2)创建二维数组
iris_data=np.array(iris_list,dtype=datatype)
iris_data
(3)将待处理数据的类型转化为float类型
PetalLength=iris_data["Petal.Length"].astype(float)
PetalLength
(4)排序
np.sort(PetalLength)
(5)数据去重
np.unique(PetalLength)
(6)对指定列求和、均值、标准差、方差、最小值及最大值
print("sum:",np.sum(PetalLength))
print("mean:",np.mean(PetalLength))
print("std:",np.std(PetalLength))
print("var:",np.var(PetalLength))
print("min:",np.min(PetalLength))
print("max:",np.max(PetalLength))

运行结果如下:

 

 

物联沃分享整理
物联沃-IOTWORD物联网 » Python实战:对鸢尾花数据集中的萼片和花瓣长度进行排序、去重和统计分析

发表评论