目录

一:函数介绍

二:实例

2.1 直接处理数组或列表数

2.2 间接处理:不改变原数据(对数组下标的处理)

2.3 实例:鸢尾花数据中对鸢尾花的随机打乱(可以直接用)


一:函数介绍

np.random.permutation() 总体来说他是一个随机排列函数,就是将输入的数据进行随机排列,官方文档指出,此函数只能针对一维数据随机排列,对于多维数据只能对第一维度的数据进行随机排列。

简而言之:np.random.permutation函数的作用就是按照给定列表生成一个打乱后的随机列表

在处理数据集时,通常可以使用该函数进行打乱数据集内部顺序,并按照同样的顺序进行标签序列的打乱。

二:实例

2.1 直接处理数组或列表数

import numpy as np

data = np.array([1,2,3,4,5,6,7])
a = np.random.permutation(data)
b = np.random.permutation([5,0,9,0,1,1,1])
print(a)
print( "data:", data )
print(b)

2.2 间接处理:不改变原数据(对数组下标的处理)

label = np.array([1,2,3,4,5,6,7])
a = np.random.permutation(np.arange(len(label)))
print("Label[a] :" ,label[a] )

补:一般只能用于N维数组 只能将整数标量数组转换为标量索引

why?label1[a1]  label1是列表,a1是列表下标的随机排列 但是! 列表结构没有标量索引 label1[a1]报错

label1=[1,2,3,4,5,6,7]
print(len(label1))

a1 = np.random.permutation(np.arange(len(label1)))#有结果

print(a1)

print("Label1[a1] :" ,label1[a1] )#这列表结构没有标量索引 所以会报错

2.3 实例:鸢尾花数据中对鸢尾花的随机打乱(可以直接用)

from sklearn import svm
from sklearn import datasets #sklearn 的数据集
iris = datasets.load_iris()
iris_x = iris.data
iris_y = iris.target
indices = np.random.permutation(len(iris_x))

#此时 打乱的是数组的下标的排序
print(indices)
print(indices[:-10])#到倒数第10个为止
print(indices[-10:])#最后10个

# print(type(iris_x))   <class 'numpy.ndarray'>

#9:1分类
#iris_x_train = iris_x[indices[:-10]]#使用的数组打乱后的下标
#iris_y_train = iris_y[indices[:-10]]
#iris_x_test= iris_x[indices[-10:]]
#iris_y_test= iris_y[indices[-10:]]    

数组下标 即标量索引的重新分布情况: 下标是0开始

物联沃分享整理
物联沃-IOTWORD物联网 » np.random.permutation 函数

发表评论