Numpy & Pandas技巧

HuahuatiiAbout 1 min数据处理pythonNumpy

Numpy

np.random.shuffle():改变原始数组的顺序,使得数组中的元素随机打乱,从而实现随机采样等操作。

np.random.shffle()
import numpy as np

# 创建一个一维数组
a = np.array([1, 2, 3, 4, 5])

# 将数组中的元素随机排列
np.random.shuffle(a)

# 打印排列后的数组
print(a)

Pandas

dataframe.index.intersection():方法返回两个 Index 对象的交集。返回一个包含两个 Index 对象中共同存在的标签的新 Index 对象;

dataframe.index.difference():方法返回两个 Index 对象的差集。返回一个包含存在于第一个 Index 对象中但不存在于第二个 Index 对象中的标签的新 Index 对象。

dataframe.index.intersection() & dataframe.index.difference()
import pandas as pd

# 创建两个 Index 对象
index1 = pd.Index(['A', 'B', 'C', 'D', 'E'])
index2 = pd.Index(['B', 'D', 'F', 'H', 'J'])

# 获取它们的交集
intersection = index1.intersection(index2)
print(intersection) # Index(['B', 'D'], dtype='object')

# 获取它们的差集
difference = index1.difference(index2)
print(difference) # Index(['A', 'C', 'E'], dtype='object')

参考资料

https://www.numpy.org.cn/reference/——Numpy官方文档open in new window

举个例子,我有10个样本,类别分别是[‘A’, ‘A’, ‘A’, ‘B’, ‘B’, ‘B’, ‘B’, ‘B’, ‘C’, ‘C’],使用KNN预测结果是[‘A’, ‘A’, ‘A’, ‘B’, ‘B’, ‘B’, ‘B’, ‘B’, ‘D’, ‘D’, ],然后我想输出结果的时候能够显示对于ABCD四个类的precision和recall的字典