共计 776 个字符,预计需要花费 2 分钟才能阅读完成。
在 Python 中,dropna() 函数用于删除包含缺失值的行或列。它可以应用于 Pandas 的 DataFrame 和 Series 对象。
当应用于 DataFrame 时,dropna() 函数将删除包含任何缺失值的行或列,默认情况下,它将删除包含任何 NaN 值的行。但是,您可以通过指定参数来自定义删除缺失值的方式。
当应用于 Series 时,dropna() 函数将删除包含缺失值的元素。
下面是 dropna() 函数的常用参数:
- axis:指定删除行还是列。默认为 0(删除行)。如果设定为 1,则删除列。
- how:指定删除的方式。可选的值有 {‘any’,‘all’}。默认为’any’,表示只要存在一个缺失值就删除,’all’表示只删除全部为缺失值的行 / 列。
- subset:指定在哪些列或行中删除缺失值。可以是一个标签列表或一个包含标签的字典。
- inplace:指定是否在原始数据上进行操作,默认为 False,表示返回一个新的对象。
下面是 dropna() 函数的几个示例:
import pandas as pd
# 创建一个包含缺失值的 DataFrame
data = {'A': [1, 2, np.nan], 'B': [4, np.nan, 6], 'C': [np.nan, 8, 9]}
df = pd.DataFrame(data)
# 删除包含缺失值的行
df.dropna()
# 删除包含缺失值的列
df.dropna(axis=1)
# 只删除全部为缺失值的行
df.dropna(how='all')
# 只删除指定列中包含缺失值的行
df.dropna(subset=['A', 'B'])
# 在原始数据上进行操作,而不返回新的对象
df.dropna(inplace=True)
丸趣 TV 网 – 提供最优质的资源集合!
正文完