Python数据处理——去除 NaN 值

Python数据处理——去除 NaN 值

1、NaN 的定义

NaN 即 Not A Number 的缩写,表示不是一个数字。NaN 值是在进行数学计算时出现的一种特殊值,通常出现在计算过程中出现了错误或无法计算的情况下。

2、处理方法

  • 使用 dropna() 方法删除 NaN 值所在的行或列
1
2
3
4
5
6
7
8
9
10
import pandas as pd
import numpy as np

# 读取Excel文件
file_path = 'singleCoal.xlsx'
df = pd.read_excel(file_path)

df.dropna() # 删除包含 NaN 值的行

df.dropna(axis='columns') # 删除包含 NaN 值的列,需要加上 axis 参数
  • 使用 fillna() 方法填充 NaN 值
1
2
3
4
5
df.fillna(value=0)  # 将 NaN 值填充为 0

#使用 method 参数指定使用哪种方法进行填充
df.fillna(method="ffill") # 前向填充
df.fillna(method="bfill") # 后向填充
  • 使用 interpolate() 方法插值填充 NaN 值
1
2
3
4
5
df.interpolate()  # 使用默认方式进行插值填充

df.interpolate(method="linear") # 线性插值
df.interpolate(method="polynomial", order=2) # 二次插值
df.interpolate(method="spline", order=2) # 样条插值

Python数据处理——去除 NaN 值
http://example.com/2023/09/18/python/
作者
Z Z
发布于
2023年9月18日
许可协议