Python导入csv文件
目录
Python导入csv文件
共有三种方法,分别是通过标准的库函数、通过Numpy、通过Pandas。
1.通过标准Python库导入csv文件
Python提供了一个标准的类库CSV文件。这个类库中的reader()函数用来导入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个NumPy数组,用来训练算法模型。
from csv import reader
import numpy as np
filename = '文件名'
with open(filename, 'rt', encoding='UTF-8') as raw_data:
readers = reader(raw_data, delimiter=',')
x = list(readers)
data = np.array(x)
print(data)
print(data.shape)
2.通过NumPy导入csv文件
也可以使用NumPy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型是一样的。
from numpy import loadtxt
filename = '文件名'
with open(filename, 'rt', encoding='UTF-8') as raw_data:
data = loadtxt(raw_data, delimiter=',') # 数据类型必须一样,如果有列名,会报错
print(data)
3.通过Pandas导入csv文件
通过Pandas来导入CSV文件要使用
pandas.read_csv()
函数。这个函数的返回值是DataFrame,可以很方便的进行下一步的处理,实际操作过程中推荐使用这种方法。
在机器学习的项目中,经常利用Pandas来做数据清洗与数据准备工作。
from pandas import read_csv
filename = "文件名"
data = read_csv(filename)
print(data)