目录

Python导入csv文件

Python导入csv文件

共有三种方法,分别是通过标准的库函数、通过Numpy、通过Pandas。

1.通过标准Python库导入csv文件

Python提供了一个标准的类库CSV文件。这个类库中的reader()函数用来导入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个NumPy数组,用来训练算法模型。

from csv import reader
import numpy as np
filename = '文件名'
with open(filename, 'rt', encoding='UTF-8') as raw_data:
    readers = reader(raw_data, delimiter=',')
    x = list(readers)
    data = np.array(x)
    print(data)
    print(data.shape)

2.通过NumPy导入csv文件

也可以使用NumPy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型是一样的。

from numpy import loadtxt
filename = '文件名'
with open(filename, 'rt', encoding='UTF-8') as raw_data:
    data = loadtxt(raw_data, delimiter=',')  # 数据类型必须一样,如果有列名,会报错
    print(data)

3.通过Pandas导入csv文件

通过Pandas来导入CSV文件要使用 pandas.read_csv() 函数。这个函数的返回值是DataFrame,可以很方便的进行下一步的处理,实际操作过程中推荐使用这种方法。

在机器学习的项目中,经常利用Pandas来做数据清洗与数据准备工作。

from pandas import read_csv
filename = "文件名"
data = read_csv(filename)
print(data)