首页 技术 正文
技术 2022年11月19日
0 收藏 435 点赞 2,654 浏览 790 个字

当使用pd.read_csv()方法读取csv格式文件的时候,常常会因为csv文件中带有中文字符而产生字符编码错误,造成读取文件错误,在这个时候,我们可以尝试将pd.read_csv()函数的encoding参数设置为”gbk”或者”utf-8″。(这个方法在上一篇博客有介绍)

据我个人经验总结(如果有错误,还希望大神斧正),在含有中文编码的情况下,to_csv()方法的encoding参数默认为”gbk”,而read_csv()方法的encoding参数默认为”utf-8″,所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。

下面来谈谈出现编码错误的原因。

原来当我们将pandas的DataFrame对象转化为csv格式文件写入硬盘的时候调用的to_csv()函数可以接受一个encoding参数(这个encoding参数决定了写入csv文件所用的编码方式)。同样的,当我们调用pd.read_csv()函数来讲csv文件读取成DataFrame对象的时候,也要传入一个与之对应的encoding参数,如下代码例子(这里的encoding编码格式设置为”utf-8″):

pandas中DataFrame对象to_csv()方法中的encoding参数

 1 import pandas as pd
2 import numpy as np
3
4 head = ["表头1" , "表头2" , "表头3"]
5 l = [[1 , 2 , 3],[4,5,6] , [8 , 7 , 9]]
6 df = pd.DataFrame (l , columns = head)
7 df.to_csv ("testfoo.csv" , encoding = "utf-8") 
8
9 df2 = pd.read_csv ("testfoo.csv" , encoding = "utf-8")
10 print (df2)

pandas中DataFrame对象to_csv()方法中的encoding参数

结果如下:

   Unnamed: 0  表头1  表头2  表头3
0 0 1 2 3
1 1 4 5 6
2 2 8 7 9
相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:9,034
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,520
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,368
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,149
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:7,782
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:4,863