老司机 发表于 2021-2-25 05:41:48

pandas读取csv处理时报错:ParserError: Error tokenizing data. C error:...

csv文件默认的是以逗号为分隔符,但是中文中逗号的使用率很高,爬取中文数据时就容易造成混淆,所以使用pandas写入csv时可以设置参数 sep=’\t’ ,即以tab为分隔符写入。毕竟tab在中文习惯里用的很少嘛。
那这样在后面读取csv进行数据处理时,一定记得加上一个参数delimiter:

delimiter="\t"
#这样读入:
df=pd.read_csv('path',delimiter="\t")

不然你把dataframe打印出来看看就是挤在一团,没有分列的,后面对csv进行处理的时候还可能会出现标题那样的错误

ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2
页: [1]
查看完整版本: pandas读取csv处理时报错:ParserError: Error tokenizing data. C error:...