(一)路径写法
filepath="C:\Users\python_study\test.csv" 或 'C:\Users\python_study\test.csv' (单双引号均可)
或 filepath=r"C:UsersDesktoppython_study est.csv"
或 filepath= "C:/Users/Desktop/python_study/test.csv"
(二)pandas函数
(1)pd.read_csv('data.csv',encoding = "utf-8",header = 0,names = range(0,50),index_col=0,keep_default_na=False)
header = 0 是默认情况(即不标明,默认就是header = 0),表示以数据的第一行为列索引;header=None即指明原始文件数据没有列索引,这样read_csv为自动加上列索引,除非你给定列索引的名字。
encoding = "utf-8" 表明以utf-8为编码规则。
names = range(0,50)) 表示以[0....49]为列索引的名字
index_col=0 表示以原有数据的第一列(索引为0)当作行索引。
keep_default_na=False 表示空值将变为null;
如果没有keep_default_na=False,加载后空值处就是NAN,且类似coupon_id(如:11002)等处的类型都是float,再者判断是否是NAN的话是:off_train.date!=off_train.date,结果是True即为NAN,否则是非空值!
如果使用了keep_default_na=False,会使coupon_id等字段的数据类型转化为object可以简单看作是字符串,空值变为null,这时候判断是否是空值便可用off_train.date=='null'!
更多参考:https://www.jianshu.com/p/9c12fb248ccc
示例代码:
import pandas as pd
import numpy as np
from datetime import date
import datetime as dt
import os
#源数据路径
DataPath = r'D:DesktopXGBoostDatadata_origin'
#预处理后数据存放路径
FeaturePath = r'D:DesktopXGBoostDatadata_preprocessed'
off_train.columns=['user_id','merchant_id','coupon_id','discount_rate','distance','date_received','date']
off_test = pd.read_csv(os.path.join(DataPath,'ccf_offline_stage1_test_revised.csv'),header=0,keep_default_na=False)
off_test.columns = ['user_id','merchant_id','coupon_id','discount_rate','distance','date_received']
print(off_train.info())
print(off_train.head(5)) #输出DataFrame的前五行,看读入数据是否与原数据一致,作为核查,很重要!
输出:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: entries, 0 to
Data columns (total 7 columns):
user_id int64
merchant_id int64
coupon_id object
discount_rate object
distance object
date_received object
date object
dtypes: int64(2), object(5)
memory usage: 93.7+ MB
None
user_id merchant_id coupon_id discount_rate distance date_received
0 2632 null null 0 null
1 4663 11002 150:20 1
2 2632 8591 20:1 0
3 2632 1078 20:1 0
4 2632 8591 20:1 0
date
0
1 null
2 null
3 null
4 null
点滴分享,福泽你我!Add oil!
https://blog.sciencenet.cn/blog-3428464-1248692.html
上一篇:ROC曲线
下一篇:正交矩阵(坐标变换)与奇异值分解SVD
到此这篇python函数的写法(python中函数怎么写)的文章就介绍到这了,更多相关内容请继续浏览下面的相关 推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/pythonbc/25801.html