教你用Python實(shí)現(xiàn)Excel表格處理
一、文件
一個(gè)測(cè)試有兩個(gè)sheet頁的Excel測(cè)試文件 test.xlsx


二、代碼
import pandas as pd
file1 = pd.ExcelFile('D:\\data\\py\\test.xlsx')
file2 = pd.read_excel('D:\\data\\py\\test.xlsx')
print(file)
<pandas.io.excel._base.ExcelFile object at 0x0000021DE525DF88> -----------------分割線--------------------- 姓名 年齡 性別 住址 0 張三7 男 NaN 1 李四6 男 NaN 2 王芳6 女 NaN
三、分析
pd.read_excel讀出來是一個(gè)dataframe可以直接打印出內(nèi)容,但是只能讀取一個(gè)sheet頁,默認(rèn)第一個(gè)sheet頁
@Appender(_read_excel_doc)
@deprecate_kwarg("skip_footer", "skipfooter")
def read_excel(
io,
sheet_name=0,
header=0,
names=None,
index_col=None,
usecols=None,
squeeze=False,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None,
nrows=None,
na_values=None,
keep_default_na=True,
verbose=False,
parse_dates=False,
date_parser=None,
thousands=None,
comment=None,
skip_footer=0,
skipfooter=0,
convert_float=True,
mangle_dupe_cols=True,
**kwds
):
for arg in ("sheet", "sheetname", "parse_cols"):
if arg in kwds:
raise TypeError(
"read_excel() got an unexpected keyword argument " "`{}`".format(arg)
)
if not isinstance(io, ExcelFile):
io = ExcelFile(io, engine=engine)
elif engine and engine != io.engine:
raise ValueError(
"Engine should not be specified when passing "
"an ExcelFile - ExcelFile already has the engine set"
)
return io.parse(
sheet_name=sheet_name,
header=header,
names=names,
index_col=index_col,
usecols=usecols,
squeeze=squeeze,
dtype=dtype,
converters=converters,
true_values=true_values,
false_values=false_values,
skiprows=skiprows,
nrows=nrows,
na_values=na_values,
keep_default_na=keep_default_na,
verbose=verbose,
parse_dates=parse_dates,
date_parser=date_parser,
thousands=thousands,
comment=comment,
skipfooter=skipfooter,
convert_float=convert_float,
mangle_dupe_cols=mangle_dupe_cols,
**kwds
)
pd.ExcelFile 返回值是一個(gè)Excel對(duì)象,不能直接用,但是可以讀取整個(gè)Excel內(nèi)容
四、pd.ExcelFile
file = pd.ExcelFile('D:\\data\\py\\test.xlsx')
sheet頁名稱
print(file.sheet_names)
['一年級(jí)', '二年級(jí)']
遍歷讀取每個(gè)sheet頁的內(nèi)容
for name in file.sheet_names: _df = pd.read_excel(file,name) print(_df)
姓名 年齡 性別 住址 0 張三7 男 NaN 1 李四6 男 NaN 2 王芳6 女 NaN 姓名 年齡 性別 0 李明8 男 1 劉敏8 女 2 張強(qiáng)7 男
將兩個(gè)sheet頁的內(nèi)容合并,并添加一列內(nèi)容為sheet頁名稱
df_list=[] for name in file.sheet_names: _df = pd.read_excel(file,name) _df['班級(jí)']=name df_list.append(_df) df = pd.concat([_df for _df in df_list],sort=False) print(df)
姓名 年齡 性別 住址班級(jí) 0 張三7 男 NaN 一年級(jí) 1 李四6 男 NaN 一年級(jí) 2 王芳6 女 NaN 一年級(jí) 0 李明8 男 NaN 二年級(jí) 1 劉敏8 女 NaN 二年級(jí) 2 張強(qiáng)7 男 NaN 二年級(jí)
忽略掉原來的index
df = pd.concat([_df for _df in df_list],ignore_index=True,sort=False) print(df)
姓名 年齡 性別 住址班級(jí) 0 張三7 男 NaN 一年級(jí) 1 李四6 男 NaN 一年級(jí) 2 王芳6 女 NaN 一年級(jí) 3 李明8 男 NaN 二年級(jí) 4 劉敏8 女 NaN 二年級(jí) 5 張強(qiáng)7 男 NaN 二年級(jí)
修改列名為英文
df = df.rename(columns={'姓名': 'name', '年齡': 'age', '性別': 'sex', '住址': 'address', '班級(jí)': 'class'})
print(df)
name age sex address class 0張三 7男NaN一年級(jí) 1李四 6男NaN一年級(jí) 2王芳 6女NaN一年級(jí) 3李明 8男NaN二年級(jí) 4劉敏 8女NaN二年級(jí) 5張強(qiáng) 7男NaN二年級(jí)
將df保存為CSV、Excel文件
df.to_csv('../data/sheet合并.csv',index=False)
df.to_excel('../data/sheet合并.xls',index=True)
五、總結(jié)
可以發(fā)現(xiàn)Python讀寫Excel文件還是很方便的!
/python/blob/master/data/sheet%E5%90%88%E5%B9%B6.xls)
df.to_csv('../data/sheet合并.csv',index=False)
df.to_excel('../data/sheet合并.xls',index=True)
到此這篇關(guān)于教你用Python實(shí)現(xiàn)Excel表格處理的文章就介紹到這了,更多相關(guān)Python處理Excel內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非maisonbaluchon.cn所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。
關(guān)注官方微信