避免覆盖原有数据:使用df.to_excel写入新数据
默认情况下,如果使用 Pandas 的 to_excel()
方法将数据写入 Excel 文件时,会覆盖原有的数据。但是,你可以通过传递一些可选参数来更改此行为,具体如下:
startrow
和 startcol
参数:这两个参数可以控制将 DataFrame 数据写入 Excel 文件的起始行和列。通过设置它们的值,可以将数据写入现有表格中而不是覆盖原有数据。
mode
参数:该参数默认值为 'w'
,表示以写入模式打开文件,会覆盖原有的数据;如果将其设置为 'a'
,则会在现有数据的末尾添加新的数据。
例如,以下代码片段展示了如何将 DataFrame 数据写入 Excel 文件的第二行第一列,而不是覆盖原有数据:
import pandas as pd
# 读取现有数据
existing_data = pd.read_excel('existing_data.xlsx')
# 准备要写入的新数据
new_data = pd.DataFrame([['John', 32], ['Sara', 28]], columns=['Name', 'Age'])
# 将新数据添加到现有数据的末尾
combined_data = existing_data.append(new_data)
# 将数据写入 Excel 文件的第二行第一列
writer = pd.ExcelWriter('combined_data.xlsx')
combined_data.to_excel(writer, startrow=1, startcol=0)
writer.save()
在上面的代码中,首先从名为 existing_data.xlsx
的 Excel 文件中读取现有的数据。然后,准备要添加到现有数据的末尾的新数据,并将其添加到 existing_data
DataFrame 中,得到 combined_data
DataFrame 。最后,使用 to_excel()
方法将合并后的数据写入名为 combined_data.xlsx
的 Excel 文件的第二行第一列。使用 writer.save()
将更改保存到文件中。
如果将其设置为 'a'
,则会在现有数据的末尾添加新的数据
combined_data.to_excel('combined_data.xlsx', index=False, mode='a')
报错
FutureWarning: save is not part of the public API, usage can give unexpected results and will be removed in a future version writer.save()
这个警告信息是因为 writer.save()
不是 pandas
的公共 API 的一部分,而是其内部的处理逻辑。将来的版本中可能会删除此特性或更改其使用方法。
这意味着,虽然目前使用 writer.save()
可以成功将数据写入文件,但这种写法在未来的版本中可能会失效。建议使用更稳定、更可靠的方法来保存数据。
例如,可以使用 Python 的 with
语句和 Pandas 的 ExcelWriter
来打开和保存文件,这样就不需要显式调用 save()
方法了。以下是一个示例代码:
python
import pandas as pd
# 准备数据
data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# 创建 ExcelWriter 对象
with pd.ExcelWriter('example.xlsx') as writer:
# 写入数据
data.to_excel(writer, index=False, sheet_name='Sheet1')
述代码中,首先准备了一个数据 DataFrame,然后使用 with
语句创建了一个 ExcelWriter
对象,to_excel()
方法将数据写入工作簿中。 index
参数设置为 False
表示不包含行索引。使用 with
语句,可以有效地管理文件句柄,并确保在退出代码块时安全地关闭文件。