代码收藏家技术教程 2023-05-28

避免覆盖原有数据：使用df.to_excel写入新数据

默认情况下，如果使用 Pandas 的 to_excel() 方法将数据写入 Excel 文件时，会覆盖原有的数据。但是，你可以通过传递一些可选参数来更改此行为，具体如下：

startrow 和 startcol 参数：这两个参数可以控制将 DataFrame 数据写入 Excel 文件的起始行和列。通过设置它们的值，可以将数据写入现有表格中而不是覆盖原有数据。

mode 参数：该参数默认值为 'w'，表示以写入模式打开文件，会覆盖原有的数据；如果将其设置为 'a'，则会在现有数据的末尾添加新的数据。

例如，以下代码片段展示了如何将 DataFrame 数据写入 Excel 文件的第二行第一列，而不是覆盖原有数据：

import pandas as pd

# 读取现有数据
existing_data = pd.read_excel('existing_data.xlsx')

# 准备要写入的新数据
new_data = pd.DataFrame([['John', 32], ['Sara', 28]], columns=['Name', 'Age'])

# 将新数据添加到现有数据的末尾
combined_data = existing_data.append(new_data)

# 将数据写入 Excel 文件的第二行第一列
writer = pd.ExcelWriter('combined_data.xlsx')
combined_data.to_excel(writer, startrow=1, startcol=0)
writer.save()

在上面的代码中，首先从名为 existing_data.xlsx 的 Excel 文件中读取现有的数据。然后，准备要添加到现有数据的末尾的新数据，并将其添加到 existing_data DataFrame 中，得到 combined_data DataFrame 。最后，使用 to_excel() 方法将合并后的数据写入名为 combined_data.xlsx 的 Excel 文件的第二行第一列。使用 writer.save() 将更改保存到文件中。

如果将其设置为 'a'，则会在现有数据的末尾添加新的数据

combined_data.to_excel('combined_data.xlsx', index=False, mode='a')

报错

FutureWarning: save is not part of the public API, usage can give unexpected results and will be removed in a future version writer.save()

这个警告信息是因为 writer.save() 不是 pandas 的公共 API 的一部分，而是其内部的处理逻辑。将来的版本中可能会删除此特性或更改其使用方法。

这意味着，虽然目前使用 writer.save() 可以成功将数据写入文件，但这种写法在未来的版本中可能会失效。建议使用更稳定、更可靠的方法来保存数据。

例如，可以使用 Python 的 with 语句和 Pandas 的 ExcelWriter 来打开和保存文件，这样就不需要显式调用 save() 方法了。以下是一个示例代码：

python
import pandas as pd

# 准备数据
data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 创建 ExcelWriter 对象
with pd.ExcelWriter('example.xlsx') as writer:
    # 写入数据
    data.to_excel(writer, index=False, sheet_name='Sheet1')

述代码中，首先准备了一个数据 DataFrame，然后使用 with 语句创建了一个 ExcelWriter 对象，to_excel() 方法将数据写入工作簿中。 index 参数设置为 False 表示不包含行索引。使用 with 语句，可以有效地管理文件句柄，并确保在退出代码块时安全地关闭文件。