避免覆盖原有数据:使用df.to_excel写入新数据

默认情况下,如果使用 Pandas 的 to_excel() 方法将数据写入 Excel 文件时,会覆盖原有的数据。但是,你可以通过传递一些可选参数来更改此行为,具体如下:

  • startrowstartcol 参数:这两个参数可以控制将 DataFrame 数据写入 Excel 文件的起始行和列。通过设置它们的值,可以将数据写入现有表格中而不是覆盖原有数据。

  • mode 参数:该参数默认值为 'w',表示以写入模式打开文件,会覆盖原有的数据;如果将其设置为 'a',则会在现有数据的末尾添加新的数据。

  • 例如,以下代码片段展示了如何将 DataFrame 数据写入 Excel 文件的第二行第一列,而不是覆盖原有数据:

    import pandas as pd
    
    # 读取现有数据
    existing_data = pd.read_excel('existing_data.xlsx')
    
    # 准备要写入的新数据
    new_data = pd.DataFrame([['John', 32], ['Sara', 28]], columns=['Name', 'Age'])
    
    # 将新数据添加到现有数据的末尾
    combined_data = existing_data.append(new_data)
    
    # 将数据写入 Excel 文件的第二行第一列
    writer = pd.ExcelWriter('combined_data.xlsx')
    combined_data.to_excel(writer, startrow=1, startcol=0)
    writer.save()

    在上面的代码中,首先从名为 existing_data.xlsx 的 Excel 文件中读取现有的数据。然后,准备要添加到现有数据的末尾的新数据,并将其添加到 existing_data DataFrame 中,得到 combined_data DataFrame 。最后,使用 to_excel() 方法将合并后的数据写入名为 combined_data.xlsx 的 Excel 文件的第二行第一列。使用 writer.save() 将更改保存到文件中。

    如果将其设置为 'a',则会在现有数据的末尾添加新的数据

    combined_data.to_excel('combined_data.xlsx', index=False, mode='a')

    报错

    FutureWarning: save is not part of the public API, usage can give unexpected results and will be removed in a future version writer.save()

    这个警告信息是因为 writer.save() 不是 pandas 的公共 API 的一部分,而是其内部的处理逻辑。将来的版本中可能会删除此特性或更改其使用方法。

    这意味着,虽然目前使用 writer.save() 可以成功将数据写入文件,但这种写法在未来的版本中可能会失效。建议使用更稳定、更可靠的方法来保存数据。

    例如,可以使用 Python 的 with 语句和 Pandas 的 ExcelWriter 来打开和保存文件,这样就不需要显式调用 save() 方法了。以下是一个示例代码:

    python
    import pandas as pd
    
    # 准备数据
    data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    
    # 创建 ExcelWriter 对象
    with pd.ExcelWriter('example.xlsx') as writer:
        # 写入数据
        data.to_excel(writer, index=False, sheet_name='Sheet1')

     述代码中,首先准备了一个数据 DataFrame,然后使用 with 语句创建了一个 ExcelWriter 对象,to_excel() 方法将数据写入工作簿中。 index 参数设置为 False 表示不包含行索引。使用 with 语句,可以有效地管理文件句柄,并确保在退出代码块时安全地关闭文件。

    物联沃分享整理
    物联沃-IOTWORD物联网 » 避免覆盖原有数据:使用df.to_excel写入新数据

    发表评论