解决pandas的concat函数导致索引失效的方法

249 0 0

作者:WELCOME TO ivanlee717！！！！

concat

最近在写数据的时候看到用一个concat函数进行整合，但是下面这段代码之后就碰上个很奇怪的地方

for i, bag in enumerate(bags):

  coure_result = func()
  core_df = pd.DataFrame([core_result])

  dfs.append(core_df)
df = pd.concat(dfs)

这段代码首先就是用dfs记录了每一组数据，最后使用concat函数进行连接。在这之后我希望在特定位置插入一列数据

df_summary = pd.DataFrame(summary, columns = ["summary"])
df.insert(1,"summary",df_summary["summary"])

img_v2_e08005fd-6955-4e7c-8947-967b836ce2dg

一共有三种类型的文本，10条数据，在df格式下前面也有索引。而我之前拼接好的内容如下图：

img_v2_024e115c-cccf-48e5-9caa-405cc1b186fg

按理来说运行insert之后，每一行都会对应一个summary里面的字段，但是最终的运行效果summary里面的内容完全变成同样的话

img_v2_3b5f127f-1e1d-4cf1-b03e-07bf64dc8bfg

这让我很是奇怪。研究了半天，发现df原来的内容默认索引全都是0，原因是因为在创建和合并DataFrame的时候，concat连接每一个dfs里面的独立的dataframe时，每个DataFrame都有自己独立的索引，从0开始。在运行concat函数时会保留原始的索引，即使在最终的DataFrame里面重复了。因此，再重新插入新的有index的df时，会根据索引位置插入数据，而并不是像Excel那样直接插入。

所以需要先改掉原先的索引才能插入

df = pd.concat(dfs).reset_index(drop = True)

意味着重置索引后丢弃掉原来的索引，如果不把drop改成True，那么原来的索引将会变成新的列。

img_v2_085dd5c2-73d6-49b2-bc66-818cdd7f903g

这样的话，df的内容和我要插入内容的索引就可以对应上了，在进行插入的时候就可以了

img_v2_1cd88cd0-3fe6-4b7f-8b94-6f1f05cf3e2g

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/ivanlee717/p/17514757.html

标签： Python Python开发 Python语言

你还没有登录，请先登录或注册！

还没有人评论，欢迎说说您的想法！

解决pandas的concat函数导致索引失效的方法

解决pandas的concat函数导致索引失效的方法

concat

相关课程

热门标签

解决pandas的concat函数导致索引失效的方法

解决pandas的concat函数导致索引失效的方法

concat

相关课程

热门标签

推荐文章