设为首页收藏本站
网站公告 | 这是第一条公告
     

 找回密码
 立即注册
缓存时间18 现在时间18 缓存数据 你我最后竟然也平凡到自命不凡。

你我最后竟然也平凡到自命不凡。 -- 像我这样的人

查看: 790|回复: 1

pandas实现一行拆分成多行

[复制链接]

  离线 

TA的专栏

  • 打卡等级:热心大叔
  • 打卡总天数:242
  • 打卡月天数:0
  • 打卡总奖励:7110
  • 最近打卡:2025-04-19 01:19:38
等级头衔

等級:晓枫资讯-上等兵

在线时间
3 小时

积分成就
威望
0
贡献
388
主题
359
精华
0
金钱
8255
积分
814
注册时间
2023-1-20
最后登录
2025-4-19

发表于 2023-2-11 06:08:34 | 显示全部楼层 |阅读模式
一行拆分成多行


1.根据某一列拆分

效果:
070930v0rrbt6xb06gvjj4.png

070930xbhpexi5hxuuu56k.png

代码:
  1. if __name__ == '__main__':
  2.     import pandas as pd
  3.     df = pd.DataFrame({'Country': ['China,US', 'Japan,EU', 'UK,Australia', 'Singapore,Netherland'],
  4.                        'Number': [100, 150, 120, 90],
  5.                        'Value': [1, 2, 3, 4],
  6.                        'label': list('abcd')})
  7.     df_split_row = df.drop('Country', axis=1).join(
  8.         df['Country'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('Country'))
复制代码
2.根据多列拆分

效果:
070930qdy02vlqqvnbzvzg.png

070930ky6zhnzan603pyy3.png

代码:
  1. if __name__ == '__main__':
  2.     import pandas as pd
  3.     df = pd.DataFrame({'Code': ['212027'],
  4.                        'Color': ['blue, pink, yellow'],
  5.                        'Size': ['12-18M, 2-3Y, 3-4Y']})
  6.     split_columns = ['Color', 'Size']
  7.     df_convert = df.drop(columns=split_columns, axis=1)
  8.     for column in split_columns:
  9.         df_convert = df_convert.join(
  10.             df[column].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename(column))
  11.     df_convert = df_convert.reset_index(drop=True)
复制代码
一行转多行、多行转一行


1.测试数据
  1. df = pd.DataFrame([['张世龙', '篮球、羽毛球、英雄联盟'],
  2.                    ['黄邵飞', '兵乓球、足球、下棋'],
  3.                    ['刘苗苗', '绘画、写小说、跑步']])
  4. df.columns = ['姓名','爱好']
复制代码
070931q3v4gvvaffvffzac.png


2.一行转多行

方法一:
  1. # 1、把渠道字段拆分,分为多列; 2、把行转列成列;3、重置索引,并删除多于的索引;4、更改名称
  2. df_ = df['爱好'].str.split('、',expand=True).stack().reset_index(level=1,drop=True).rename('爱好')
  3. df1 = df.drop(['爱好'], axis=1).join(df_)
复制代码
方发二:
  1. # 1、将渠道字段拆分;2、调用explode()方法
  2. df['爱好'] = df['爱好'].map(lambda x:x.split('、'))
  3. df1 = df.explode('爱好')
复制代码
070931dx2b75xm6225rx55.png


3.多行转一行
  1. #定义拼接函数,并对字段进行去重
  2. def concat_func(x):
  3.     return pd.Series({
  4.         '爱好':'、'.join(x['爱好'].unique())
  5.     })
  6. #分组聚合 + 拼接
  7. df2 = df1.groupby(df1['姓名']).apply(concat_func).reset_index()
复制代码
070931rjqn7lzfm676mmw7.png

以上为个人经验,希望能给大家一个参考,也希望大家多多支持晓枫资讯。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
晓枫资讯-科技资讯社区-免责声明
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。
      1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
      2、管理员及版主有权在不事先通知或不经作者准许的情况下删除其在本社区所发表的文章。
      3、本社区的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,举报反馈:点击这里给我发消息进行删除处理。
      4、本社区一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
      5、以上声明内容的最终解释权归《晓枫资讯-科技资讯社区》所有。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
-2
主题
2
精华
0
金钱
62
积分
25
注册时间
2022-12-19
最后登录
2023-6-21

发表于 6 天前 | 显示全部楼层
感谢楼主,顶。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~
严禁发布广告,淫秽、色情、赌博、暴力、凶杀、恐怖、间谍及其他违反国家法律法规的内容。!晓枫资讯-社区
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1楼
2楼

手机版|晓枫资讯--科技资讯社区 本站已运行

CopyRight © 2022-2025 晓枫资讯--科技资讯社区 ( BBS.yzwlo.com ) . All Rights Reserved .

晓枫资讯--科技资讯社区

本站内容由用户自主分享和转载自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

如有侵权、违反国家法律政策行为,请联系我们,我们会第一时间及时清除和处理! 举报反馈邮箱:点击这里给我发消息

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表