
离线 TA的专栏
- 打卡等级:热心大叔
- 打卡总天数:242
- 打卡月天数:0
- 打卡总奖励:7110
- 最近打卡:2025-04-19 01:19:38
|
一行拆分成多行
1.根据某一列拆分
效果:
代码: - if __name__ == '__main__':
- import pandas as pd
- df = pd.DataFrame({'Country': ['China,US', 'Japan,EU', 'UK,Australia', 'Singapore,Netherland'],
- 'Number': [100, 150, 120, 90],
- 'Value': [1, 2, 3, 4],
- 'label': list('abcd')})
- df_split_row = df.drop('Country', axis=1).join(
- df['Country'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('Country'))
复制代码 2.根据多列拆分
效果:
代码: - if __name__ == '__main__':
- import pandas as pd
- df = pd.DataFrame({'Code': ['212027'],
- 'Color': ['blue, pink, yellow'],
- 'Size': ['12-18M, 2-3Y, 3-4Y']})
- split_columns = ['Color', 'Size']
- df_convert = df.drop(columns=split_columns, axis=1)
- for column in split_columns:
- df_convert = df_convert.join(
- df[column].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename(column))
- df_convert = df_convert.reset_index(drop=True)
复制代码 一行转多行、多行转一行
1.测试数据
- df = pd.DataFrame([['张世龙', '篮球、羽毛球、英雄联盟'],
- ['黄邵飞', '兵乓球、足球、下棋'],
- ['刘苗苗', '绘画、写小说、跑步']])
- df.columns = ['姓名','爱好']
复制代码
2.一行转多行
方法一:- # 1、把渠道字段拆分,分为多列; 2、把行转列成列;3、重置索引,并删除多于的索引;4、更改名称
- df_ = df['爱好'].str.split('、',expand=True).stack().reset_index(level=1,drop=True).rename('爱好')
- df1 = df.drop(['爱好'], axis=1).join(df_)
复制代码 方发二:- # 1、将渠道字段拆分;2、调用explode()方法
- df['爱好'] = df['爱好'].map(lambda x:x.split('、'))
- df1 = df.explode('爱好')
复制代码
3.多行转一行
- #定义拼接函数,并对字段进行去重
- def concat_func(x):
- return pd.Series({
- '爱好':'、'.join(x['爱好'].unique())
- })
- #分组聚合 + 拼接
- df2 = df1.groupby(df1['姓名']).apply(concat_func).reset_index()
复制代码
以上为个人经验,希望能给大家一个参考,也希望大家多多支持晓枫资讯。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
晓枫资讯-科技资讯社区-免责声明
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、管理员及版主有权在不事先通知或不经作者准许的情况下删除其在本社区所发表的文章。
3、本社区的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,举报反馈:  进行删除处理。
4、本社区一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、以上声明内容的最终解释权归《晓枫资讯-科技资讯社区》所有。
|