panda入门笔记

推荐入门链接

Python数据分析之Pandas——基础篇

​ 1. Python数据分析实战 | 初识Pandas 备用链接

​ 2. Python数据分析实战 | 灵活的Pandas索引 备用链接

​ 3. Python数据分析实战 | 清洗常用4板斧 备用链接

​ 4. Pandas中第二好用的函数 | 优雅的apply 备用链接

Python数据分析之Pandas——实战篇

  1. 数据分析必知必会 | TGI指数分析实战 备用链接

  2. Python处理分析128张Excel表格不到3秒? 备用链接

  3. 不到70行Python代码,玩转RFM用户分析模型 备用链接

    4.Python数据分析实战 | 经典的同期群分析

官网中文

  1. 官网十分钟入门 Pandas

One hot处理

pandas提供对one-hot编码的函数是:pd.get_dummies()

# import pandas as pd

data = pd.DataFrame({'size':['s','xxl','m','l','xl'],'gender':['M','F','F','M','N/A']})
print(data)

# one hot处理
one_hot_size = pd.get_dummies(data['size'])
one_hot_gender = pd.get_dummies(data['gender'])
print(one_hot_size)
print()
print(one_hot_gender)

# 拼接
result = pd.DataFrame()
pd.concat([result, one_hot_size, one_hot_gender],axis = 1)

评论