panda入门笔记
推荐入门链接
Python数据分析之Pandas——基础篇
1. Python数据分析实战 | 初识Pandas 备用链接
2. Python数据分析实战 | 灵活的Pandas索引 备用链接
3. Python数据分析实战 | 清洗常用4板斧 备用链接
4. Pandas中第二好用的函数 | 优雅的apply 备用链接
Python数据分析之Pandas——实战篇
官网中文
One hot处理
pandas提供对one-hot编码的函数是:pd.get_dummies()
# import pandas as pd
data = pd.DataFrame({'size':['s','xxl','m','l','xl'],'gender':['M','F','F','M','N/A']})
print(data)
# one hot处理
one_hot_size = pd.get_dummies(data['size'])
one_hot_gender = pd.get_dummies(data['gender'])
print(one_hot_size)
print()
print(one_hot_gender)
# 拼接
result = pd.DataFrame()
pd.concat([result, one_hot_size, one_hot_gender],axis = 1)