Python 封神技巧:1 行代码搞定 90% 日常数据处理,效率直接拉满
【目录】前言一、Python高效数据处理整体流程 处理流程图二、环境准备1行安装三、1行代码搞定高频数据处理场景1. 一行代码读取 Excel/CSV 文件2. 一行代码查看数据基本信息行列、类型、缺失值3. 一行代码删除缺失值 / 填充缺失值4. 一行代码数据去重5. 一行代码筛选数据6. 一行代码分组统计7. 一行代码排序8. 一行代码新增列9. 一行代码字典/列表快速转DataFrame10. 一行代码导出 Excel / CSV四、综合实战10行内完成一套完整数据处理五、常用一行代码速查表建议收藏六、总结前言在日常开发、数据分析、自动化办公场景中我们经常要和数据清洗、格式转换、统计汇总、文件处理打交道。传统写法动辄十几行代码不仅冗余还容易出错。而Python凭借简洁语法强大第三方库真正做到了一行代码实现复杂数据操作。本文整理了高频实用场景覆盖90%日常需求附带可直接复制运行的代码新手也能秒变效率大神一、Python高效数据处理整体流程下图为Python一行代码数据处理标准流程数据加载 → 清洗过滤 → 格式转换 → 统计分析 → 结果导出 ↑ ↑ ↑ ↑ ↑ 一行代码 一行代码 一行代码 一行代码 一行代码 处理流程图原始数据 Excel/CSV/TXT一行代码加载一行代码缺失值处理一行代码去重/筛选一行代码分组统计一行代码导出文件完成数据处理二、环境准备1行安装pipinstallpandas numpy openpyxlPandas 是 Python 数据处理神器本文所有技巧均基于 Pandas Python 原生语法。三、1行代码搞定高频数据处理场景1. 一行代码读取 Excel/CSV 文件importpandasaspd# 读取CSVdfpd.read_csv(data.csv)# 读取Exceldfpd.read_excel(data.xlsx)# 一行展示全部数据概览print(df)2. 一行代码查看数据基本信息行列、类型、缺失值df.info(),df.describe(),df.isnull().sum()方法作用df.info()查看字段类型、非空数量df.describe()最大值、最小值、均值、标准差df.isnull().sum()统计每列缺失值数量3. 一行代码删除缺失值 / 填充缺失值# 删除含缺失值行dfdf.dropna()# 用均值填充数值型缺失值dfdf.fillna(df.mean())4. 一行代码数据去重dfdf.drop_duplicates()5. 一行代码筛选数据# 筛选成绩大于90分的数据dfdf[df[score]90]6. 一行代码分组统计# 按班级分组计算平均分resultdf.groupby(class)[score].mean()7. 一行代码排序# 按成绩降序排列dfdf.sort_values(byscore,ascendingFalse)8. 一行代码新增列# 根据成绩判断是否及格df[is_pass]df[score].apply(lambdax:及格ifx60else不及格)9. 一行代码字典/列表快速转DataFramedata[{name:张三,score:95},{name:李四,score:88}]dfpd.DataFrame(data)10. 一行代码导出 Excel / CSVdf.to_excel(结果数据.xlsx,indexFalse)df.to_csv(结果数据.csv,indexFalse)四、综合实战10行内完成一套完整数据处理importpandasaspd# 1. 加载数据dfpd.read_excel(学生成绩.xlsx)# 2. 去重删缺失值dfdf.drop_duplicates().dropna()# 3. 筛选及格学生dfdf[df[score]60]# 4. 按班级统计平均分resdf.groupby(class)[score].agg([mean,max,min])# 5. 导出结果res.to_excel(班级统计结果.xlsx)print(处理完成)五、常用一行代码速查表建议收藏需求场景一行代码实现读取文件pd.read_csv/excel()查看概览df.info();df.describe()处理空值df.dropna()/fillna()数据去重df.drop_duplicates()条件筛选df[df[col] 值]分组统计df.groupby(col)[val].mean()排序df.sort_values()新增列df[new_col] df[col].apply()类型转换df[col] df[col].astype(int)导出文件df.to_excel/csv()六、总结Python Pandas 可一行代码完成绝大多数数据处理日常办公、数据分析、自动化脚本这套技巧足够覆盖90%需求代码越少可读性越高、BUG越少、效率越高新手建议收藏速查表随用随查快速提升开发效率