第12天实际应用——pandas入门哈喽小伙伴们今天我们需要安装python中的插件pandas并且学会简单运用阶段实际应用学习内容pandas 入门核心知识点读取数据1. 什么是 pandas1核心思想它是 Python 处理数据的“工具”。2逻辑拆解①定位如果说 Python 是地基那么 pandas 就是盖在上面的“自动化办公大楼”。②功能它能把复杂的 CSV、Excel 文件瞬间变成一个像表格一样的对象在 pandas 里叫DataFrame。③优势昨天我们要写好几行代码才能算平均值今天用 pandas 可能只需要一行。注我认为就是很多写好的程序直接调用的一个工具库类比excel中的各种函数。2. 准备工作安装 pandas1核心思想pandas 不是 Python 自带的需要额外下载。2操作做法① 打开你电脑的终端Terminal或 PyCharm 底部的Terminal。② 输入以下命令并回车 powershell pip install pandas。③ 等待显示Successfully installed。3. 如何用 pandas 读取数据1核心思想用最简单的指令让文件里的数据“跳”进 Python。2代码做法请确保你的data.csv和代码在同一个文件夹①导入库import pandas as pd给 pandas 起个简短的绰号叫pd。②读取文件使用pd.read_csv(文件名)。③查看数据使用.head()方法。4. 详细代码实现与逐行解析请在你的编辑器中输入以下代码import pandas as pd # 初始化导入pandas工具包并简写成pd # 第一步:读取数据 # 核心思想:把需要处理的数据导入到内存中取名为df # df是DateFarm的缩写可以当做是一个虚拟表格 dfpd.read_csv(data.csv) #第二步输出前5行 #核心思想先看看一下数据的样式提前检查数据是否输错 print(---以下是数据的前5行---) print(df.head())#默认展示前5行如果括号写head(3)就是前三行 #第三步查看数据的基本信息 print(---数据的行列数---) print(df.shape)#输出的结果是什么就是表示其行列信息5. 重点笔记小白必看df是什么它是 pandas 最核心的对象。可以把它当成存放在 Python 里的Excel 工作表。pd.read_csv()的路径问题如果报错FileNotFoundError说明 Python 没找到你的data.csv。请检查文件后缀是不是真的是.csv它是不是和你的.py代码文件放在同一个文件夹下为什么要用.head()在现实工作中一个 CSV 文件可能有几百万行。如果你直接print(df)电脑可能会卡死。.head()让你只看开头的几行确保数据读对了就行。6. 今日练习建议任务成功安装 pandas 并运行上面的代码打印出你在第11天创建的那几个人的分数。扩展试着在df.head()的括号里填入数字2看看输出结果是不是变成了只显示 2 行注1因为手动输出代码可能出现以下问题主要问题就是英文符号和中文符号的问题。注2在软件内部修改文件的名称右击选择Refactor - Rename重命名