正文最近开始从零学机器学习选了一个半导体良品率预测的GitHub项目练手。记录一下今天读代码探索模块的过程。项目背景SECOM数据集是半导体生产的真实数据1567个芯片样本590个传感器读数目标是预测每个芯片是合格品还是不合格品。遇到的问题第一个问题很多pytho语言看不懂不知道什么时自定义的内容什么是python的语言最难理解的一行feature_stats features.describe().T ------------------为什么要转置是转置后数据更好看经过AI查询后发现这段代码是机器学习数据分析EDA最核心的代码之一这段代码可以自动统计每个特征传感器的基础统计信息如下图所示