用PythonTOPSIS法5分钟搞定多指标评价排名当你面对一堆供应商评估表格、学生综合评分数据或者项目优先级排序表时是否还在用Excel手动计算加权分数每次调整权重都要重新算一遍不仅效率低下还容易出错。今天我要分享的TOPSIS法配合Python的Pandas和Numpy库能让你在5分钟内搞定这些繁琐的计算而且结果比手动计算更客观科学。TOPSISTechnique for Order Preference by Similarity to Ideal Solution即优劣解距离法它的核心思想很直观找出每个方案距离理想解最近同时距离负理想解最远的那个方案作为最优解。这种方法特别适合处理多指标决策问题比如供应商评估价格、交货期、质量等多维度打分员工绩效考核KPI多项指标综合投资项目选择收益率、风险、周期等权衡学术评价论文、专利、项目等多指标排名1. 环境准备与数据加载首先确保你已安装Python和Jupyter Notebook推荐Anaconda发行版。我们需要用到以下几个核心库import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler假设我们有一份供应商评估的Excel数据包含以下指标供应商价格(万元)交货周期(天)质量合格率(%)售后服务评分A12015984.2B15010954.5C10020993.8用Pandas加载数据非常简单df pd.read_excel(supplier_evaluation.xlsx, index_col供应商) print(df.head())注意数据中的指标类型不同价格和交货周期是越小越好成本型而质量合格率和售后服务评分是越大越好效益型。这是TOPSIS处理前的关键认知。2. 数据预处理指标正向化TOPSIS要求所有指标同向化都转为越大越好。我们需要区分指标类型效益型指标越大越好如质量合格率成本型指标越小越好如价格区间型指标落在某个区间最好如温度中间型指标越接近某个值越好如pH值对于我们的示例数据只需处理成本型指标。常用正向化方法有倒数法1/x差值法max(x) - x标准化法(max(x) - x)/(max(x) - min(x))这里使用差值法实现# 成本型指标列名 cost_columns [价格(万元), 交货周期(天)] # 正向化处理 for col in cost_columns: df[col] df[col].max() - df[col] print(正向化后的数据) print(df)处理后的数据中所有指标都变为效益型——数值越大代表表现越好。3. 数据标准化与权重分配不同指标的量纲和数量级不同需要标准化处理。常用方法有向量归一化x_ij / sqrt(sum(x_ij^2))Min-Max标准化(x - min)/(max - min)Z-score标准化(x - mean)/stdTOPSIS通常采用向量归一化# 向量归一化 normalized_df df / np.sqrt((df**2).sum()) print(归一化矩阵) print(normalized_df)权重分配有三种常见方法等权重法所有指标权重相同主观赋权法如AHP层次分析法客观赋权法如熵权法这里演示等权重和熵权法两种实现# 方法1等权重 equal_weights np.ones(df.shape[1]) / df.shape[1] # 方法2熵权法 def entropy_weight(X): # 避免log(0) X X 1e-10 # 计算比重 P X / X.sum(axis0) # 计算熵值 E np.sum(-P * np.log(P), axis0) / np.log(len(X)) # 计算差异系数 D 1 - E # 计算权重 W D / D.sum() return W entropy_weights entropy_weight(df.values) print(熵权法计算的权重, entropy_weights)4. TOPSIS核心计算步骤有了标准化矩阵和权重后就可以计算正负理想解和相对接近度了。def topsis(data, weights): # 加权标准化矩阵 weighted_matrix data * weights # 确定正负理想解 ideal_best weighted_matrix.max() ideal_worst weighted_matrix.min() # 计算距离 dist_best np.sqrt(((weighted_matrix - ideal_best)**2).sum(axis1)) dist_worst np.sqrt(((weighted_matrix - ideal_worst)**2).sum(axis1)) # 计算相对接近度 score dist_worst / (dist_best dist_worst) return score # 使用熵权法权重计算 df[TOPSIS评分] topsis(normalized_df, entropy_weights) df[排名] df[TOPSIS评分].rank(ascendingFalse) print(最终结果) print(df.sort_values(排名))5. 完整代码封装与使用建议将上述步骤封装成一个函数方便重复使用def topsis_evaluation(input_file, cost_columns, output_fileNone): TOPSIS多指标评价完整流程 参数 input_file: 输入Excel文件路径 cost_columns: 成本型指标列名列表 output_file: 结果输出路径(可选) 返回 带评分和排名的DataFrame # 1. 数据加载 df pd.read_excel(input_file, index_col0) # 2. 正向化处理 for col in cost_columns: df[col] df[col].max() - df[col] # 3. 数据标准化 normalized_df df / np.sqrt((df**2).sum()) # 4. 计算权重(熵权法) weights entropy_weight(df.values) # 5. TOPSIS计算 df[TOPSIS评分] topsis(normalized_df, weights) df[排名] df[TOPSIS评分].rank(ascendingFalse) # 6. 结果输出 if output_file: df.to_excel(output_file) return df.sort_values(排名) # 使用示例 result topsis_evaluation( input_filesupplier_evaluation.xlsx, cost_columns[价格(万元), 交货周期(天)], output_filesupplier_ranking_result.xlsx )实际使用时你只需要准备Excel数据第一列为评价对象名称确定哪些列是成本型指标越小越好调用这个函数指定输入输出路径提示对于区间型或中间型指标可以在正向化步骤添加相应处理逻辑。完整代码可在GitHub仓库获取。我在多个供应商评估项目中使用这个方法后发现它有三大优势客观性避免了人为赋权的主观性灵活性权重方法可自由选择熵权法、AHP等可视化结果可以方便地用Python做进一步分析展示一个常见的问题是当某个指标值出现极端异常时怎么办我的经验是预处理阶段使用Winsorize方法处理极端值或者考虑用标准化方法代替原始数据对于明显错误的数据应该人工检查修正