← 返回首页

基于NASA PROMISE的软件缺陷预测系统

核心指标

94.99%

最高测试准确率(pc1数据集)

0.9519

最佳F1值

📌 项目概述

构建基于深度学习的缺陷预测模型,分析NASA PROMISE存储库中的软件模块代码度量数据,提前识别潜在缺陷。

LSTM SMOTE Python TensorFlow

🔧 方法设计

数据预处理

  • 22个代码度量特征提取
  • SMOTE过采样(不平衡比 1:8)
  • 7:3 训练测试集划分

LSTM架构

  • 双层LSTM(128单元)
  • Dropout层(0.2)
  • Adam优化器(lr=0.001)

📊 性能对比

改进前后对比(pc1数据集)

指标 原始模型 优化模型
准确率 0.9219 0.9499
AUC 0.65 0.95

📝 项目总结

优化方向

  • 引入注意力机制
  • 自动化超参数调优
  • 特征工程强化