返回首页

基于NASA PROMISE的软件缺陷预测系统

最高测试准确率

94.99%

pc1 数据集

最佳 F1 值

0.9519

综合性能指标

项目概述

构建基于深度学习的缺陷预测模型,分析NASA PROMISE存储库中的软件模块代码度量数据,提前识别潜在缺陷,帮助开发者提高代码质量和降低维护成本。

LSTM SMOTE Python TensorFlow

方法设计

数据预处理

  • 22个代码度量特征提取
  • SMOTE过采样(不平衡比 1:8)
  • 7:3 训练测试集划分

LSTM架构

  • 双层LSTM(128单元)
  • Dropout层(0.2)
  • Adam优化器(lr=0.001)

性能对比

改进前后对比(pc1数据集)

指标 原始模型 优化模型
准确率 0.9219 0.9499
AUC 0.65 0.95

项目总结

未来优化方向

  • 引入注意力机制,提升模型对关键特征的关注度
  • 自动化超参数调优,使用贝叶斯优化等先进算法
  • 特征工程强化,探索更多代码度量特征