返回首页
基于NASA PROMISE的软件缺陷预测系统
最高测试准确率
94.99%
pc1 数据集
最佳 F1 值
0.9519
综合性能指标
项目概述
构建基于深度学习的缺陷预测模型,分析NASA PROMISE存储库中的软件模块代码度量数据,提前识别潜在缺陷,帮助开发者提高代码质量和降低维护成本。
LSTM
SMOTE
Python
TensorFlow
方法设计
数据预处理
- 22个代码度量特征提取
- SMOTE过采样(不平衡比 1:8)
- 7:3 训练测试集划分
LSTM架构
- 双层LSTM(128单元)
- Dropout层(0.2)
- Adam优化器(lr=0.001)
性能对比
改进前后对比(pc1数据集)
| 指标 | 原始模型 | 优化模型 |
|---|---|---|
| 准确率 | 0.9219 | 0.9499 |
| AUC | 0.65 | 0.95 |
项目总结
未来优化方向
- 引入注意力机制,提升模型对关键特征的关注度
- 自动化超参数调优,使用贝叶斯优化等先进算法
- 特征工程强化,探索更多代码度量特征