← 返回首页
基于NASA PROMISE的软件缺陷预测系统
核心指标
94.99%
最高测试准确率(pc1数据集)
0.9519
最佳F1值
📌 项目概述
构建基于深度学习的缺陷预测模型,分析NASA PROMISE存储库中的软件模块代码度量数据,提前识别潜在缺陷。
LSTM
SMOTE
Python
TensorFlow
🔧 方法设计
数据预处理
- 22个代码度量特征提取
- SMOTE过采样(不平衡比 1:8)
- 7:3 训练测试集划分
LSTM架构
- 双层LSTM(128单元)
- Dropout层(0.2)
- Adam优化器(lr=0.001)
📊 性能对比
改进前后对比(pc1数据集)
| 指标 | 原始模型 | 优化模型 |
|---|---|---|
| 准确率 | 0.9219 | 0.9499 |
| AUC | 0.65 | 0.95 |
📝 项目总结
优化方向
- 引入注意力机制
- 自动化超参数调优
- 特征工程强化