Python Flask工程目录解读
项目根目录usedCar项目主目录是整个工程的工作区。applications— 应用核心Flask 应用的工厂模式组织目录包含业务应用的初始化、扩展管理和全局配置。子目录/文件作用config.py应用全局配置文件包含数据库连接串、SECRET_KEY、文件上传路径与限制、预测模型默认参数、数据源切换配置、DEBUG模式开关等common/公共模块存放通用工具函数、装饰器、公共响应格式等extensions/Flask 扩展的统一注册中心如flask_sqlalchemy、flask_migrate、flask_cors等扩展对象的初始化models— 数据模型层ORM 模型位于项目根目录下存放 SQLAlchemy 数据库表对应的模型类。文件作用_init_.py模型包的初始化导入db并导出各模型类analysis_augmented_data.py增强数据表的模型存储数据增强如 SMOTE、回译等后生成的样本analysis_car_dcd_data.py懂车帝数据表的模型存储从懂车帝爬取或导入的二手车信息analysis_car_guazi_data.py瓜子二手车数据表的模型存储瓜子平台车辆信息analysis_used_car_train_data.py训练数据表的模型存储用于模型训练的原始二手车交易记录predict_train_clean_data.py清洗后数据表的模型存储经过清洗、特征工程后的最终训练/预测数据sys_file.py系统文件表的模型管理上传文件、导出报告等文件元信息sys_user.py系统用户表的模型管理登录用户、角色、权限等schemas— 数据序列化层仅序列化不做参数校验基于 marshmallow 的ModelSchema只负责ORM 对象 ↔ JSON的序列化和反序列化不参与参数校验。参数校验在view/层完成。文件作用_init_.py初始化导出各 Schema 类base_schema.py基础 Schema 类继承ModelSchema或SQLAlchemyAutoSchema定义通用配置如include_fk、load_instance等其他 Schema 继承于此analysis_augmented_data.pyAnalysisAugmentedData模型的序列化 Schemaanalysis_car_dcd_data.pyAnalysisCarDcdData模型的序列化 Schemaanalysis_car_guazi_data.pyAnalysisCarGuaziData模型的序列化 Schemaanalysis_used_car_train_data.pyAnalysisUsedCarTrainData模型的序列化 Schemapredict_train_clean_data.pyPredictTrainCleanData模型的序列化 Schemasys_file.pySysFile模型的序列化 Schemasys_user.pySysUser模型的序列化 Schemaview— 视图/蓝图层路由 参数解析与校验Flask 蓝图的组织目录负责路由定义、参数接收与校验通过request.get_json()、request.args或 webargs 等、调用业务逻辑最后用 Schema 序列化响应。view/system/— 系统管理视图文件作用_init_.py系统蓝图初始化注册/system前缀路由user.py用户管理接口接收用户名/密码参数 → 校验 → 登录/注册/退出/修改密码file.py文件管理接口接收上传文件参数 → 校验类型大小 → 上传/下载/列表view/根目录 — 分析/看板视图文件作用_init_.py注册各蓝图brand_analysis.py品牌分析接口接收品牌筛选参数 → 校验 → 统计均价/数量/保值率 → 用 Schema 序列化返回price_analysis.py价格分析接口接收价格区间参数 → 校验 → 价格分布/趋势分析 → 返回mileage_age_analysis.py里程与车龄分析接口接收里程/车龄参数 → 校验 → 分析对价格影响 → 返回power_analysis.py动力分析接口接收排量/马力/变速箱参数 → 校验 → 返回影响分析model_check.py模型检验接口接收模型评估参数 → 校验 → 返回 R²/MAE/RMSE 等指标car_dashboard.py综合看板接口接收筛选条件 → 校验 → 聚合多维度数据 → 返回models— 机器学习模型层注意这是第二处models/与 ORM 数据模型层同名但用途不同存放封装好的预测模型。文件作用_init_.py初始化lightgbm.pyLightGBM 模型封装训练、预测、参数调优的类randomforest.py随机森林模型封装xgboost.pyXGBoost 模型封装Flask 运行时view/调用这些模型进行二手车价格预测。models/xgboost/— XGBoost 模型完整目录这是项目机器学习模型层下的 XGBoost 子目录包含了从训练到评估、再到部署的完整流程文件和产物。 目录结构总览models/xgboost/ ├── 训练脚本 │ ├── m_xgboost.py # 模型封装类 │ └── train_xgboost.py # 训练入口脚本 │ ├── 模型文件 │ ├── car_price_model.pkl # 当前生产模型通用名 │ └── car_price_model_20260405_194920.pkl # 带时间戳的历史模型备份 │ ├── 评估结果evaluation_20260405_194920/ │ ├── evaluation_report.json # 综合评估报告 │ ├── feature_importance.csv # 特征重要性表格 │ ├── feature_importance.png # 特征重要性可视化 │ ├── prediction_scatter.png # 预测值 vs 真实值散点图 │ ├── residuals_plot.png # 残差分布图 │ ├── training_curves.png # 训练曲线train/val loss │ └── training_metadata.json # 训练元信息时间、参数、数据量等 │ ├── 调优结果 │ ├── hyperparameter_tuning.json # 超参数调优记录 │ ├── tuning_history.png # 调优历史走势 │ └── tuning_importance.png # 超参数重要性分析 │ ├── 数据质量 │ ├── data_quality_report.json # 数据质量报告 │ └── data_quality_visualization.png # 数据质量可视化 │ └── _init_.py️ 训练脚本文件作用m_xgboost.py模型封装类。定义 XGBoost 模型的类包含train()训练、predict()预测、save()保存、load()加载等方法。Flask 接口调用它来加载模型并预测价格。train_xgboost.py训练入口脚本。独立运行负责从数据库/CSV 拉取训练数据 → 数据预处理 → 调用m_xgboost训练 → 输出模型文件和评估结果。 模型文件文件作用car_price_model.pkl生产环境模型。固定文件名Flask 接口直接加载这个文件不需要知道训练时间。每次训练完成后覆盖更新。car_price_model_20260405_194920.pkl带时间戳的模型备份。20260405_194920表示 2026年4月5日 19:49:20 训练的。用于模型版本管理和回滚。 评估结果evaluation_20260405_194920/目录名带时间戳与模型备份对应方便追溯。文件作用evaluation_report.json综合评估报告JSON格式。包含 R²、MAE、MSE、RMSE 等指标方便程序化读取。feature_importance.csv特征重要性表。记录每个特征如车龄、里程、品牌等对价格预测的贡献权重可导入 Excel 分析。feature_importance.png特征重要性柱状图直观展示哪些因素最影响二手车价格。prediction_scatter.png预测 vs 真实散点图。X 轴真实价格Y 轴预测价格点越靠近对角线说明模型越准。residuals_plot.png残差图。预测值 vs 残差真实-预测用于判断模型是否存在系统性偏差。training_curves.png训练曲线。训练集和验证集的 Loss 随迭代次数下降曲线判断是否过拟合/欠拟合。training_metadata.json训练元信息。记录训练时间、数据量、特征列表、超参数配置、模型版本等。 调优结果文件作用hyperparameter_tuning.json超参数调优记录。记录每次尝试的参数组合和对应分数如{learning_rate: 0.1, max_depth: 6, score: 0.92}。tuning_history.png超参数搜索过程中的模型性能变化曲线。tuning_importance.png超参数对模型性能的影响程度分析如learning_rate比max_depth更重要。 数据质量文件作用data_quality_report.json数据质量报告。检查缺失值比例、异常值数量、特征分布偏度等训练前确保数据可靠。data_quality_visualization.png数据质量可视化图表如缺失值热力图、异常值分布。 工作流程train_xgboost.py │ ├── ① 读取数据MySQL / CSV ├── ② 数据质量检查 → data_quality_report.json .png ├── ③ 超参数调优 → hyperparameter_tuning.json 图片 ├── ④ 训练模型 │ └── m_xgboost.py 封装训练逻辑 ├── ⑤ 评估 → evaluation_20260405_194920/ ├── ⑥ 保存模型 │ ├── car_price_model_20260405_194920.pkl备份 │ └── car_price_model.pkl覆盖生产文件 └── ⑦ Flask 接口加载 car_price_model.pkl 提供预测服务utils— 工具层文件作用_init_.py初始化mysql_helper.pyMySQL 辅助工具封装原生 SQL 查询、连接池管理等用于绕过 ORM 的复杂查询app.pyFlask 应用工厂创建 Flask app 实例注册蓝图、扩展、配置等是整个应用的入口augmented_data.csv数据增强结果 CSV保存增强后的样本文件clean_analysis_car_dcd_data.py懂车帝数据清洗脚本处理缺失值、异常值、格式统一等clean_train.py训练数据清洗脚本特征工程、编码、标准化等流水线requirements.txtPython 依赖清单记录所有所需第三方库及版本External Libraries/Scratches and Consoles项目说明External LibrariesIDE 显示的项目所依赖的所有外部库Python 安装环境中的包Scratches and ConsolesIDE如 PyCharm的临时文件和脚本控制台非项目正式代码 最终架构流程用户请求带参数 ↓ app.pyFlask 工厂加载 applications/config.py注册蓝图与扩展 ↓ view/路由分发 参数解析与校验 ↓ models/ORM 数据查询 models/机器学习模型预测 ↓ utils/MySQL 辅助、数据清洗工具 ↓ schemas/ORM 对象序列化为 JSON 响应 ↓ 客户端 JSON 响应 分层职责总结目录核心职责applications/全局配置、Flask 扩展注册、公共模块models/根目录ORM 数据库模型定义schemas/仅序列化/反序列化ORM ↔ JSONview/路由 参数解析与校验 调用业务逻辑models/机器学习预测模型封装LightGBM/XGBoost/RandomForestutils/工具函数、数据清洗、MySQL 辅助、应用入口这是一个典型的前后端分离的 Flask 项目后端提供 RESTful API前端未在截图中出现通过调用这些接口展示数据看板、进行价格预测分析。