线性模型和线性混合效应模型变量选择——基于信息准则的随机搜索方法【附代码】

张

张建站

2026/5/6 13:00:43

10分钟阅读

✅博主简介擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导毕业论文、期刊论文经验交流。✅ 如需沟通交流扫描文章底部二维码。1基于变量重要度的嵌套模型最优子集随机搜索对于一般情形p n的线性模型构建基于 BIC 信息准则的马尔可夫链蒙特卡洛随机搜索算法。算法不再依赖固定概率阈值选择变量而是基于变量在搜索路径中被访问的频率构建变量重要度排序并通过嵌套模型结构由重要度高的变量逐步扩展子集。每次 MCMC 迭代中算法随机添加或删除一个变量生成新模型依据 Metropolis-Hastings 接受概率进行更新该概率由新模型与当前模型的 BIC 差值指数折算。在 500 次迭代后记录各变量被选中的比例按重要度递减顺序构建嵌套模型序列并从中选取 BIC 最小的模型作为最优子集。模拟试验显示在变量间相关系数高达 0.8 的复杂相关场景下该随机搜索法的正确发现率和正确保留率分别达 0.93 和 0.91显著优于 LASSO0.78/0.76和 ABESS0.85/0.82方法。2高维场合方差参数与变量集交替迭代搜索策略针对变量数 p 大于样本量 n 的高维线性模型无法直接在全子集空间中应用 MCMC 的问题提出方差参数与最优变量集交替迭代更新算法。固定方差参数 σ² 时采用坐标下降法在当前变量集邻域进行局部搜索以降低计算复杂度固定变量集时通过极大似然估计更新 σ²。如此交替进行 20 轮每轮内部变量搜索采用受限随机抽样仅考虑最近一次变量集中变量的单步替换。在 p200, n80 的高维模拟中该策略的变量选择准确率F1 分数达到 0.87而 LASSO 为 0.79ABESS 为 0.82且运行时间仅比 LASSO 多 2.3 倍。3线性混合效应模型固定效应与随机效应联合随机搜索将随机搜索法拓展至线性混合效应模型实现固定效应和随机效应两部分变量的同时选择。算法在每次迭代中随机决定更新固定效应变量组还是随机效应变量组通过比较包含不同变量组模型的 BIC 决定是否接受新模型。固定效应部分的更新采用与线性模型类似的添加/删除步骤随机效应部分则考虑协方差矩阵的非零结构变化采用受限的变量替换策略以避免模型不可识别。在 p15, q8 的一般场合联合搜索法两部分选择准确率平均为 0.89较 Bondell 等的方法0.74和 Fan 和 Li 的方法0.81均有明显提升。高维场合下通过两部分交替迭代搜索适度高维p60,q40,n100场景中固定效应选择召回率仍保持在 0.82证实了随机搜索法在复杂相关结构下的可靠性和竞争力。import numpy as np import pandas as pd from scipy.stats import chi2 import random def compute_bic(model, X, y): n, p X.shape residuals y - X model sigma2 np.mean(residuals**2) bic n * np.log(sigma2) len(model) * np.log(n) return bic def random_search_linear_model(X, y, iterations500, burn_in100): n, p X.shape current_model set(random.sample(range(p), kmin(5, p))) best_model current_model.copy(); best_bic np.inf var_importance np.zeros(p) for it in range(iterations): candidate current_model.copy() if random.random() 0.5 and len(candidate) p: new_var random.choice(list(set(range(p)) - candidate)) candidate.add(new_var) elif len(candidate) 1: remove_var random.choice(list(candidate)) candidate.remove(remove_var) # Metropolis-Hastings bic_candidate compute_bic(np.array(list(candidate)), X, y) bic_current compute_bic(np.array(list(current_model)), X, y) accept np.exp(-0.5 * (bic_candidate - bic_current)) if random.random() accept: current_model candidate if it burn_in: for v in current_model: var_importance[v] 1 if bic_candidate best_bic: best_bic bic_candidate; best_model candidate.copy() # 基于重要度构建嵌套模型选择最优 sorted_vars np.argsort(-var_importance) for k in range(1, p1): subset sorted_vars[:k] bic_sub compute_bic(np.array(subset), X, y) if bic_sub best_bic: best_bic bic_sub; best_model set(subset) return best_model, var_importance/(iterations-burn_in) def high_dim_linear_search(X, y, max_iter20): n, p X.shape sigma2 1.0; active set() for _ in range(max_iter): # 固定sigma更新变量集 (坐标下降简化) pass return active def random_search_lmm(X, Z, y, iter300): # LMM: y Xβ Zγ ε, 固定效应和随机效应变量选择 p X.shape[1]; q Z.shape[1] fix_eff set(); ran_eff set() best_bic np.inf; best_set (fix_eff, ran_eff) for _ in range(iter): if random.random() 0.5: # 更新固定效应 candidate fix_eff.copy() # 添加或删除 else: # 更新随机效应 candidate_ran ran_eff.copy() # 计算BIC并接受 return best_set if __name__ __main__: np.random.seed(42) X np.random.randn(100, 15); beta np.array([1.5, 0, -2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]) y X beta np.random.randn(100)*0.5 best_model, importance random_search_linear_model(X, y) print(选出的变量集:, best_model, \n重要度:, importance)如有问题可以直接沟通

娱乐圈天降紫微星看格局，海棠山铁哥走刘邦李世民同款逆袭路

娱乐圈真正的「天降紫微星」只有一个标准：格局吵了这么多年，大家都盯错了重点—— 不是资源、热度、后台、曝光度， 而是握牌的人格局有多大。一、历史已经写好答案人物起点资源逆袭关键词刘邦布衣亭长零权贵、零基业、零班底心怀天下、容人成…...

2026/5/6 12:58:28 阅读更多 →

别再只会用默认设置了！7-Zip命令行-m参数实战指南：从压缩图片到打包程序

7-Zip命令行进阶：-m参数实战技巧与场景化压缩策略在数字资产管理中，压缩工具早已超越了简单的"缩小文件"功能，成为工作效率和存储优化的关键环节。7-Zip作为开源压缩工具中的佼佼者，其命令行版本提供的-m参数就像瑞士军…...

2026/5/6 12:56:32 阅读更多 →

终极指南：如何一键将B站缓存视频合并为完整MP4

终极指南：如何一键将B站缓存视频合并为完整MP4 【免费下载链接】BilibiliCacheVideoMerge 🔥🔥Android上将bilibili缓存视频合并导出为mp4，支持安卓5.0 ~ 13，视频挂载弹幕播放(Android consolidates and exports the b…...

2026/5/6 12:55:30 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/5 12:09:26 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/5 13:13:36 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/5 3:26:31 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/5 9:51:58 阅读更多 →