Python实战：用NumPy和Matplotlib绘制标准正态分布曲线（附完整代码）

张

张建站

2026/4/29 23:14:27

10分钟阅读

Python实战：用NumPy和Matplotlib绘制标准正态分布曲线（附完整代码）

Python数据可视化实战从零绘制标准正态分布曲线在数据分析的世界里正态分布就像是一把万能钥匙几乎可以打开任何统计问题的大门。想象一下你手头有一组数据想要快速了解它的分布特征——这时候绘制一条正态分布曲线就能帮你直观判断数据是否符合钟形规律。作为Python数据分析的入门必备技能掌握用NumPy生成正态分布数据并用Matplotlib绘制曲线的方法将为你的数据分析之旅打下坚实基础。1. 理解正态分布数据世界的通用语言正态分布这个由德国数学家高斯系统研究并推广的概率分布模型在自然界和人类活动中无处不在。从一群人的身高分布到流水线产品的尺寸误差从股票收益率到考试成绩正态分布的身影随处可见。正态分布的核心特征对称的钟形曲线峰值位于均值处均值(μ)决定分布中心位置标准差(σ)决定曲线胖瘦数据离散程度约68%数据落在μ±σ内95%在μ±2σ内99.7%在μ±3σ内标准正态分布是μ0、σ1的特例其概率密度函数简化为φ(z) (1/√(2π)) * e^(-z²/2)这种标准化形式让不同量纲的数据可以放在同一尺度下比较是统计检验的基础。2. 环境准备搭建Python数据分析工作站工欲善其事必先利其器。在开始绘制曲线前我们需要配置好Python环境并安装必要的库。推荐使用Anaconda发行版它集成了数据科学所需的绝大多数工具。必备工具清单Python 3.8建议3.10稳定版NumPy数值计算核心库Matplotlib数据可视化利器SciPy科学计算扩展库安装命令已安装Anaconda可跳过pip install numpy matplotlib scipy验证安装是否成功import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm print(所有库已就绪)提示使用Jupyter Notebook进行交互式编程体验更佳可以实时看到图形输出3. 生成正态分布数据NumPy的随机魔法NumPy的random模块提供了多种生成正态分布数据的方法我们重点介绍两种最常用的方式。3.1 生成普通正态分布数据import numpy as np # 设置分布参数 mu 175 # 均值例如平均身高175cm sigma 10 # 标准差 # 生成10000个符合正态分布的随机数 data np.random.normal(mu, sigma, 10000)参数说明loc(μ)分布均值决定曲线中心位置scale(σ)标准差决定曲线宽度size生成数据的数量3.2 生成标准正态分布数据标准正态分布(μ0, σ1)有专用生成方法std_data np.random.standard_normal(10000)或者使用通用方法的特例std_data_alt np.random.normal(0, 1, 10000)两种方法生成的数组在统计特性上完全一致第一种方法执行效率略高。数据验证技巧print(f均值{np.mean(std_data):.4f}) # 应接近0 print(f标准差{np.std(std_data):.4f}) # 应接近14. 绘制概率密度曲线Matplotlib可视化艺术有了数据后让我们用Matplotlib绘制专业的正态分布曲线。这里介绍两种互补的可视化方法。4.1 基础绘制方法import matplotlib.pyplot as plt from scipy.stats import norm # 创建画布 plt.figure(figsize(10, 6), dpi100) # 生成理论上的标准正态分布曲线 x np.linspace(-4, 4, 1000) # 在[-4,4]区间生成1000个点 y norm.pdf(x, 0, 1) # 计算标准正态分布PDF值 # 绘制理论曲线 plt.plot(x, y, r-, lw3, alpha0.8, label理论PDF) # 添加图形元素 plt.title(标准正态分布概率密度函数, fontsize15) plt.xlabel(Z值, fontsize12) plt.ylabel(概率密度, fontsize12) plt.grid(True, linestyle--, alpha0.5) plt.legend(fontsize12) plt.show()关键参数解析figsize控制图形宽高英寸dpi分辨率影响输出质量linspace在指定范围生成等间距点norm.pdf计算正态分布概率密度函数值4.2 直方图与曲线叠加更直观的方式是将生成数据的直方图与理论曲线叠加plt.figure(figsize(10, 6)) # 绘制生成数据的直方图 plt.hist(std_data, bins50, densityTrue, alpha0.6, colorg, label随机样本) # 绘制理论曲线 x np.linspace(-4, 4, 1000) plt.plot(x, norm.pdf(x), r-, lw2, label理论PDF) # 美化图形 plt.title(标准正态分布样本验证, fontsize15) plt.xlabel(值, fontsize12) plt.ylabel(密度, fontsize12) plt.legend() plt.grid(True, linestyle:, alpha0.7) plt.show()直方图关键参数参数说明推荐值bins分箱数量30-100density是否归一化Truealpha透明度0.5-0.7color柱状图颜色任何有效颜色5. 高级定制技巧打造出版级图表要让你的图表脱颖而出还需要掌握一些高级定制技巧。5.1 多子图对比展示fig, (ax1, ax2) plt.subplots(1, 2, figsize(14, 5)) # 第一个子图不同均值的对比 for mu in [0, 2, -2]: x np.linspace(-6, 6, 500) ax1.plot(x, norm.pdf(x, mu, 1), labelfμ{mu}, σ1) ax1.set_title(不同均值对比) ax1.legend() # 第二个子图不同标准差的对比 for sigma in [0.5, 1, 2]: x np.linspace(-6, 6, 500) ax2.plot(x, norm.pdf(x, 0, sigma), labelfμ0, σ{sigma}) ax2.set_title(不同标准差对比) ax2.legend() plt.tight_layout() plt.show()5.2 填充关键区域突出显示特定概率区域能增强图表表现力plt.figure(figsize(10, 6)) x np.linspace(-4, 4, 1000) y norm.pdf(x) plt.plot(x, y, b-) # 填充μ±σ区域(68.27%) x_fill1 np.linspace(-1, 1, 100) plt.fill_between(x_fill1, norm.pdf(x_fill1), colorblue, alpha0.3, labelμ±σ (68.27%)) # 填充μ±2σ区域(95.45%) x_fill2 np.linspace(-2, 2, 100) plt.fill_between(x_fill2, norm.pdf(x_fill2), colorgreen, alpha0.2, labelμ±2σ (95.45%)) plt.title(正态分布概率区域示意, fontsize15) plt.legend() plt.grid(True) plt.show()5.3 添加注释和公式在图表中直接显示数学公式和关键注释from matplotlib.patches import ArrowStyle plt.figure(figsize(10, 6)) x np.linspace(-4, 4, 1000) plt.plot(x, norm.pdf(x), k-) # 添加公式文本 plt.text(0, 0.1, r$\phi(z) \frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z^2}$, fontsize16, hacenter, bboxdict(facecolorwhite, alpha0.8)) # 添加箭头注释 plt.annotate(拐点位置, xy(1, norm.pdf(1)), xytext(2, 0.2), arrowpropsdict(arrowstyle-, connectionstylearc3), fontsize12, bboxdict(facecolorwhite, alpha0.7)) plt.title(标准正态分布数学表达式, fontsize15) plt.grid(True, linestyle:) plt.show()6. 实战应用正态性检验与数据转换掌握了绘制方法后让我们看看如何在实际数据分析中应用这些技能。6.1 QQ图正态性检验from scipy.stats import probplot plt.figure(figsize(10, 6)) probplot(std_data, plotplt) plt.title(QQ图 - 正态性检验, fontsize15) plt.grid(True) plt.show()解读要点数据点越接近红色参考线正态性越好尾部偏离可能暗示数据存在偏态或异常值6.2 数据标准化转换将非标准正态数据转换为标准正态形式# 原始数据假设符合正态分布但参数未知 raw_data np.random.normal(100, 20, 1000) # 标准化转换 standardized (raw_data - np.mean(raw_data)) / np.std(raw_data) # 验证转换效果 plt.figure(figsize(12, 5)) plt.subplot(1, 2, 1) plt.hist(raw_data, bins30, alpha0.7) plt.title(原始数据分布) plt.subplot(1, 2, 2) plt.hist(standardized, bins30, alpha0.7) plt.title(标准化后分布) plt.show()6.3 实际案例考试成绩分析假设我们有一组考试成绩想要分析其分布# 模拟考试成绩数据 scores np.random.normal(75, 10, 500) scores np.clip(scores, 0, 100) # 确保分数在0-100之间 # 绘制分布图 plt.figure(figsize(10, 6)) plt.hist(scores, bins20, densityTrue, alpha0.7, label实际分布) # 拟合正态曲线 mu, sigma np.mean(scores), np.std(scores) x np.linspace(0, 100, 500) plt.plot(x, norm.pdf(x, mu, sigma), r-, lw2, labelf拟合曲线\n(μ{mu:.1f}, σ{sigma:.1f})) plt.title(考试成绩分布分析, fontsize15) plt.xlabel(分数, fontsize12) plt.ylabel(密度, fontsize12) plt.legend() plt.grid(True) plt.show()在实际项目中我经常使用这种可视化方法快速评估数据分布特征。有一次分析用户停留时间数据时发现原始数据右偏严重通过对数转换后才接近正态分布——这种洞察只有通过可视化才能快速获得。

【计算机毕业设计】基于Springboot的中小企业人事管理系统+LW

博主介绍：✌全网粉丝3W,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、…...

2026/4/29 23:10:21 阅读更多 →

LangTorch：用PyTorch张量范式重构LLM应用开发

1. 项目概述：当LangChain遇见PyTorch，一个面向研究者的全新范式最近在折腾大语言模型应用开发的朋友，对LangChain这个框架应该都不陌生。它通过“链”（Chain）的概念，将提示词、模型、工具、记忆等组件串联起…...

2026/4/29 23:05:21 阅读更多 →

AI Agent监控告警体系：从指标采集到智能根因分析的技术实现

AI Agent监控告警体系：从指标采集到智能根因分析的技术实现一、引言 （一）钩子：你永远不知道下一秒你的“超级员工”会不会罢工假设你在2024年Q2上线了一款基于LangChain Agent的企业级SaaS客服机器人： 它能自动查询知…...

2026/4/29 23:02:46 阅读更多 →

AI智能体工作流编排：从单体架构到流水线协作的工程实践

1. 项目概述：当AI智能体学会“流水线”协作最近在探索AI智能体（Agent）的落地应用时，我遇到了一个非常有意思的项目：coleam00/ottomator-agents。这个名字本身就充满了想象力——“Ottomator”，听起来像是“…...

2026/4/29 5:20:31 阅读更多 →

ChatGPT翻译能力解析与实战技巧

1. ChatGPT翻译能力深度解析作为一名长期从事语言技术研究的从业者，我最近系统测试了ChatGPT在多语言翻译场景下的实际表现。与传统的机器翻译工具相比，ChatGPT展现出几个独特优势：首先，它的上下文理解能力远超传统翻译引擎。当处…...

2026/4/29 16:56:51 阅读更多 →

2026届毕业生推荐的十大降AI率助手实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在内容生产这个过程当中，要降低AIGC也就是人工智能生成内容所占的比例&#xff…...

2026/4/29 7:49:02 阅读更多 →