NumPy 正态分布与 Seaborn 可视化指南

numpy,seaborn · 浏览次数 : 1

小编点评

**正态分布简介** 正态分布是一种非常重要的概率分布,它描述许多自然和人为现象的数据分布情况。正态分布的形状呈钟形,其峰值位于平均值处,两侧对称下降。 **参数** 正态分布有两个参数: * **均值(μ):**表示数据的平均值。 * **标准差(σ):**表示数据的离散程度,数值越大,分布越平坦。 **生成正态分布数据** NumPy 提供了 `random.normal()` 函数来生成服从正态分布的随机数。该函数接受以下参数: * **loc:**正态分布的均值,默认为 0。 * **scale:**正态分布的标准差,默认为 1。 * **size:**输出数组的形状。 **示例** ```python import numpy as npdata data = np.random.normal(loc=5, scale=2, size=100) print(data) ``` **可视化正态分布** Seaborn 库提供了便捷的函数来可视化分布,包括正态分布。示例如下: ```python import seaborn as snsimport numpy as npdata = np.random.normal(size=1000)sns.distplot(data)plt.show() ``` **应用** 正态分布在许多领域都有应用,例如: * **统计学:**用于推断总体参数,进行假设检验等。 * **机器学习:**用于数据预处理,特征工程等。 * **金融:**用于建模股票价格、汇率等金融数据。 * **工程:**用于控制质量、可靠性分析等。

正文

正态分布(高斯分布)

简介

正态分布(也称为高斯分布)是一种非常重要的概率分布,它描述了许多自然和人为现象的数据分布情况。正态分布的形状呈钟形,其峰值位于平均值处,两侧对称下降。

特征

正态分布可以用两个参数来完全描述:

均值(μ):表示数据的平均值,分布的峰值位于 μ 处。
标准差(σ):表示数据的离散程度,数值越大,分布越平坦。

生成正态分布数据

NumPy 提供了 random.normal() 函数来生成服从正态分布的随机数。该函数接受以下参数:

loc:正态分布的均值,默认为 0。
scale:正态分布的标准差,默认为 1。
size:输出数组的形状。

示例:生成 100 个服从正态分布的随机数,均值为 5,标准差为 2:

import numpy as np

data = np.random.normal(loc=5, scale=2, size=100)
print(data)

可视化正态分布

Seaborn 库提供了便捷的函数来可视化分布,包括正态分布。

示例:绘制服从正态分布的数据的分布图:

import seaborn as sns
import numpy as np

data = np.random.normal(size=1000)

sns.distplot(data)
plt.show()

应用

正态分布在许多领域都有应用,例如:

统计学:用于推断总体参数,进行假设检验等。
机器学习:用于数据预处理,特征工程等。
金融:用于建模股票价格、汇率等金融数据。
工程:用于控制质量、可靠性分析等。

练习

  1. 生成 500 个服从正态分布的随机数,均值为 10,标准差为 3,并绘制它们的分布图。
  2. 比较不同标准差下正态分布形状的变化。
  3. 利用正态分布来模拟一次考试成绩,并计算平均分和标准分。

解决方案

import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

# 1. 生成服从正态分布的随机数并绘制分布图
data = np.random.normal(loc=10, scale=3, size=500)
sns.distplot(data)
plt.show()

# 2. 比较不同标准差下正态分布形状的变化
sns.distplot(np.random.normal(size=1000, scale=1), label="σ=1")
sns.distplot(np.random.normal(size=1000, scale=2), label="σ=2")
sns.distplot(np.random.normal(size=1000, scale=3), label="σ=3")
plt.legend()
plt.show()

# 3. 模拟考试成绩并计算平均分和标准分
scores = np.random.normal(loc=80, scale=10, size=100)
print("平均分:", scores.mean())
print("标准分:", (scores - scores.mean()) / scores.std())

解释:

在第一个练习中,我们生成了 500 个服从正态分布的随机数,均值为 10,标准差为 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。
在第二个练习中,我们生成了三个服从正态分布的数据集,分别设置标准差为 1、2 和 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。我们可以观察到,随着标准差的增加,分布变得更加平坦,两侧的尾巴更加明显。
在第三个练习中,我们模拟了一次考试成绩,假设成绩服从正态分布,均值为 80,标准差为 10。然后,我们计算了考试成绩的平均分和标准分。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

与NumPy 正态分布与 Seaborn 可视化指南相似的内容:

NumPy 正态分布与 Seaborn 可视化指南

正态分布(高斯分布)是重要的概率模型,具有钟形曲线特征,由均值μ和标准差σ描述。NumPy的`random.normal()`可生成正态分布随机数,Seaborn库方便绘制分布图。正态分布广泛应用于统计学、机器学习、金融和工程等领域。练习包括生成正态分布数据、比较不同标准差影响及模拟考试成绩计算平均...

NumPy 泊松分布模拟与 Seaborn 可视化技巧

泊松分布是描述单位时间间隔内随机事件发生次数的离散概率分布,参数λ表示平均速率。公式为 P(k) = e^(-λ) (λ^k) / k!。NumPy 的 `random.poisson()` 可生成泊松分布数据。当 λ 很大时,泊松分布近似正态分布。练习包括模拟顾客到达、比较不同 λ 下的分布及模拟...

NumPy 差分、最小公倍数、最大公约数、三角函数详解

NumPy 助你处理数学问题:计算序列的差分用`np.diff()`,示例返回`[5, 10, -20]`;找最小公倍数(LCM)用`np.lcm()`,数组示例返回`18`;最大公约数(GCD)用`np.gcd.reduce()`,数组示例返回`4`;三角函数如`np.sin()`,`np.deg...

NumPy 舍入小数、对数、求和和乘积运算详解

NumPy 提供五种舍入小数的方法:`trunc()`, `fix()`, `around()`, `floor()`, `ceil()`。此外,它还支持对数运算,如 `log2()`, `log10()`, `log()`,以及自定义底数的对数。NumPy 的 `sum()` 和 `prod()`...

NumPy 简单算术:加减乘除及其他运算

NumPy 中的简单算术运算可以通过 `add`, `subtract`, `multiply`, `divide`, `power`, `mod`, `remainder` 等函数实现,这些函数支持条件运算,并接受 `where` 参数。例如,`add()` 实现加法,`subtract()` 表...

机器学习算法(一):1. numpy从零实现线性回归

系列文章目录 机器学习算法(一):1. numpy从零实现线性回归 机器学习算法(一):2. 线性回归之多项式回归(特征选取) @目录系列文章目录前言一、理论介绍二、代码实现1、导入库2、准备数据集3、定义预测函数(predict)4 代价(损失)函数5 计算参数梯度6 批量梯度下降7 训练8 可视

数据分析---numpy模块

前戏 NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。 快捷键的使用: 添加cell:a或者b 删除:x 修改cell的模式: m:修改成markdown模式

NumPy 数组排序、过滤与随机数生成详解

本文介绍了NumPy中的数组排序和过滤功能。`np.sort()`函数用于对数组进行升序排序,对二维数组则按行排序。示例展示了如何对一维和二维数组排序。此外,还讲解了使用布尔索引来过滤数组,以及直接在条件中操作数组以创建过滤后的数组。最后,介绍了NumPy的随机数生成,包括整数、浮点数及特定分布的随...

NumPy 分割与搜索数组详解

NumPy 分割数组 NumPy 提供了 np.array_split() 函数来分割数组,将一个数组拆分成多个较小的子数组。 基本用法 语法: np.array_split(array, indices_or_sections, axis=None) array: 要分割的 NumPy 数组。 i

NumPy 数组迭代与合并详解

NumPy 数组迭代 NumPy 数组迭代是访问和处理数组元素的重要方法。它允许您逐个或成组地遍历数组元素。 基本迭代 我们可以使用 Python 的基本 for 循环来迭代 NumPy 数组。 一维数组迭代: import numpy as np arr = np.array([1, 2, 3,