算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖

cnblogs 2024-07-06 09:13:00 阅读 89

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」

抱个拳,送个礼

更多内容,见微*公号往期文章,阅读人数已破 10, 000:协方差、方差、标准差、协方差矩阵

好的,让我们开始这段统计学的江湖之旅,早日实现一“统”江湖大业。

1. 什么是平均数

1.1 定义

平均数,江湖人称“均值”,是一帮数字里的“老大”,它把一伙数字的总和给分了,分给每个数字一样多。就像是帮派里的老大,把抢来的金银财宝平均分给手下的兄弟们。

1.2 计算方法

要算出平均数,得把一帮数字都加起来,然后除以这帮数字的人数。就像分钱一样,先数数有多少钱,再数数有多少人,最后把钱一分,每人分到的,就是平均数。公式就是:

1.3 生活实例

比如说,你和你的三个哥们儿扶危济困,去打劫了一个山寨的财宝库,获到100两黄金。你们四个人,每人分多少呢?把100两黄金除以4,结果就是每人25两。这就是平均数,简单吧!

2. 什么是众数

2.1 定义

众数,就是一帮数字里最“招人喜欢”的那个,出现次数最多的数字。好比在江湖里,最有名的大侠,被提及的次数最多。

2.2 计算方法

找众数,就是数数看哪个数字出现的次数最多。如果有多个数字出现次数一样多,那这些数字就都是众数。就像是江湖里,如果有几个大侠都同样有名,那他们都算是“众大侠”。

2.3 生活实例

比如,你问一群小朋友,他们最喜欢的动画片是什么。结果《熊出没》被提到了5次,《喜羊羊与灰太狼》提到了3次,其他动画片都只提到了1次。那《熊出没》就是众数,因为它被提到的次数最多。

防失联,进免费知识星球,直达算法金 AI 实验室 https://t.zsxq.com/ckSu3

3. 什么是中位数

3.1 定义

中位数,江湖上称之为“中间值”,就是一帮数字排成一列,站在队伍最中间的那个数字。如果数字的个数是奇数,那中间那个就是中位数;如果是偶数,那就取中间两个数字的平均数作为中位数。

3.2 计算方法

要找到中位数,首先得把数字按大小顺序排个队。然后,如果是奇数个数字,就找到正中间那一个;如果是偶数个,就找到中间两个数字,取它们的平均值。公式如下:

3.3 生活实例

比如,你和你的七个兄弟去比武,最后按照武功高低排了个队。武功排名第四的兄弟,他的武功水平就是你们这帮人的中位数。

4. 什么是极差

4.1 定义

极差,江湖上叫它“最大最小差”,就是一帮数字里最大的那个和最小的那个之间的差距。好比是武功最高的大侠和武功最低的弟子之间的差距。

4.2 计算方法

极差,就是用最大值减去最小值。公式很简单:

4.3 生活实例

比如,你和你的兄弟们去比武,武功最高的能打败10个对手,武功最低的只能打败1个。那极差就是10 - 1 = 9,也就是他们之间的差距。

铁子们,咱们的统计学之旅还在继续,下一站是方差,别急,慢慢来。

抱个拳,送个礼

点击 ↑ 领取

防失联,进免费知识星球,直达算法金 AI 实验室

https://t.zsxq.com/ckSu3

5. 什么是方差

5.1 定义

方差,江湖上称之为“波动性”,它描述了一帮数字的“不稳定性”或“波动大小”。如果数字们都差不多,波动性就小;如果数字们差距很大,波动性就大。

5.2 计算方法

方差的计算稍微复杂一些。首先,找到平均数,然后每个数字减去平均数的平方,再求和,最后除以数字的个数。公式如下:

5.3 生活实例

比如,你和你的兄弟们每次比武的成绩都记录了下来。如果你们的成绩都差不多,那方差就小,说明你们的水平稳定;如果成绩差距很大,方差就大,说明你们的水平波动很大。

6. 什么是标准差

6.1 定义

标准差,江湖上叫它“标准偏差”,是方差的平方根。它和方差一样,也是用来衡量一帮数字的波动性。不过,标准差的单位和原始数据的单位相同,更容易直观理解。

6.2 计算方法

标准差的计算,就是先求出方差,然后取方差的平方根。公式是:

6.3 生活实例

比如,你和你的兄弟们比武的成绩,如果方差是25,那标准差就是5。这就意味着成绩的波动大约在5分上下。

接下来是频数和频率,这两个概念就像是江湖中的兄弟会,总是成双成对出现。

抱个拳,送个礼

点击 ↑ 领取

防失联,进免费知识星球,直达算法金 AI 实验室 https://t.zsxq.com/ckSu3

7. 什么是频数

7.1 定义

频数,就是某个数字或者某个类别出现的次数。在江湖上,如果某个武功招式被用得特别多,那它的频数就高。

7.2 计算方法

计算频数很简单,就是数一数某个特定的数字或者类别出现了多少次。没有复杂的公式,就是简单的计数。

7.3 生活实例

比如,你在统计一群武林高手使用的武器,发现用剑的有20人,用棍的有15人,用拳套的有5人。这里的20、15和5,就是各种武器出现的频数。


8. 什么是频率

8.1 定义

频率,就是频数占总次数的比例。它告诉我们某个数字或者类别出现的频繁程度。在江湖上,如果某个招式的使用频率高,那它可能就是这个门派的招牌技能。

8.2 计算方法

频率的计算就是频数除以总次数。公式是:

8.3 生活实例

接着上面的例子,如果总共有40个武林高手,那用剑的频率就是

这意味着在这群高手中,有一半的人选择了剑作为武器。

9 实际运用

9.1 如何综合使用这些统计学概念

在江湖中行走,我们不仅要懂得单独的招式,更要懂得如何将它们组合起来,形成一套完整的武学体系。同样,统计学中的概念也不是孤立的,它们相互关联,共同描绘了数据的全貌。

  • 平均数 可以告诉我们数据的中心位置。
  • 众数 显示了数据中最常见的情况。
  • 中位数 提供了另一种中心趋势的度量,特别是在数据分布不对称时。
  • 极差 和 方差(以及 标准差)告诉我们数据的波动性。
  • 频数 和 频率 描述了数据出现的模式。

9.2 实际案例分析

假设你是一个门派的掌门人,想要了解门派内弟子的武功水平。你收集了所有弟子的武功测试成绩:

  • 计算 平均分 来了解整体水平。
  • 找出 众数 来看哪个分数段的弟子最多。
  • 确定 中位数 来观察大多数弟子的武功水平。
  • 计算 极差 来看最高分和最低分之间的差距。
  • 通过 方差 和 标准差 来评估弟子们武功水平的波动性。
  • 最后,通过 频数 和 频率 分析不同分数段的弟子分布情况。

[ 抱个拳,总个结 ]

  • 平均数:数据的平均水平。
  • 众数:数据中最常见的值。
  • 中位数:数据的中间值,反映中心趋势。
  • 极差:数据的最大值和最小值之差,反映波动范围。
  • 方差 和 标准差:衡量数据的波动性或离散程度。
  • 频数:特定值或类别出现的次数。
  • 频率:特定值或类别出现的相对次数。

通过这些统计学概念的综合运用,我们可以更全面地了解和分析数据,无论是在武林中还是在现实世界的各种场景下。


至此,我们的统计学之旅已经圆满结束。希望大侠们在这次旅途中有所收获,能够将这些知识应用到实际生活中,成为数据江湖中的高手。如果你还有其他问题或想要探讨的话题,随时欢迎继续交流。

祝你早日实现一“统”江湖大业

- 科研为国分忧,创新与民造福 -

日更时间紧任务急,难免有疏漏之处,还请大侠海涵 内容仅供学习交流之用,部分素材来自网络,侵联删

[ 算法金,碎碎念 ]

小区的户外游泳池终于再次开放了,小朋友们很开心

人类幼崽表示放开那个玩具,让我来

全网同名,日更万日,让更多人享受智能乐趣

如果觉得内容有价值,烦请大侠多多 分享、在看、点赞,助力算法金又猛又持久、很黄很 BL 的日更下去;

同时邀请大侠 关注、星标 算法金,围观日更万日,助你功力大增、笑傲江湖



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。