【摘要】 对统计分析稍有关注的人可能会有这样的疑问。为什么在大学里有两门课程,《概率论与数理统计》,《统计学》,他们之间有什么区别?

概率与概率分布

 

统计学稍有关注的人可能会有这样的疑问。为什么在大学里有两门课程,《概率论与数理统计》,《统计学》,他们之间有什么区别?

 

在我的理解中,概率论和数理统计比较专业,理工科为主,会有很多公式推导;统计学是一本比较基础的书,侧重于解释概念现象。一般直接给出结论,不需要掌握结论的数学推导过程。它可以用于艺术和科学。

 

但不管是哪门课程,前期都是先讲概率和概率分布。概率论是统计学的基础,而随机事件的概率是概率论研究的基本内容。

 

统计学不研究统计学,它研究不确定性。我们的世界是一个充满不确定性的环境,整个世界并没有严格按照既定的路线运作。大多数事情没有原因和结果。一切都充满了无法控制的随机事件。我们明天不会成功,因为我们今天努力工作。

 

不确定事件的唯一规律是概率。我们不能预测或控制独立的随机事件,但我们可以用概率来描述它的可能性。它以概率论为基础,为我们理解不确定世界提供了一条途径。

在本章中,我们需要掌握几个核心概念:

 

  • 随机事件
  • 概率
  • 概率分布
  • 数字特征

 

用图表演示数据

 

今年疫情期间,除随行家属外,每天讨论最多、关注最多的事件是疫情的新动向。你注意到这些趋势的表现了吗?各种专业、美观、直观的图表和数据图表,使数据一目了然。

 

是的,在工作中,数据分析员得到数据后,第一步是进行初步的数据探索,也就是所谓的数据预处理。此时,更多的是利用各种图表来探究数据。该图的优点是可以直观地看到数据的分布和趋势,更有效地观察数据。

 

在本章中,我们需要掌握几个核心概念:

 

  • 数据类型
  • 统计表
  • 统计图

 

 

数据的概括性度量

 

利用上图,我们可以大致了解数据分布的形态和特征,但要全面掌握数据分布,就需要体现数据分布特征的代表值。通常包括浓度趋势、分散程度和分布形态。

 

在数据分析中,最常见的情况是获得一组、一批或一块数据。不懂统计的人可能会不知所措。换句话说,如果你不做一些处理和处理,你就不知道这些数据是用来做什么的。此时,我们需要使用这些通用度量来帮助我们从宏观角度把握数据中的初步信息。

 

这一章节,需要大家掌握几个核心概念:

 

  • 众数/平均数
  • 方差/标准差
  • 偏度/峰度

 

 

免责声明:部分文章整合自网络,因内容庞杂无法联系到全部作者,如有侵权,请联系删除,我们会在第一时间予以答复,万分感谢。