什么是探索性数据分析?
探索性数据分析是数据分析过程中的步,在这里您可以了解所拥有的数据,然后弄清楚您想问什么问题以及如何对它们进行构架,以及如何地操纵可用的数据源来获得所需的答案,为此您可以使用可视化和定量方法来全面了解现有数据中的模式,趋势,离群值,意外结果等,并使用视觉和定量方法来了解所讲的故事,您正在寻找提示您合理的下一步,问题或研究领域的线索,是否希望将R合并以进行更深入的统计学习?观看我们的点播网络研讨会,了解如何使用不断增长的R函数库进行更深入的预测分析。
对于如何使用它,没有一成不变的规则
就是说这也引起了整个统计计算环境系列,这两个环境都用来帮助定义“什么是EDA?” 并处理特定的任务,例如:
发现错误和数据丢失;
绘制数据的底层结构;
确定重要的变量;
列出异常和异常值;
建立简约模型(可用于以少的预测变量来解释数据的模型);
估计参数并找出相关的置信区间或误差范围
工具与技术用于进行探索性数据分析的重要的统计编程程序包,后者是一种功能强大,用途广泛的开源编程语言,可以与许多BI平台集成但是稍后会介绍更多。
您可以使用这些工具执行的特定统计功能和技术包括:
聚类和降维技术,可帮助您创建包含许多变量的高维数据的图形显示;
原始数据集中每个字段的单变量可视化,以及摘要统计信息;
双变量可视化和摘要统计信息,使您可以评估数据集中的每个变量与要查看的目标变量之间的关系;
多变量可视化,用于映射和理解数据中不同字段之间的交互;
K均值聚类(基于接近的均值为每个聚类创建“中心”);
预测模型,例如线性回归
集成了许多数据源–实际操作中:
探索仪表板
它适合您的BI
使用正确的数据连接器
您可以将EDA数据直接合并到BI软件中,从而帮助您进行分析,此外您可以进行设置以允许数据也以其他方式流动,例如在使用BI数据的R中构建和运行统计模型,并在新信息流入模型时自动进行更新,例如您可以使用EDA映射从铅到现金的流程,跟踪通过每个步骤和部门将营销线索转化为客户的过程,以简化流程以实现平稳过渡,这种方法的潜在用途广泛,但终归结为:探索性数据分析是要在对数据做出任何假设之前先了解并理解您的数据。它可以帮助您避免意外创建不正确的模型,或者避免构建基于错误数据的准确模型。
正确执行此操作,您将对数据具有必要的信心
可以开始部署功能强大的机器学习算法,这会对业务绩效产生重大影响-但忽略了这一关键步骤,以后您会发现BI建立在摇摇欲坠的基础上,是否希望将R合并以进行更深入的统计学习?观看我们的点播网络研讨会,了解如何使用不断增长的R函数库进行更深入的预测分析。
免费客服热线:400-050-6600
商业联合会数据分析专业委员会
发表评论