-
标准的正态分布,三个标准差(σ)覆盖的范围内,可以覆盖99.7%的数据,那么在 3σ 以外的数据就可以认定为异常点。 [图片] 1个标准差内可以覆盖68%的数据。 [图片] 2个标准差内可以覆 ..
-
Excel 函数丰富操作方便,常用来进行桌面数据计算,但也有一些较特殊或较复杂的计算是 Excel 不擅长的,比如从长串里拆分出所有的日期,让 vlookup 返回匹配的多个结果,对多个单元格 ..
-
docker 镜像中的润乾报表,如何导出 echarts 图形的报表到 pdf 中?官网教程中说需要在服务器端安装 SlimerJS 和 Firefox 来实现,但我们的 docker 环境中 ..
-
箱线图(Box Plot)是由一组或多组连续型定量数据的「最小观测值」、第一四分位数、中位数、第三分位数和「最大观测值」来反映数据的分布情况的统计图,因外形似箱子而得名。 箱线图的外形组成: ..
-
SQL WITH a AS( SELECT sum(Amount) Amount FROM Orders2021 WHERE Amount>500 or Quantity>50) ..
-
SQL SELECT ShipVia,sum(Quantity) Quantity FROM Orders2021 GROUP BY ShipVia ORDER BY ShipVia SELE ..
-
SQL SELECT ProductID,City,sum(Amount) Amount FROM Customers INNER JOIN Orders2021 ON Orders2021. ..
-
时间序列是指某个观察指标的数值按其发生的时间先后顺序排列而成的数列。如工业上电表每秒测出的电压、每个小时油料的流量、产品每天的产量等,这些都是时间序列。 在统计研究中,常用按时间顺序排列的一组 ..
-
SQL SELECT City,ProductID, sum(Amount) Amount FROM Customers INNER JOIN Orders2021 ON Orders2021 ..
-
我在安装 SPL 的时候选择 C:\Program Files\Eclipse Adoptium\jdk-17.0.5.8-hotspot 提示说不支持 32 位的 JDK [链接]
-
[图片] [图片] 同一张填报表,放在 报表 / 填报表 下就可以正常填报,放在业务填报里就会报不能识别对象的错误,是什么原因?
-
SQL SELECT Distinct CustomerID FROM Orders2020 UNION SELECT Distinct CustomerID FROM Orders2021 ..
-
在统计分析应用中,从明细数据计算出来的各种指标是支撑业务的重要数据。但是,要做到快速而且灵活的多指标计算,后台数据源面临多个难题。 多指标计算的一个难题是涉及的明细数据量非常大。政府、金融、能 ..
-
市场上绝大多数(甚至可以说是全部)云数据仓库都是基于 SQL 的,毕竟数据仓库的主要功能是分析计算,其它 NoSQL 技术的优势主要在 TP,在 AP 方面远远不敌 SQL。参与竞争的云服务商 ..
-
Rapid Miner RapidMiner是一个开源的数据挖掘软件,由Java语言编写而成,提供一些可扩展的数据分析挖掘算法,旨在帮助开发人员更加方便快捷地创建智能应用程序。该款工具最大的好 ..
-
Weka Weka基于Java开发,是一款开源且免费的软件。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则 ..
-
本章中要尝试更大数据量,将订单表按年分别存储成不同的表,表名为 Orders+ 年份,如 Orders2021,Orders2022,依此类推,表结构均和 Orders 相同 SQL SELE ..
-
IBM Watson Studio IBM的AutoAI 将智能自动化应用于构建预测机器学习模型的开发步骤。 这些步骤包括准备用于训练的数据集;识别给定数据的最佳模型类型,如分类或回归模型;以 ..
-
SQL SELECT Customers.CustomerID,CustomerName,Region,City,Amount FROM Customers INNER JOIN Orders ..
-
很多大机构都会有个中央数据仓库负责向应用提供数据服务。随着业务的发展,中央数据仓库的负载在持续增加。一方面,数仓是前端应用的数据后台,而前端应用不断增多,用户访问的并发数也不断增长。另一方面, ..
-
SQL SELECT a.CustomerID,a.OrderDate,a.ProductID,a.Quantity,a.Unit, a.Price,a.Amount,a.EmployeeID ..
-
最近在学习集算器,遇到一个问题,就是 mysql 的员工库表中有 5 千万条数据,用游标导出 btx, 报内存溢出。集算器脚本见附件。 我的理解是用游标不会报内存溢出,不知道是哪儿出问题了?麻 ..
-
对于已经序号化的维表,可以利用对位序列来处理维表上的过滤。 原理:产生一个与维表同样长度的序列,其成员是布尔值,满足条件的维表记录对应 true,否则对应 false。然后在事实表中用已经序号 ..
-
[链接]4.5.1 过滤后复用索引 SQL SELECT Suppliers.Region,sum(Amount) Amount FROM Orders LEFT JOIN Products ..
-
主键是自然数序号的维表,可以直接用序号定位实现关联,不必建索引,避免计算和比对 HASH 值,性能更好。 主键不是自然数序号的维表,可以事先转换成序号。同时把事实表中的对应维字段值也转换成相应 ..