-
在统计分析应用中,从明细数据计算出来的各种指标是支撑业务的重要数据。但是,要做到快速而且灵活的多指标计算,后台数据源面临多个难题。 多指标计算的一个难题是涉及的明细数据量非常大。政府、金融、能 ..
-
市场上绝大多数(甚至可以说是全部)云数据仓库都是基于 SQL 的,毕竟数据仓库的主要功能是分析计算,其它 NoSQL 技术的优势主要在 TP,在 AP 方面远远不敌 SQL。参与竞争的云服务商 ..
-
Rapid Miner RapidMiner是一个开源的数据挖掘软件,由Java语言编写而成,提供一些可扩展的数据分析挖掘算法,旨在帮助开发人员更加方便快捷地创建智能应用程序。该款工具最大的好 ..
-
Weka Weka基于Java开发,是一款开源且免费的软件。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则 ..
-
本章中要尝试更大数据量,将订单表按年分别存储成不同的表,表名为 Orders+ 年份,如 Orders2021,Orders2022,依此类推,表结构均和 Orders 相同 SQL SELE ..
-
IBM Watson Studio IBM的AutoAI 将智能自动化应用于构建预测机器学习模型的开发步骤。 这些步骤包括准备用于训练的数据集;识别给定数据的最佳模型类型,如分类或回归模型;以 ..
-
SQL SELECT Customers.CustomerID,CustomerName,Region,City,Amount FROM Customers INNER JOIN Orders ..
-
很多大机构都会有个中央数据仓库负责向应用提供数据服务。随着业务的发展,中央数据仓库的负载在持续增加。一方面,数仓是前端应用的数据后台,而前端应用不断增多,用户访问的并发数也不断增长。另一方面, ..
-
SQL SELECT a.CustomerID,a.OrderDate,a.ProductID,a.Quantity,a.Unit, a.Price,a.Amount,a.EmployeeID ..
-
最近在学习集算器,遇到一个问题,就是 mysql 的员工库表中有 5 千万条数据,用游标导出 btx, 报内存溢出。集算器脚本见附件。 我的理解是用游标不会报内存溢出,不知道是哪儿出问题了?麻 ..
-
对于已经序号化的维表,可以利用对位序列来处理维表上的过滤。 原理:产生一个与维表同样长度的序列,其成员是布尔值,满足条件的维表记录对应 true,否则对应 false。然后在事实表中用已经序号 ..
-
[链接]4.5.1 过滤后复用索引 SQL SELECT Suppliers.Region,sum(Amount) Amount FROM Orders LEFT JOIN Products ..
-
主键是自然数序号的维表,可以直接用序号定位实现关联,不必建索引,避免计算和比对 HASH 值,性能更好。 主键不是自然数序号的维表,可以事先转换成序号。同时把事实表中的对应维字段值也转换成相应 ..
-
[图片] java 控制台这错误,是缺少对应的 jar 包吗
-
前面的例子均使用 switch 做维表的关联,能获得很好的性能,但还有几个问题: 1) 关联后,外键字段的本身值失去了,必须到维表中取主键才能获得,速度会变慢。 如上例:如果还想取得 Empl ..
-
日常工作中常常需要对 csv\xls 等数据文件进行查询分析,这些文件的格式大都比较规整(每行对应一条记录),可以看成数据库表,如果能使用 SQL 运算就会比较方便。但是,使用 SQL 前通常 ..
-
SQL SELECT floor((year(curdate())-year(Employees.Birthday))/10) Age, sum(Orders.Amount) Amount F ..
-
[链接]4.1.1 单层维表 SQL SELECT Employees.Region,sum(Orders.Amount) FROM Orders LEFT JOIN Employees ON ..
-
按月统计出当月发生过连续三天都有订单的用户数 SQL WITH a AS( SELECT count (1) AS num, day (OrderDate) days, CustomerID, ..
-
SQL WITH m AS( SELECT *, row_number() OVER(PARTITION BY year(OrderDate),month(OrderDate) ORDER B ..
-
现有原型填报如下: [图片] 数据库设计分为三个表,主表存时间和线别等数据,站点子表存填写了数据的站点名称,和主表 id 关联,时间子表存车次、车次号、列车到点、列车开点数据,同样和主表 id ..
-
SQL SELECT count (DISTINCT CustomerID) num,year(OrderDate) years, month(OrderDate) months FROM O ..
-
问题背景 发电设备中常常会放置传感器(DCS)来采集数据以监控设备运转的状况,某集团设计的电力监控统计系统,需要实时采集传感器的数据后保存,然后提供按时段的实时查询统计功能。 系统设计规模将支 ..
-
SQL SELECT count (DISTINCT CustomerID) iNum,count(1) Num FROM Orders WHERE OrderDate>='2021-0 ..
-
使用集算器 HTTP 服务,前端应用系统通过 AJAX 访问集算器 HTTP 服务时,提示跨域问题,无法获取数据,请问有什么解决的办法?