计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
应用中有时会把某个数据库中的部分数据转储到另一个数据库,如果同类数据库且数据结构相同,则可以使用数据库DUMP工具来做。如果是异构数据库则一般会使用文本文件作为中介,但文本文件可能丢失数据类型 ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标是练习将数据库读出的数据,尽可能转换为有利于性能优化的数据类型,例如:小整数和浮 ..
-
[图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片] ..
-
全文下载javapdf [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 •常用计算的 SPL 代码 http:// ..
-
随着人工智能技术的发展,近年来国内市场上出现了很多数据挖掘类的产品,本文总结了几种常见的产品特点,以供有需求的小伙伴参考。 BAT 作为互联网公司巨头,BAT 有着天然的数据优势,比如阿里在零 ..
-
现在是大数据时代,数据中蕴含的价值也越来越受到重视,只要积累了足够的数据就可以利用 AI 技术手段来发掘数据里的价值。今天我们就来看下如何使用历史数据来进行商业预测。 1. 准备历史数据 历史 ..
-
一、 查询要求 Q22 语句查询可能会购买的消费者的地理分布。本查询统计在指定国家编码范围内,各国有多少消费者近 7 年没有下过订单,但帐户余 ..
-
问题描述 漏斗分析定义 电商业务中漏斗分析是常见的统计需求。用户使用智能设备购物时,系统会建立连接形成会话 session。每个会话又包含很多个操作事件 event,比如:访问(visit)类 ..
-
针对存储过程优缺点的讨论(争论)由来已久,这里我们不妨来详细盘点一下存储过程的利与弊。 先说优点 毕竟还是有不少人在用,总要有点好处。 SQL 过程化 很少人提及存储过程的这个优点,似乎是认为 ..
-
【摘要】 集合与引用,便好似一对天生的冤家对头。特别注重集合运算的语言,引用变量的方法往往非常受 ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 我们把用来实现某种标记的“是否”型数据称为二值标签。在二值标签总数不太多,只有几 ..
-
目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType OS Browser ProductID … f1 f2 f3 f4 f5 … 2022/6/1 1 ..
-
1 单个行式文本文件转换成Excel 行式文本中一行对应一条数据,是很常见的文件格式,比如下面这个水果价格表。 文件名【Fruits.txt ..
-
目标 集算器能直接针对数据文件写SQL查询,也能写SPL脚本支持复杂计算,为了容易给外部程序提供计算结果,提供了嵌入式JDBC驱动。本篇介绍Kettle中通用JDBC集成SPL的方法,及不同的 ..
-
一、 查询要求 Q20 语句查询确定在某一年内,能对某给定国某一零件商品提供更有竞争力价格的供货商。所谓更有竞争力的供货商,是指那些零件有过剩 ..
-
一、 数据准备 利用TPCH官方工具生成文本文件形式的原始数据,共8个表,数据量总规模100G,各文件大小见后表。 然后根据这些文本文件生成SPL的二进制文件,每个表对应一个二进制文件。 组表 ..
-
各行各业都对数据挖掘表现出极大兴趣,也纷纷展开了应用尝试,但成功案例并不多,这是为什么呢? 1. 数据质量差 玩数据就像挖金矿。如果含金量高,那么挖掘难度就小,出金率就高,如果含金量低,那么就 ..
-
大表关联常常会出现性能问题。对于关联字段是主键或者部分主键的情况,SPL 提供有序归并算法来计算。 有序关联算法,要事先把这些关联表的数据按其主键排序。排序的成本虽然较高,但是一次性的。一旦完 ..
-
对于不同类型的数据库,即使是数据库都能支持的SQL查询,语法也大体相似,但仍然可能会有细微差别而不能通用。主要原因在于这些数据库各自的函数参数规则不同。 比如将字符串'2020-02-05'转 ..
-
一、 查询要求 Q15语句查询获得某段时间内为总收入贡献最多的供货商(排名第一)的信息。可用以决定对哪些头等供货商给予奖励、给予更多订单、给予 ..
-
全文下载 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 常用计算的 SPL 代码http:/ ..
-
【简介】 本文采用集算器集群架构,由浅入深,由繁化简,分别讲述了如何快速高效地实现多机并行,集群计算。 [图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片] ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 组内最早的 N 个事件统计属于分组时序计算,要统计的数据中一般都有分组字段、事件 ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标是在前面几期基础上,将客户宽表中最近一天的新客户数据与分支机构等多个维表关联,并 ..
-
我们在《 http://c.raqsoft.com.cn/article/1600226611215 》(以下简称前文) 一文中介绍了如何使用历史数据进行商业预测的过程。不同的商业需求,还会有 ..