计算&AI •
995 引用 •
1077 回帖 •
471 关注
博客
关注
-
【摘要】 在数据计算时,除了每条记录本身,经常也会关心有序集合中与位置相关的计算。例如:编号为 752084 的订单在销售表中的第几行?2019 ..
-
我们知道,数据挖掘的基本流程包括:(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。其中第 4 步,数据预处理和建模是整个流程的核心部 ..
-
【摘要】 连接(JOIN)用于把来自两个或多个表的记录结合起来。SQL 和 SPL 是大家比较熟悉的程序语言,本文将探讨对于连接问题,这两种语言 ..
-
目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType OS Browser ProductID … f1 f2 f3 f4 f5 … 2022/6/1 1 ..
-
全文下载javapdf [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 •常用计算的 SPL 代码 http:// ..
-
Spark 是最流行的分布式数据计算工具,在当前大数据分析领域占据主导地位。在这一领域发挥的作用,集算器与 Spark 有不少交集,和 Spark 对比有哪些不同? 对于底层使用了不同技术、设 ..
-
大表关联常常会出现性能问题。对于关联字段是主键或者部分主键的情况,SPL 提供有序归并算法来计算。 有序关联算法,要事先把这些关联表的数据按其主键排序。排序的成本虽然较高,但是一次性的。一旦完 ..
-
一、 查询要求 Q8语句是查询在过去的两年中一个给定零件类型在某国某地区市场份额的变化情况。 Q8语句的特点是:带有分组、排序、聚集、子查询操 ..
-
应用中有时会把某个数据库中的部分数据转储到另一个数据库,如果同类数据库且数据结构相同,则可以使用数据库DUMP工具来做。如果是异构数据库则一般会使用文本文件作为中介,但文本文件可能丢失数据类型 ..
-
【摘要】 随着某产权交易所的业务发展,内部产生了大量的交易数据(如:交易的标的、价格、目前交易的阶段等),这对于参与交易的相关单位非常具有参考价值!同样地,其它地区的交易所也含有很多类似的重要 ..
-
【摘要】 全量预汇总真的是提高 OLAP 性能的可行方案吗?点击了解 ${article} 多 ..
-
一、 查询要求 Q17 语句对于指定品牌和指定包装类型的零件,查询出订购量少于此类零件平均订购量 20%的订单平均每年的订购额。所以此查询可用 ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 我们把用来实现某种标记的“是否”型数据称为二值标签。在二值标签总数不太多,只有几 ..
-
目标 集算器能直接针对数据文件写SQL查询,也能写SPL脚本支持复杂计算,为了容易给外部程序提供计算结果,提供了嵌入式JDBC驱动。本篇介绍Kettle中通用JDBC集成SPL的方法,及不同的 ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标是练习将数据库读出的数据,尽可能转换为有利于性能优化的数据类型,例如:小整数和浮 ..
-
针对存储过程优缺点的讨论(争论)由来已久,这里我们不妨来详细盘点一下存储过程的利与弊。 先说优点 毕竟还是有不少人在用,总要有点好处。 SQL 过程化 很少人提及存储过程的这个优点,似乎是认为 ..
-
现代信息系统多数据源的情况很常见,尤其分析型应用经常要跨多数据源混合计算实现数据统计分析。由于数据源种类众多,有 RDB,也有 NoSQL,还有 CSV、Excel 等文件,JSON、XML ..
-
随着人工智能技术的火热,各种 AI 培训也应运而生,翻阅各种社交网站和 APP,几乎每天都能刷到 Python、人工智能相关的文章,点进去很大一部分都是培训机构给自家 AI 课程打的广告。那么 ..
-
对于不同类型的数据库,即使是数据库都能支持的SQL查询,语法也大体相似,但仍然可能会有细微差别而不能通用。主要原因在于这些数据库各自的函数参数规则不同。 比如将字符串'2020-02-05'转 ..
-
现在是大数据时代,数据中蕴含的价值也越来越受到重视,只要积累了足够的数据就可以利用 AI 技术手段来发掘数据里的价值。今天我们就来看下如何使用历史数据来进行商业预测。 1. 准备历史数据 历史 ..
-
企业版集算器中提供了远服务器,该功能可以对远程服务器或远程存储进行上传下载文件、修改调试SPL脚本等操作。 使用远服务器前需要部署远服务器RSRV应用,企业版集算器内置的Tomcat中已部署该 ..
-
[链接]编程学习 从[链接]开始,还有个[链接]。 这本书就是面向非专业人员编写的,不需要编程经验,有高中数学基础就可以了。 第 1-4 章介绍基本的程序逻辑(变量、分支、循环等),也是大多数 ..
-
使用集算器桌面版的Office加载项服务,可在Excel中使用SPL.X()函数执行SPL脚本并获得结果集后填充到Excel中。 如果是 Windows 系统,请从官网下载最新的集算器桌面版和 ..
-
esProc 弹性计算是运行在局域网或私有云的企业内通用计算软件,分成三个部分,服务端由 QVA 和 QVM 构成,应用端由应用程序(以下简称 APP)和 QVS 组成,存储端是 NFS、HD ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标是在前面几期基础上,将客户宽表中最近一天的新客户数据与分支机构等多个维表关联,并 ..