计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
组表支持列存,在遍历时能获得更好的性能。 [链接]1.2.1 把数据表转储成组表 文本转储 A 1 =file(“Orders.txt”).cursor@t(CustomerID:string ..
-
很多免费开源数据处理引擎都可以嵌入 Java 应用中,其中 SQLite 历史悠久、用户众多;后起之秀 esProc SPL 功能也较强,下面对两者进行多方面的比较。 基本特征 语言风格 SQ ..
-
使用分布式集群来处理大数据是当前的主流,将一个大任务拆分成多个子任务分布到多个节点进行处理通常能获得显著的性能提升。因此,只要发现处理能力不足就可以通过增加节点的方式进行扩容,这也是很多拥趸者 ..
-
一、 SQL 及分析 查询SQL语句如下: create view revenue (supplier_no, total_revenue) as select l_suppkey, sum( ..
-
非图形界面中可在配置文件中配置系列号,配置文件位置为:【集算器安装根目录】\esProc\config\raqsoftConfig.xml, 在 标签下的 serialNo 标签中配置系列号 ..
-
Kafka是一种分布式的信息流平台,它的客户端分为生产者、消费者两种,生产者提交数据,消费者读取数据。Kafka中传递的事件消息没有固定格式,消费者、生产者自由约定一些个性化格式,比如是JSO ..
-
select * from ( select s_acctbal,s_name,n_name,p_partkey,p_mfgr,s_address,s_phone,s_comment from ..
-
很多程序员尝试用 Stream 取代 SQL,但 Stream 缺乏专业的数据对象,在结构化计算方面远不如 SQL 专业。作为对比,SPL 有完善的结构化数据对象,且提供了不依赖于数据库的结构 ..
-
一、 SQL 及分析 查询SQL语句如下: select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp ..
-
概述 数据维护例程可以实现数据的定期维护和更新,对于实时热数据,只能在查询的时候临时读取,再和历史数据归并后返回。 这就要求实时热数据的查询能快速返回结果,且能接受频繁的并发访问,这对业务系统 ..
-
1. 添加Age 、Fullname 字段 esProc: A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\esProc_vs_pyt ..
-
转置功能常用报表等前端展现,将查询出来的数据转置成指定的显示格式。比如行转列,列转行,以及比较复杂的动态转置等等。其中静态转置是指,转置后的表结构事先可以确 ..
-
[链接]任务背景 国际大环境就不用多说了。 对于数据库类的关键业务,全国产技术(国产 CPU+ 国产数据库)和国外主流技术在性能上相比还有不小的差距,经常需要借助分布式技术使用数倍的硬件才能获 ..
-
对Excel进行解析\生成\查询\计算等处理是Java下较常见的任务,但Excel的文件格式很复杂,自行编码读写太困难,有了POI\EasyExcel\JExcel等类库就方便多了,其中POI ..
-
一、 SQL 及分析 查询SQL语句如下: select p_brand,p_type,p_size, count(distinct ps_suppkey) as supplier_cnt f ..
-
算法背景 之前介绍了有边界的线性拟合算法,《有边界的线性拟合算法》,它的约束条件是所有系数都须在[0,1]范围内,但实际生产环境不仅仅是这个基本的限制。 已知条件 自变量矩阵X,在生产环境中称 ..
-
通常的分组都是等值分组,有以下几个特点: 1) 原集合的所有成员都在且只在唯一的组中; 2) 没有一个组是空集; 满足这种特点分组在数学上又称为完全划分。 那么是不是还有不完全划分呢? 是的, ..
-
数据分析过程中,数据可视化可以帮我们更好的感知数据,从而采用更好的策略来处理数据,本文就来对比一下 Python 和 SPL 在数据可视化方面的情况。 Python Python常用的两个画图 ..
-
编写程序难免出现 bug,有时即使程序能够正常运行,得到的结果也可能不正确,所以除了查看报错信息,我们通常还要进行一些调试工作,本文就来对比一下 Python 和 SPL 在程序调试方面的情况 ..
-
观察一些大型用户的 BI 系统,经常会发现数据仓库中有很多快照表。如某交易业务的 BI 系统,交易明细表很大,被按月存储成多个分段表。还有一些相对不太大的表,计算时要和交易明细表关联,比如客户 ..
-
数据分析中,经常会遇到两表或多表关联,表间关联关系可以分为以下几种:一对一、一对多、多对一和多对多。一对一关联,是指一张表的一条记录只与另外一张表的一条记录对应;一对多关联,是指一张表的一条记 ..
-
什么样的代码算低? 低代码这个词这两年热闹起来,冒出一堆创业团队搞这东西。以前只知道代码有长短,现在才知道代码还有高低。 所谓低代码,直观来讲,就是让代码写起来更简单。完成同样的任务时,代码量 ..
-
关系数据库提供了 SQL,因而有较强的计算能力,但很遗憾的是,这个计算能力是封闭的。所谓计算封闭性,是指要被数据库计算和处理的数据,必须事先装入数据库之内,数据在数据库内部还是外部是很明确的。 ..
-
连接(JOIN)用于把来自两个或多个表的记录结合起来。本文将探讨对于连接问题,SPL 的解决方案和基本原理。 表之间存在的数据相互依赖关系,就叫做表间关联关系。表间关联关系可以分为以下几种:一 ..
-
关联查询一直是 BI 的老大难,为了解决关联问题,采用宽表(CUBE)是一种常见的手段,即通过事先构建宽表消除多表关联来绕过关联查询的难题。 但这样做会导致 BI 的灵活性变差。 我们来考察 ..