计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
【摘要】 集算器 ETL 工具可以从多种数据源中抽取数据,进行过滤计算排序及关联运算等,再将结果 ..
-
【摘要】 总是有大批 TXT/CSV/XLS 要处理,而现有的一些技术又存在很多不足:JAVA 代码繁琐对人员要求高;SQL 计算封闭,无法计算库外数据;Python 外围开源包安装配置麻烦, ..
-
Q1 运行环境 esProc 目前是纯 Java 软件,只要有 JDK1.8 及以上版本的 JVM 环境的任何操作系统都可以运行,包括常见的 VM 和 Container。 esProc 正常 ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标,是在前期基础上实现预汇总和冗余排序,继续提升计算速度。 实践的步骤: 1、 预 ..
-
背景与方法 本例程适应场景:数据维护的实时性不高,可以在指定时刻定期执行,一般数小时或天为单位;总数据量很大,需要拆成多个分表存储;支持追加和更新两种模式。每次数据维护量可能较大,可以使用游标 ..
-
中间表是数据库中专门存放中间计算结果的数据表,往往是为了前端查询统计更快或更方便而在数据库中建立的汇总表,由于是由原始数据加工而成的中间结果,因此被称为中间表。在某些大型机构中,多年积累出来中 ..
-
在《 http://c.raqsoft.com.cn/article/1600226611215》(以下简称前文) 一文中我们介绍了如何使用历史数据进行商业预测的过程。不同的商业需求,还会有些 ..
-
应用计算困境 顾开发还是顾架构? Java 是当前应用开发最常用的语言,但是 Java 写数据处理的代码并不简单,比如针对两个字段的分组汇总要写成这样: Map> summary = n ..
-
一、 测试任务 电商业务中漏斗分析是常见的统计需求。用户使用智能设备购物时,系统会建立连接形成会话 session。每个会话又包含很多个操作事件 event,比如:访问网站,浏览产品页,下单购 ..
-
一、 查询要求 Q18语句查询找到曾下过大数量订单的前 100 位顾客,大数量订单定义为总数量超过某一特定数量的订单。查询结果列出顾客的姓名、 ..
-
OLAP(Online Analytical Processing)是指在线联机分析,基于数据查询计算并实时获得返回结果。日常业务中的报表、数据查询、多维分析等一切需要即时返回结果的数据查询任 ..
-
一、 查询要求 Q13 语句根据消费者的订单数量确定消费者的分布,包括过去和现在都没有订单记录的消费者。它计算统计多少消费者没有订单,多少有 ..
-
DCM 是什么 现代应用无时无刻不在与数据打交道,数据计算无处不在,报表统计、数据分析、业务处理不一而足。当前数据处理的主要手段仍然是以关系数据库为代表的相关技术,虽然使用高级语言(如 Jav ..
-
【摘要】 集算器作为敏捷数据计算引擎,可以在报表数据源、JAVA 计算层、离线自由计算 3 个方面提供高效的计算输出,帮助用户解决由于开发效率低,描述业务难等这些问题: 1、为报表准备数据的 ..
-
1. 计算每年同月份增长比 esproc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\kaggle_data\\music_pro ..
-
多年前开发了一套报表,当时的多数据集(涉及一报表从多库关联取数) 在报表内计算是通过 select 函数加条件的方式实现 关联取数。 如 [图片]多数据集(两个数据源) 报表内关联取数 [图片 ..
-
ETL 是将数据从来源端经过清洗(extract)、转换(transform)、加载(load)至目的端的过程。正常的 ETL 过程应当是 E、T、L 这三个步骤逐步进行,也就是先清洗转换之后 ..
-
在SPL中,从数据源将数据读成游标以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、Top-N、分组Top-N、去重、分组去重、关联查询等。游标上的运算分为延迟计算和 ..
-
[图片] [图片] [图片] [图片] 报表与计算层 [图片] 报表 [图片] 传统与创新 [图片] [图片] 困难计算 [图片] 特殊格式 [图片] 多样性数据源 [图片] 非数据库上的SQ ..
-
【摘要】 对于有序集合来说,有时候数据集的次序在分组时是有意义的。我们有时需要把具有相同字段值或者同时满足某些条件的相邻记录分到同一组。比如 2 ..
-
一、 问题描述 键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 ..
-
【摘要】全国产数据库面临软硬件强依赖国外技术的尴尬,硬件缺芯(90% 以上的高端芯片依赖进口),软件缺新(依赖国外的理论、模型,甚至代码)。如何让基于国产硬件运行的国产数据库性能达到甚至超越国 ..
-
算法背景 很多仪表设备都能定时产生一些数据,称之为时间序列。 下图是一张时间序列的走势图,横轴是时间(dd hh:mm),纵轴是数值。 [图片] 数据的波动很大,看局部会有点杂乱无章的感觉,但 ..
-
XML 的多层结构计算起来难度较大,XPath 的计算能力严重不足,只能在计算需求较弱的互联网应用早期发挥作用,如今的计算需求日益复杂多变,需要 SPL 这种能力更强的 XML 计算语言。点击 ..
-
一、 SQL 及分析 查询SQL语句如下: select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_total ..