计算&AI •
990 引用 •
1070 回帖 •
471 关注
博客
关注
-
【摘要】 在线查询时,慢的问题经常让使用者抓狂,业务部门的不满会转换成技术团队的压力,但基于传统技术体系这类问题往往解决的不好。本文提出一种基于算法特性设计和使用专用的存储方案来大幅提升在线查 ..
-
SQL 作为目前最常用的数据处理语言,广泛应用于查询、跑批等场景。当数据量较大时,使用 SQL(以及存储过程)经常会发生跑得很慢的情况,这就要去优化 SQL。优化 SQL 有一些特定的套路,通 ..
-
测试环境 系统:CentOS7 虚拟机:VMWare 15.5.1build-15018445 内存:32G CPU:4 数据:1G规模的TPCH 数据读取 数据源分为两种,分别是文本文件和数 ..
-
【摘要】 数据分析场景中,充斥着聚合运算,常见的有求和、计数、均值、最大最小值等等,想要得到正确的结果值,遍历技术必不可少,如何更加高效地对数据进行遍历?点击:性能优化教案 - 遍历,来乾学院 ..
-
[图片] WordCount 差不多是最常用的分布式系统练习程序了,Hadoop 就经常用这个当例子。我们来看用集算器怎么做 wordcount。 先从 单线程开始。 例如,D:\files\ ..
-
【摘要】 选出运算是指在集合中,根据指定条件获取成员。SQL 和 SPL 是大家比较熟悉的程序语言,本文将探讨对于选出运算问题,这两种语言的解决 ..
-
SPL是一种面向结构化数据计算的程序设计语言,集算器是SPL语言的java实现,采用网格式编程 ..
-
Python 和 esProc SPL 都是非常好用的数据分析和处理的程序语言,有些人可能只熟悉其中一种,为了方便大家进一步了解这两门语言,选择更适合自己的程序语言。这里以系列文章的形式从各个 ..
-
Excel文件是非常常见的数据文件,在数据处理业务中,经常要把Excel文件数据解析成结构化数据,或者把处理好的结构化数据保存到Excel文件中。在Java中可以使用Apache Poi开源包 ..
-
有序存储是将数据按照某些字段(通常是主键或部分主键)排序后,连续写入外存(主要是硬盘)。有序存储能实现低成本的数据压缩,能够避免频繁跳跃的读取硬盘。而且,计算时从硬盘中连续读出的就是排好序的数 ..
-
概述 SPL主要是为了解决SQL的困难(复杂任务很难写且跑得慢、跨源计算难、依赖存储过程等)而设计的,其应用场景也与SQL类似,一般会配合应用程序工作,且能支持大数据,包括高性能运算和并行运算 ..
-
【摘要】 序号访问是指通过序号(索引下标)来访问有序集合的成员。序号访问除了按单个序号访问集合成员,还有按多个序号同时取多个成员的需求。除此以外 ..
-
在数据库应用开发中,我们经常需要面对复杂的SQL式计算,多级关联就是其中一种。SQL的join语句比较抽象,只适合表达简单的关联关系,一旦关联的层级较多,相应的代码就会变得非常复杂。而SPL则 ..
-
SPL 在易明建模的配合下可以提供的是全自动化的建模预测。使用方法主要包含以下步骤: 一、配置易明建模 1. 下载安装易明建模软件 下载地址:http://www.raqsoft.com.cn ..
-
有关国际象棋的问题很多,八皇后问题就是其中相当著名的一个。在 8×8 的国际象棋棋盘中,放入 8 个皇后,使它们不互相攻击,共有多少种方法呢? [图片] [图片] 国际象棋中皇后的威力巨大,攻 ..
-
本文旨在介绍如何将 git 上的开源项目 esProc 导入到 eclipse 中,为用户进行软件开发提供方便。 eclipse 通过 Git 获取 esProc 步骤 打开 eclipse, ..
-
全文下载 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源链接 常用计算的 SPL 代码 http://doc.raqsoft ..
-
【摘要】 随着数据量的持续增长,并发访问越来越密集;以及业务种类的不断丰富,报表需求还在不断增加,数据库需要不断扩容来应对这些变化。然而,仅仅对数据库本身扩容难免陷入高成本低成效的窘境,企业应 ..
-
前几天听说 OceanBase 打榜了 TPCH 的第一名,之后又看到这样一个测试报告[链接]。 先点评一下这个测试报告: 1. 坦白地说,这个测试还不太专业,并不能比出分布式大数据计算的关键 ..
-
集算器 SPL 语言支持处理多样性数据源,通过 SPL 对 MongoDB 集合与 MySql 表进行 join 关联 ..
-
对于一个数据挖掘项目而言,我们可以选择的模型众多,比如我们可以选择:线性回归、Logistic 回归、决策树、集成算法等,同样对于一个模型而言,也有很多参数和图形来评估模型好坏。数据挖掘的目的 ..
-
【摘要】 报表做不完,客户总抱怨,老板一直催,报表没完没了怎么办? 投入很多技术力量做报表,还是疲于应付? 技术高手用来做报表,感觉很浪费? 缺少低成本高效率的报表开发应对方案? 如果你也面临 ..
-
算 24 点,是一种常见的智力游戏。它可以使用抽去大小王的扑克牌来玩,随便抽出 4 张牌,要求通过加、减、乘、除等四则运算,并使用所有的这 4 个数,将结果算为 24。在玩这个游戏时,扑克牌中 ..
-
【摘要】 本文介绍小文件与大文件在进行数据去重时的几种处理办法,比如按整行或关键列去除重复数据或留下重复数据,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 &n ..
-
一、 查询要求 Q16语句查询能够以指定的属性供应零件的供货商数量。可用于决定在订单量大,任务紧急时,是否有充足的供货商。 Q16语句的特点是 ..