计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
应用中有时会把某个数据库中的部分数据转储到另一个数据库,如果同类数据库且数据结构相同,则可以使用数据库DUMP工具来做。如果是异构数据库则一般会使用文本文件作为中介,但文本文件可能丢失数据类型 ..
-
JAVA 应用必须通过 JDBC 从数据库中取数,有时候我们会发现,数据库的负担并不重而且 SQL 很简单,但当数据量大到一定程度时取数的速度 ..
-
对于不同类型的数据库,即使是数据库都能支持的SQL查询,语法也大体相似,但仍然可能会有细微差别而不能通用。主要原因在于这些数据库各自的函数参数规则不同。 比如将字符串'2020-02-05'转 ..
-
在SPL中,除了使用系统提供的各类函数,还可以编写实现某种特殊功能的自定义函数,登记注册以后就可以象系统函数一样直接在SPL脚本中使用。 1. 定义、部署及注册 每个 ..
-
在SPL中,除了使用系统提供的各类函数,还可以调用用户在Java类中编写的方法,用来处理一些比较特殊的运算,或者封装好的某些计算过程。 1. 调用方法 ..
-
SPL提供了丰富的日期时间操作函数,分为基本处理、运算两大类,包括当前时刻、日期时间分量的拆分、分量组合成日期时间、格式转换、精度调整、相关日期、时间间隔、相对时间、相同判断、工作日计算、时间 ..
-
文字处理在任何一门程序语言中都是必不可少的,SPL提供了十分丰富的文字处理函数,分为字符处理、简单串处理、与序列相关、复杂分析等几大类,囊括字符串子串、判断、转换、字符编码、数据类型解析、查找 ..
-
Excel文件是非常常见的数据文件,在数据处理业务中,经常要把Excel文件数据解析成结构化数据,或者把处理好的结构化数据保存到Excel文件中。在Java中可以使用Apache Poi开源包 ..
-
Excel是很常见的文件格式,在Java中可以使用Apache Poi开源包读取Excel单元格数据。POI 虽然强大,但也仅限于读取数据,编程读取数据的工作量比较大,而且不能在 ..
-
Excel文件是很常见的文件格式,读写时需要注意如下一些问题: 1、 标题行:此行是各列的名称,也可以没有标题行,第一行就是数据记录。 2、 大文件:文件数据很多,不能 ..
-
结构化文本也就是行式文本文件,是很常见的文件格式,比如TXT、CSV。在Java中可以硬编码处理,但比较繁琐。还可以使用Commons CSV、OpenCSV、SuperCSV等开源包来实现解 ..
-
在SPL中,从数据源将数据读成游标以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、Top-N、分组Top-N、去重、分组去重、关联查询等。游标上的运算分为延迟计算和 ..
-
在SPL中,从数据源将数据读成序表以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、分组过滤、Top-N、分组Top-N、去重、分组去重、关联查询等。本文以文件数据源 ..
-
结构化文本也就是行式文本文件,是很常见的文件格式,比如TXT、CSV。结构化文本文件通常每行对应一条记录,各行有相同的列,相当于数据库中的一张数据表。读写时需要注意如下一些问题: 1、&nbs ..
-
集算器SPL语言中提供了httpfile函数用于读取HTTP页面的数据。但为了数据的安全性,有些服务器会对访问数据者的身份进行认证,只有通过认证的访问才能读取到页面数据。常用的身份认证分为两大 ..
-
1. 过滤 从数据表中筛选出满足条件的记录。 示例:从学生成绩表Students_scores.txt中筛选出10班的学生成绩,文件中第一行是列名,第二 ..
-
【摘要】 本文介绍直接用 SQL 查询文件数据的各种情况,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 在数据分析业务中经常要处理数据文件。我们知 ..
-
【摘要】 本文介绍小文件与大文件在进行数据去重时的几种处理办法,比如按整行或关键列去除重复数据或留下重复数据,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 &n ..
-
【摘要】 本文介绍两个文本文件进行比对,按照需求找出文件中数据相同或不同时,会遇到的几种情况,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 在数据 ..
-
【摘要】 本文介绍将多个文本文件和 Excel 文件合并成一个文件,或者将一个文件拆分成几个小文件时,如何处理会遇到的几种情况,并用 esProc SPL 举例实现。请点击 ${article ..
-
【摘要】 本文介绍如何将各种结构的 Excel 文件解析成结构化数据,如普通行式、复杂表头、自由格式、交叉表、主子表、大文件等,并用 esProc SPL 举例实现。请点击 ${article ..
-
【摘要】 本文分析大文件计算的实现原理,如过滤、聚合计算、添加计算列、排序、分组聚合、topN 等,以及利用并行计算来提高计算速度,并用 esProc SPL 举例说明如何用简洁的脚本实现大文 ..
-
【摘要】 数据分析师经常要处理 Excel 文件,有时需要用程序来自动化处理,有几种脚本语言都可以解析 Excel 文件,本文从编程解析 Excel 的难易程度、对不同数据格式的适应性等方面, ..
-
【摘要】 数据分析时,难免会遇到内存装不下的大数据文件,如何对大文件进行查询计算?本文分析比较了几种常用办法的优缺点,集算器 SPL 是其中最适合数据分析师用于处理大文件的脚本。请点击 ${a ..
-
一、 问题背景与适用场景 在对数据集进行排序运算时,有时会遇到这样一种场景:数据集T已经按字段a有序,而字段b无序,现在我们要将T按a、b排序,我们称之为前半有序(a ..