计算&AI •
902 引用 •
973 回帖 •
449 关注
博客
关注
-
Excel是很常见的文件格式,在Java中可以使用Apache Poi开源包读取Excel单元格数据。POI 虽然强大,但也仅限于读取数据,编程读取数据的工作量比较大,而且不能在 ..
-
Excel文件是很常见的文件格式,读写时需要注意如下一些问题: 1、 标题行:此行是各列的名称,也可以没有标题行,第一行就是数据记录。 2、 大文件:文件数据很多,不能 ..
-
SFDC 的报表有时不够丰富,需要在外部进行再统计并制作报表,本文比较四类再统计技术,考察它们多方面的能力。比较中发现,SPL 计算能力强、实时性好、架构简单、开发成本低,且提供了易用的 JD ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 主键连接是非常常见的情况,如订单和订单明细。但数据库并不区分关联的字段是什么,一 ..
-
有些报表的运算比较复杂,从原始数据到呈现需要经过多步加工,如何更简单高效地实现复杂多步骤的运算直接影响到报表开发效率和性能。本文将比较几种常见的报表多步骤数据准备的方法。 复杂 SQL/ 存储 ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 对数据表做分组汇总时要全表遍历。如果要做 n 种不同的分组,就要对数据表遍历 n ..
-
结构化文本也就是行式文本文件,是很常见的文件格式,比如TXT、CSV。在Java中可以硬编码处理,但比较繁琐。还可以使用Commons CSV、OpenCSV、SuperCSV等开源包来实现解 ..
-
报表的数据来源非常丰富,理论上任何数据源都可能同时作为报表的数据源来源,RDB、NoSQL、CSV、Excel、Json、Hadoop 不一而足,这就产生了报表开发中的多源问题。如何解决多源带 ..
-
在SPL中,从数据源将数据读成游标以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、Top-N、分组Top-N、去重、分组去重、关联查询等。游标上的运算分为延迟计算和 ..
-
在SPL中,从数据源将数据读成序表以后,就可以进行所有SQL式的运算,如过滤、汇总、跨列计算、排序、分组汇总、分组过滤、Top-N、分组Top-N、去重、分组去重、关联查询等。本文以文件数据源 ..
-
【摘要】 JAVA 应用必须通过 JDBC 从数据库中取数,有时候我们会发现,数据库的负担一点也不重而且 SQL 很简单,但取数的速度仍然很慢 ..
-
结构化文本也就是行式文本文件,是很常见的文件格式,比如TXT、CSV。结构化文本文件通常每行对应一条记录,各行有相同的列,相当于数据库中的一张数据表。读写时需要注意如下一些问题: 1、&nbs ..
-
报表工具连接 RDB 可以使用通用的 JDBC/ODBC,几乎所有报表工具都提供了相应支持,但对于非 RDB 各类报表工具的能力就不尽相同了。本文探讨报表工具应对非 RDB 的常用方法并点评, ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 数据表 T 的字段 x 按照集合 X={X1=Xn。分段之后,按照段号分组汇总。 ..
-
集算器SPL语言中提供了httpfile函数用于读取HTTP页面的数据。但为了数据的安全性,有些服务器会对访问数据者的身份进行认证,只有通过认证的访问才能读取到页面数据。常用的身份认证分为两大 ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 TopN 是指从数据中查找前 N 名 / 后 N 名。以 Oracle 为例,S ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 去重本质上是分组运算,需要遍历原数据。计算时要一直保持一个去重后的结果集,每一条 ..
-
很多程序员尝试用 ORM 技术实现 SQL 在不同数据库间的移植,但 ORM 技术只适合 OLTP 场景下的简单 SQL,难以实现 OLAP 场景下较复杂 SQL 的移植。作为对比,集算器 S ..
-
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 WHERE 子句中出现 IN 比较常见,比如:按照客户年龄段枚举值过滤,还有地区 ..
-
Kotlin 在 Stream 的基础上有所改进,很多程序员尝试用 Kotlin 取代 SQL,但 Kotliln 同样是编译型语言,缺乏专业的数据对象,在结构化计算方面远不如 SQL 专业。 ..
-
很多程序员尝试用 Stream 取代 SQL,但 Stream 缺乏专业的数据对象,在结构化计算方面远不如 SQL 专业。作为对比,SPL 有完善的结构化数据对象,且提供了不依赖于数据库的结构 ..
-
XML 计算起来不够方便,通常要用计算类库完成,本文将比较四类 XML 的计算库,包括 dom4j、MySQL、Scala、集算器 SPL,重点考察这些工具在语法表达、部署配置、数据源方便的差 ..
-
Json 比普通的二维数据计算起来更困难,这种情况下要用计算类库完成,本文将比较四类 Json 的计算库,包括 JsonPath、SQLite、Scala、集算器 SPL,重点考察这些工具在语 ..
-
MongoDB 内置的查询表达式有时不够方便,这种情况下就要用到第三方函数库完成计算,本文深度比较四类 MongoDB 上的计算库,包括 MongoDB Connectioin\Calcite ..
-
【摘要】 用实例、分步骤,详细讲解多维分析(OLAP)的实现。点击了解 ${article} 实践目标 本期目标,是在完成前几期优化的基础上,用有序归并或一体化存储来实现主子表及其并行多维分析 ..