计算&AI •
796 引用 •
800 回帖 •
419 关注
博客
关注
-
上一节讲述了结构化文本的一些基本运算,本节继续用案例讲述二目运算和综合运算。 二目运算 集合运算(文件比较) 现有文件f1.txt和f2.txt,第一行是列名,需要对文件中的Name字段进行交 ..
-
问题概要 在日常工作中时常会遇到将数据表的行列进行转换的问题。SQL 提供了静态转置的功能 pivot 和 unpivot,但适用范围很受限,要用 SQL 实现一些比较复杂的转置功能常常会 ..
-
在SPL中,除了使用系统提供的各类函数,还可以编写实现某种特殊功能的自定义函数,登记注册以后就可以象系统函数一样直接在SPL脚本中使用。 1. 定义、部署及注册 每个 ..
-
SPL是一种面向结构化数据计算的程序设计语言,集算器是SPL语言的java实现,采用网格式编程 ..
-
一、 查询要求 Q16语句查询能够以指定的属性供应零件的供货商数量。可用于决定在订单量大,任务紧急时,是否有充足的供货商。 Q16语句的特点是 ..
-
【摘要】 脚本可视化编辑面向为不熟悉 SPL 函数的程序员,以对话框方式编辑代码。看完本文,SP ..
-
简介: 分组运算的本质是将一个集合按照某种规则拆分成若干个子集,也就是说,返回值应当是一个由集合构成的集合,然后应用这些子集进行计算。下面来看下 SPL 的分组运算。 [图片][图片][图片] ..
-
Excel 可以对数据进行分组汇总,也可以用透视表对数据进行多层次分析,但提供的汇总及相关运算都很简单,稍复杂一些的运算没法实现或者很难实现了。比如我们希望计算分组内的排名,按分组汇总值再过滤 ..
-
【摘要】 SPL 语言能够提高开发效率,进行高性能计算。作为 SPL 语言最基础的运算,序计算能够解决哪些问题呢?去乾学院看个究竟吧!${art ..
-
来源:https://groups.google.com/forum/#!topic/mongodb-user/BpgEaRqrKsA **【摘要】** & ..
-
在数据库应用开发中,我们经常需要面对各种复杂的SQL计算,多层固定分组就是其中一种。实现该算法的思路是用left join语句将源数据按照固定的依据对齐,但由于该算法往往涉及分组汇总、行间计算 ..
-
SPL提供了httpfile函数用于访问HTTP服务器上的页面、WebService及Restful服务,通过传送服务所需的参数,获得服务返回的数据或下载文件。 httpfile函数的完整语法 ..
-
【摘要】 作为 client 端的 python 通过服务端的 jdbc 接口调用 SPL 脚本,非常容易实现 pyth ..
-
在《[链接]》中我们测试过 Oracle的JDBC读出性能,现在再来测试一下写入情况。 1. ..
-
【摘要】 业务发展过程中,新报表不断、老报表要改,报表开发没完没了;为报表准备数据的 SQL 长达数 K,写起来难,维护更难;数据量大,报表呈现太慢,搞不好还溢出,用户抱怨;应用与报表高耦合, ..
-
数据计算中,分组绝对是最常用的计算方式之一,相应的,在 SQL 语言中,自然会用到 group by 了。但是,不知道你想过没有,SQL 中的 group by 并不能算是“纯粹”的分组,它实 ..
-
【摘要】 排号键是 SPL 独特的数据类型,适合替代多层次、各层不连续的键值,比如身份证号、合同编号、产品编号、组织机构代码等。排号键定位速度快,常用于优化内存索引查询和外键关联计算。点击 $ ..
-
[图片] WordCount 差不多是最常用的分布式系统练习程序了,Hadoop 就经常用这个当例子。我们来看用集算器怎么做 wordcount。 先从 单线程开始。 例如,D:\files\ ..
-
目前,由于数据挖掘技术的门槛较高,实现起来复杂度较大,因此一般一个数据挖掘项目通常就是建立一个模型,这个模型要尽量有更广泛的应用范围。这样做其实会导致模型的适应能力下降,而多个模型适用效果就远 ..
-
Case 1 背景:某银行个人分期违约数据,预测个人用户违约概率 数据集:290 万行,37 列, 477MB 目标变量:是否违约 评估内容: 测试集上模型表现:AUC、前 10%Lift、模 ..
-
【摘要】 工业设备生成的数据,通常由实时数据库进行初级采集。但实时数据过于原始,无法被信息管理系统、商业智能、数据挖掘等应用直接使用,一般需要进行标准化二次采集,形成规范一致的结构化数据服务于 ..
-
前几天听说 OceanBase 打榜了 TPCH 的第一名,之后又看到这样一个测试报告[链接]。 先点评一下这个测试报告: 1. 坦白地说,这个测试还不太专业,并不能比出分布式大数据计算的关键 ..
-
什么是轻量级?抛开技术术语,从效果上看就是为了实现操作目的,使用更轻便、更省时的方法;那么什么是高性能呢?最直接的说法就是比常用方法更加高效、更快。 下面就来介绍润乾提供的这一套轻量级、高性能 ..
-
【摘要】 JAVA 应用必须通过 JDBC 从数据库中取数,有时候我们会发现,数据库的负担一点也不重而且 SQL 很简单,但取数的速度仍然很慢 ..
-
JOIN 一直是数据库性能优化的老大难问题,本来挺快的查询,一旦涉及了几个 JOIN,性能就会陡降。而且,参与 JOIN 的表越大越多,性能就越难提上来。 其实,让 JOIN 跑得快的关键是要 ..