-
【摘要】 本文分析大文件计算的实现原理,如过滤、聚合计算、添加计算列、排序、分组聚合、topN 等,以及利用并行计算来提高计算速度,并用 esProc SPL 举例说明如何用简洁的脚本实现大文 ..
-
什么是有序计算 使用过 SQL 的朋友对计算字段都不会陌生,比如 firstname+lastname,year(bi ..
-
机器学习发展到今天已经有众多优秀前辈给我们贡献了各种各种现成的开源包 以最流行的 Scikit-learn 为例,提供了包括回归 (Regression)、降维(Dimensionality ..
-
【摘要】 C 银行的资金头寸报表很慢,严重影响业务,如何解决?点击了解 ${article} 看看问题 C银行有个资金**报表很慢,业务人员要等待1分30秒才能看到结果。资金**报表非常重要, ..
-
这个问题得从两个方面看。 如果这个 web 版的报表工具指的是现在的自助报表,也就是 BI、多维分析,那它是有意义的, 而且各厂商们都已经做的挺好,可以让业务人员通过简单的拖拽进行各种数据分析 ..
-
【摘要】 B 银行自助分析系统只能支持 5 并发,造成大量业务人员长时间等待。如何破解?点击了解 ${article} 现状分析 B银行的电子银行自助分析系统,需要查询指定日期的客户交易明细。 ..
-
我们知道,数据挖掘的基本流程包括:(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。其中第 4 步,数据预处理和建模是整个流程的核心部 ..
-
【摘要】 互联网贷款产品指标跑批任务耗时 7.9 小时,亟需优化!点击了解 ${article} 问题说明 T银行通过某互联网渠道对客户发放贷款。放款、还款明细数据存放在Mysql中,每天都会 ..
-
先来看第一个问题:自助报表是什么? 自助报表这个概念其实已经存在很久了,从之前到现在, olap 多维分析、 BI、敏捷 BI 其实基本都是一回事,都是 ..
-
报表是什么? 带数据的表格和图表就都是报表,像工资表,考勤表,成绩表,资产负载表等等都是报表。 那报表工具,顾名思义就是用来做报表的工具,那 Excel 是不是也算报表工具?广义上讲当然也算。 ..
-
【摘要】 字符串和日期时间都是基础数据类型。虽然说是基础,使用起来却经常给我们带来麻烦。SPL 提供了丰富而简洁的函数,可以轻松解决字符串和日期 ..
-
【摘要】 新增保单关联历史保单的跑批任务非常耗时,点击了解 ${article} 问题描述 P保险公司的车险业务中,需要用往年历史保单来关联新的保单,在跑批中称为历史保单关联任务。在提醒老客户 ..
-
为了回答这个问题,我们先来了解一下建模的流程,通常一个完整的数据挖掘项目包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。 ..
-
前言 现在企业的报表开发大部分都使用报表工具完成,成熟的报表工具提供了丰富的显示设置、图表类型、导出打印等功能可以简化报表开发,非常方便。但在实际报表开发中还是经常碰到一些非常棘手的深层次问题 ..
-
【摘要】 只用了一天的时间,就把明细查询提速 2000 多倍,真的很香!点击了解 ${article} 问题描述 C保险公司业务系统中,团体保险明细查询速度很慢。查询时输入保单号,要返回团体保 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
当前,提到人工智能、数据科学几乎就一定会提到 Python,很多人工智能相关的课程实质上也都在大篇幅的讲 Python,有的初学者甚至认为人工智能和 Python 是划等号的,随着人工智能概念 ..
-
【摘要】 数据集合之间,经常需要进行一些基础的运算:比如集合间的和、交、并、差、异或等运算,还有相同数据结构的集合进行有序归并等等。当数据量很大 ..
-
最开始中国式报表这个术语是针对国外的报表工具来说的,当时国外的报表工具只能做一些格式很规整的报表,到了中国以后发现有很多报表做不出来,或者做起来极不方便,还需要大量的人工编程。这些报表成了国外 ..
-
【摘要】 每个指标计算都涉及到千万数据量大表的关联、条件过滤、分组汇总、去重计数等多种混合运算,而 3 秒钟要计算 2000 个指标!究竟如何做到?点击了解 ${article} 问题描述 W ..
-
目前国内市场上的报表 BI 工具琳琅满目,看起来也各有特点,这给选型工作带来了一些困扰,本文就一些较活跃的报表 BI 产品进行点评,对于不太熟悉这些产品和技术的同学,可作为参考资料。 这里选了 ..
-
数据挖掘通常需要结构化数据才能建模,而不是近些年来热闹的非结构化数据,预测建模仍然是结构化数据上的运算! 所谓结构化数据,是指表现为二维形式的数据,一般特点是:数据以行(也称样本)为单位,一行 ..
-
用报表工具开发,核心功能是把各种数据源的数据以表格或图表的形式在线上网页端呈现出来。但是很多场景都是线上和线下结合,既要方便线上在系统中查看到报表,同时还得能和传统的线下业务无缝贴合,比如把结 ..
-
回答这个问题之前,我们先来看看报表工具到目前为止都有哪些形态,虽然国产的大部分都是 java 语言开发的,功能方面也基本相同,但是形态还是有差异的。 差异在于,有一些厂商始终把报表定位为一个通 ..
-
这些词我们在建设分析型应用时经常会听到,这几个词也经常被弄混,这里来梳理一下。 BI BI 是 Business Intelligence(商业智能)的缩写,是指企业利用已有数据进行数据分析从 ..