-
使用历史数据进行商业预测,首先我们要知道什么东西是能够被预测的,举几个例子: 银行放贷款时,希望预测出当前贷款人是否可能违约? 保险公司希望预测出客户的理赔风险,从而更灵活的制定保费,高风险高 ..
-
【摘要】 在数据计算时,除了每条记录本身,经常也会关心有序集合中与位置相关的计算。例如:编号为 752084 的订单在销售表中的第几行?2019 ..
-
Excel 可以对数据进行分组汇总,也可以用透视表对数据进行多层次分析,但提供的汇总及相关运算都很简单,稍复杂一些的运算没法实现或者很难实现了。比如我们希望计算分组内的排名,按分组汇总值再过滤 ..
-
【摘要】 TopN 查询,即从数据中查找前 N 名 / 后 N 名。TopN 查询除了直接取值,还有查询 TopN 所在记录的详细信息,有时候还 ..
-
我们知道,报表呈现的数据常常并不是直接从数据库(源)取出来的数据,而还要进行一些运算,报表工具通常也会提供一定的运算能力(如过滤、分组等)以应对这种需求。但是,情况复杂时,报表数据集上的运算可 ..
-
问题背景 G 电力集团需要统计各子公司采购额月度走势,即给定月份区间后,统计各子公司各月份的采购额,以交叉表的形式呈现,左表头显示为子公司,上表头动态显示月份。如果统计结果缺少某月份,上表头需 ..
-
报表上的计算比较复杂,常常是内存计算,报表工具能支持的容量也就是个重要的技术指标。我们当然希望报表占用的内存尽量少,这样同样内存空间可以容纳更大的报表(更多的单元格),也能支持更大的并发数量。 ..
-
问题背景 F 科技公司新财务系统采用 saas 架构,报表需要从底层科目开始汇总,逐级汇总到顶级科目。Saas 架构要支持多租户,而每个企业租户都可以自由定义科目,因此科目层级和汇总次数是动态 ..
-
[链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接] [链接]
-
问题背景 E 电力企业在风力发电系统中需要查询风力发电机运行状况(风机停机时间、停机时长、是否超过阈值等信息),在系统中通过报表(图表)输入时间和风机参数进行查询。 设备运行状态由工业设备和实 ..
-
企业为了提高供应链的整体效率,通常都会把库龄查询作为常用的报表使用。通过全局范围的库龄分析,及时了解热销商品和滞销商品及其分布情况,合理地进行库存调度和市场促销,可以大大提高库存周转率,促进销 ..
-
项目背景 银行员工绩效考核报表主要用于查询员工工作的考核结果,及时了解员工最新情况,鼓励业绩突出的员工,提醒并激励后进员工。 [图片] 绩效考核是一项综合性事务,计算时往往涉及多种指标,实现上 ..
-
问题描述 X 公司资产负债表,访问人员众多,访问频次很高,明细数据约 6000 万,业务人员要等待 60 秒以上才能看到结果,响应速度严重影响业务,急需优化。 报表表样如下: [图片] 解决过 ..
-
对于一个数据挖掘项目而言,我们可以选择的模型众多,比如我们可以选择:线性回归、Logistic 回归、决策树、集成算法等,同样对于一个模型而言,也有很多参数和图形来评估模型好坏。数据挖掘的目的 ..
-
Pandas 是 python 的一个数据分析包,是基于 NumPy 的一种数据分析工具,其中纳入了大量库和一些标准的数据模型,提供了快速便捷地处理数据的函数和方法,是高效地操作结构化数据集所 ..
-
数据挖掘模型建好后,我们通常会关注建模时的准确率查全率等指标,但是常常会忽略模型另一个重要指标:模型的衰减程度,也就是模型在实际应用中预测能力的变化(一般都会越用越差)。 为什么会发生模型衰减 ..
-
【摘要】 本文介绍小文件与大文件在进行数据去重时的几种处理办法,比如按整行或关键列去除重复数据或留下重复数据,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 &n ..
-
如今,提到人工智能,几乎无人不谈深度学习,似乎不用深度学习就不好意思谈人工智能。今天我们就用几分钟的时间来讲一下深度学习到底是什么,有什么用。 首先深度学习并不等于人工智能,它只是一种算法,和 ..
-
问题背景 B 石化集团经常需要查询一种特殊的中间表,比如以物料维度、时间维度、指标名为参数进行查询,如果时间参数输入年、月、日、空中的任意一种,结果应当输出对应层级的指标。由于维度是多个,各维 ..
-
页面渲染是指报表在计算完成后,生成 html 页面时加上各种格式外观属性的过程。如果在报表中添加了大量的呈现效果(隔行异色、背景图、条件警戒色等)时,页面渲染的速度就会受到影响变慢,但往往这些 ..
-
【摘要】 本文介绍两个文本文件进行比对,按照需求找出文件中数据相同或不同时,会遇到的几种情况,并用 esProc SPL 举例实现。请点击 ${article} 了解详情 在数据 ..
-
继《多源分片报表》后,我们继续考察这些报表工具对复杂报表的支持程度。 排名与跨行组运算也是典型的中国复杂报表形式,这类报表的源数据集通常比较简单,但在表格的单元格之间会有较随意的计算要求。在制 ..
-
我们经常看到报表中会有一些统计图形,甚至有些页面全是图形,这些图形和报表是个什么关系?也是报表工具做出来的吗? [图片] 其实报表从来都不只是表格,图形一直以来都是报表中的一部分,很多数据通过 ..
-
【摘要】 X 银行把上亿客户划分为几千个客群,要计算任意几个客群的交集,还要按照维度过滤,还要秒级响应?点击了解 ${article} 问题描述 X银行用户画像应用中,需要完成客群交集计算。客 ..