"更新于 20191216 降费提速 A. [链接] B. [链接] C. [链接] 省时提效 D. [链接] E. [链接] F. 数据整理 G. 中台应用 H.[链接] I.[链接] 舍我其 .."

admin 北京
乾学院 1 号会员
1 回帖 • 1,597 浏览 • 4 年前

集算器应用场景汇总

导航

集算器(3)

更新于 20191216

降费提速
A. 高性能在线计算
B. 高性能离线跑批
C. 高性能多维分析
省时提效
D. 报表数据源
E. Java 计算
F. 数据整理
G. 中台应用
H.数据微服务
I.边缘计算
舍我其谁
J. 跨库计算
K. 多样数据源
L. 算法外置
M. 临时计算

A.高性能在线计算

【方案说明】海量数据下的高并发查询、多维分析、自助分析等在线应用，需要及时响应才能到达极速体验。传统经验是扩充数据库节点，摆放前置数据库或 ES 服务，采用这些方法将会承担昂贵的软硬件成本，承担前置数据库因数据不全无法胜任全量查询或 ES 无法关联查询的风险。集算器将数据冷热分离、按列压缩存储热数据，可编程路由结合 SPL 高效算法，只需少量硬件，就能实现各种关联和复杂条件的快速查询。

【技术案例】
1. 海量账户大并发实时查询解决方案
2. 产权交易所统一数据集市案例
3. 银行业自助分析前置服务器方案
4. 实时报表 T+0 的实现方案
5. SAP 系统大数据量资产负债表的性能优化案例
6. 生产制造业库龄计算案例

【代码示例】
1. 用计算路由的方法优化 BI 后台性能
2. 超大数据下大批量随机键值的查询优化方案
3. SPL 组表进一步优化 JOIN 性能
4. 批量随机键值查询测试
5. 漏斗转换计算
6. 集算器组表实现轻量级全文检索服务 New!

【案例讲解】
1. 大批量 - 大客群交集统计 New!
2. 高并发 - 有关联查询 New!

【方案说明】纯粹为了使用 SQL 和存储过程，将大量数据导入数据库跑批，往往速度太慢、耗时过长。为了给数据更新留有空间，数据库中数据存储的不够紧密，制约了数据库的读写效率，而离线跑批的数据都是不需要更新的，加上 SQL 很难控制执行路径和实现高效算法，存储过程在核心引擎之外，性能较差，用数据库跑批总不理想。数据存储成压缩文件可以更紧实，不仅遍历效率更高，而且能灵活分布、并行计算也更加方便，采用集算器 SPL 又可以根据数据特征实现高效算法，集算器在历次跑批性能对比中总能大幅胜出。

【技术案例】
1. 保险行业历史保单关联业务跑批性能优化

【代码示例】
1. 车险往年保单关联计算的性能优化
2. 从 TPCH 测试看 SPL 性能优化

C.高性能多维分析

【方案说明】用 CUBE 预汇总的方式做 OLAP 查询，降低了复杂度，保障了及时性，但当数据庞大、维度众多，存储空间也需非常巨大，大量无法通过预汇总的查询，只能放弃。用数据库支持 OLAP 查询，因库内数据间隙大，读取慢；Join 每次都要现算，浪费大量资源，屏蔽 Join 放入宽表，又失去了灵活性；集算器会根据数据的特征，采取列式压缩明细数据、一次性预关联维度数据、部分预汇总数据等手段，平衡空间与时间的矛盾，不仅大幅提高了性能，还能在 SPL 支持下实现更多的复杂计算。

【技术案例】
1.银行业自助分析前置服务器方案

【代码示例】
1. 轻量级可嵌入多维分析后台

D.报表数据源

【方案说明】解决痛点：SQL/ 存储过程过于复杂，开发效率低；涉及文本 /XLS/HTTP 等无计算能力的数据源，开发繁琐；Java 计算，与应用耦合性过高，维护困难；大数据报表导出内存溢出，访问速度慢；T+0 实时报表，跨库实现难度高；数据库中间表繁多难以管理，大量耗用数据库资源。

【技术案例】
1.银行业大数据量清单报表案例
2. 银行可视化大屏后端计算案例
3. 银行业离线报表订阅系统案例

【代码示例】
1. 如何处理报表中的舍位平衡
2. 如何优化多数据集关联报表
3. 百万级分组大报表开发与呈现
4. 秒级展现的百万级大清单报表
5. 多层科目任意组合汇总报表的性能优化
6. 实现报表的可控缓存
7. 集算器助力 ireport
8. Birt 如何实现交叉表的动态分组
9. Birt 如何实现不规则月份统计

【汇总讲解】
1. 多层科目任意组合汇总表的性能优化 New!
2. 解决 BIRT 报表特殊布局的若干示例 New!

E.Java 计算

【方案说明】解决痛点：直接 Java 计算，代码冗长且很难复用；实现开发周期长，性能不确定，质量不可控；应用耦合过高，算法修改会导致整个应用重新编译部署，缺乏敏捷性。

【代码示例】
1. Java 嵌入 SPL 轻松实现数据分组
2. Java 嵌入 SPL 轻松实现 Excel 文件合并

F.数据整理

【方案说明】解决痛点：专业 ETL 工具环境复杂，使用不灵活，对人员要求高，难以随时随地准备数据；过程计算复杂，SQL/ 存储过程难写、难调试；多样性数据源处理困难，经常需要事先数据入库，步骤多效率低。
【技术案例】
1. 银行柜员绩效考核案例
2. 大型企业绩效考核系统的应用方案
3. 某税务局数据手册流程自动化案例 New!

【代码示例】
1. 数据脱敏的处理方法及查询