计算&AI •
874 引用 •
939 回帖 •
447 关注
博客
关注
-
【摘要】 对于 IT 维护能力不强企业,面对经常性的数据采集上报需求建设一个较重的上报系统不太切合实际,使用 Excel 手动填写汇总又过于原始、人力消耗过大。本文介绍一种轻量级采集上报方案, ..
-
【摘要】全国产数据库面临软硬件强依赖国外技术的尴尬,硬件缺芯(90% 以上的高端芯片依赖进口),软件缺新(依赖国外的理论、模型,甚至代码)。如何让基于国产硬件运行的国产数据库性能达到甚至超越国 ..
-
【摘要】 高效率数据计算中间件(Data Computing Middleware,简称:DCM)可以为应用提供数据计算服务,从而实现数据计算高效开发、高效运行、应用解耦;DCM 可用于以下场 ..
-
【摘要】 企业为了降低报表的冗余和减少重复报表开发,一般会通过提炼指标的办法来试图解决报表标准化的难题,然而中国式复杂报表并不会消失,即便在酷炫的可视化泛滥的年代,复杂报表仍然是中基层员工的最 ..
-
**【摘要】** Mongodb 本地化排序操作支持还待完善,但结合集算器 SPL 语言来实现就容易多了,不用担心 Mo ..
-
**【摘要】** Mongodb 对表数据的子查询计算不如关系数据库操作方便,但通过集算器 SPL 语言来实现就容易多了 ..
-
【摘要】 随着信息化建设的快速发展,可视化大屏需求越来越普及,然而大屏的背后意味着多样性数据源,传统的解决办法总是需要如下一些工作:ETL 工具先抽取清洗 DW 中的数据;文本文件需导入数据库 ..
-
Java虚拟机参数的配置有时候会对SPL的性能产生很大影响,本文从排序函数sortx的使用出发,探索如何通过优化JVM参数配置来提升性能。对分析过程不感兴趣的同学可以直接阅读结论章节。 1 内 ..
-
【摘要】 随着数据量的持续增长,并发访问越来越密集;以及业务种类的不断丰富,报表需求还在不断增加,数据库需要不断扩容来应对这些变化。然而,仅仅对数据库本身扩容难免陷入高成本低成效的窘境,企业应 ..
-
伴随信息时代的发展,新技术、新框架、新语言层出不穷,解决问题的技术视角其实从来没有改变。所有应用都需要和存储系统相关联,无论存储是 SQL 还是 NOSQL 的。业务系统和数据库遵循不同的开发 ..
-
【摘要】 银行数据查询业务中,经常会碰到数据量很大的清单报表。由于用户输入的查询条件可能很宽泛,因此会从数据库中查出几百上千万甚至过亿行的记录,比如银行流水记录;为了避免内存溢出,一般都会使用 ..
-
【摘要】 应用系统软件项目中有一个普遍现象,就是报表总也做不完。不管是领导需要的宏观数据统计重点的变化,还是业务部门的计算口径的变化,都会造成报表需求的频繁变更。报表项目组就要不断修改现有报表 ..
-
【摘要】 随着产权交易所业务的发展和 IT 系统的建设,出现了多个系统同时运行,互不连通的问题。由于新老系统采用独立的数据库存储,数据格式、标准、规范都不相同,跨源计算变成了一大难题,常见办法 ..
-
【摘要】 商业银行对员工的绩效考核标准一般分为 4 个方面:柜员的销售业务量、客户服务、内部流程、学习成长等。一般本质上具有如下特征:多样性数据源,数据来自银行的多个业务系统定时推送的文件数据 ..
-
【摘要】 零售行业门店多、客户多、库存多,经常面临的问题:1、各个业务系统之间彼此不相关联,造成信息孤岛,很难从数据中发现隐藏的问题或商机。2、日积月累,报表查询越来越慢,甚至影响业务,如市场 ..
-
Docker 和集算器结合后结构分为两个部分:Server 端和 Client 端。在 Server 端 Docker 管理员对用户的使用资源进行管理与分配,在 Client 端用户可直接通过 ..
-
什么是轻量级?抛开技术术语,从效果上看就是为了实现操作目的,使用更轻便、更省时的方法;那么什么是高性能呢?最直接的说法就是比常用方法更加高效、更快。 下面就来介绍润乾提供的这一套轻量级、高性能 ..
-
【摘要】鉴于热更新、松耦合、语言无关等特性,微服务已广泛应用于互联网行业。但也带来了新问题:框架更复杂、开发周期更长、维护更困难。点击《微服务快速开发案例》,去乾学院看看集算器如何解决矛盾,大 ..
-
报表是很多 web 应用系统不可缺少的模块,仍然是绝大多数 BI 项目的基础功能。随着数据时代的到来,数据来源越来越多样 (text,excel,monogdb,redis,es…),为报表数 ..
-
【摘要】 有了固定报表工具之后,这类格式复杂、指标参数任意组合的需求并不难实现,只是原始数据量一大,查询就会非常慢,用户体验变的极差,当多并发请求时,甚至还会对正常业务产生影响!而集算器面对这 ..
-
【摘要】 在线查询时,慢的问题经常让使用者抓狂,业务部门的不满会转换成技术团队的压力,但基于传统技术体系这类问题往往解决的不好。本文提出一种基于算法特性设计和使用专用的存储方案来大幅提升在线查 ..
-
测试环境说明 CPU:4颗,主频2.6G,每个CPU内核数8个。 硬盘:800G,15000转SAS硬盘,理论读写速度150m/s。 内存:64G。 操作系统:Linux cent os 6 ..
-
组表是集算器提供的高性能存储格式,其原理在于将数据事先排序并以压缩方式紧致存储,好处是占用空间更小,可利用有序进行快速定位。 但这种存储方式在数据更新时会遇到麻烦,这是因为新数据也要和历史数据 ..
-
【摘要】 一般的报表工具或 BI 系统都是怎么实现大清单报表的呢? •数据全部读出,直接报表呈现 •游标方式逐步读入呈现 •使用数据库的分页机制按页读出 传统模式实现问题: 1)全量读模式,全 ..
-
【摘要】 事实表和维表进行关联计算时,需要对维表进行频繁的随机访问,因此维表要尽量放在内存中,才能提高关联计算的性能。如果维表较大,单机内存放不下,就应该考虑用集群方式,将维表分段读入多台机器 ..