计算&AI •
902 引用 •
973 回帖 •
449 关注
博客
关注
-
Download PDF [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片 ..
-
[链接]任务背景 国际大环境就不用多说了。 对于数据库类的关键业务,全国产技术(国产 CPU+ 国产数据库)和国外主流技术在性能上相比还有不小的差距,经常需要借助分布式技术使用数倍的硬件才能获 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[链接]数据库语言的目标 要说清这个目标,先要理解数据库是做什么的。 数据库这个软件,名字中有个“库”字,会让人觉得它主要是为了存储的。其实不然,数据库实现的重要功能有两条:计算、事务!也就是 ..
-
什么样的代码算低? 低代码这个词这两年热闹起来,冒出一堆创业团队搞这东西。以前只知道代码有长短,现在才知道代码还有高低。 所谓低代码,直观来讲,就是让代码写起来更简单。完成同样的任务时,代码量 ..
-
发明 SQL 的初衷之一显然是为了降低人们实施数据查询计算的难度。SQL 中用了不少类英语的词汇和语法,这是希望非技术人员也能掌握。确实,简单的 SQL 可以当作英语阅读,即使没有程序设计经验 ..
-
[链接]概念与语法 先从[链接]开始。 第 1-4 章介绍基本的程序逻辑,这部分主要面向没有编程经验的初学者,专业程序员可以用十几分钟时间迅速过一遍,了解 SPL 编程的基本风格和语法,需要注 ..
-
前几天听说 OceanBase 打榜了 TPCH 的第一名,之后又看到这样一个测试报告[链接]。 先点评一下这个测试报告: 1. 坦白地说,这个测试还不太专业,并不能比出分布式大数据计算的关键 ..
-
【摘要】 一般的报表工具或 BI 系统都是怎么实现大清单报表的呢? •数据全部读出,直接报表呈现 •游标方式逐步读入呈现 •使用数据库的分页机制按页读出 传统模式实现问题: 1)全量读模式,全 ..
-
【摘要】 ETL 常常做成 ELT 甚至 LET! 这样做带来的恶果是:1)数据库臃肿、负担重,数据管理混乱;2)性能低下,时间成本高( 数据库写入很慢),影响 ETL 窗口时间。 解决方案: ..
-
【摘要】 日常数据处理中经常会发生一些临时数据计算需求。这种临时性计算具有相当的普遍性。那么,我们是用什么方法来处理这种具有普遍性的临时计算需求呢? 去乾学院看个究竟吧! ${article} ..
-
【摘要】 传统关系型数据仓库的问题包括:成本高、计算封闭、性能差、管理难。那么,关系数据仓库问题多,为什么还要用呢?为什么不直接使用文件系统存储?我们为什么需要一种文件型数据仓库 / 集市!! ..
-
【摘要】 存在问题:跨库的数据汇总运算开发复杂、效率低。 产生的原因:单库的大表数据量巨大,条件限制又不能做分布式数据库,而大多数应用程序都严重依赖数据库的计算能力,但是跨库时数据库的计算能力 ..
-
【摘要】 关键词:集算器、SPL、数据脱敏、报表 1)、数据脱敏是“指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在 ..
-
【摘要】 许多程序员都头疼测试数据的模拟,一个是要逼真,另一个需要数据量,不逼真往往导致一些 bug 测不出来,数据量不够则无法发现性能问题,这篇文章给出了很好的解决办法。 1)、应用系统或软 ..
-
【摘要】 存在问题:BI 系统后台计算由中央分布式数据仓库(MPP)实现,性能不佳,导致交互式多维分析响应迟钝。 产生的原因:中央数据仓库上挂数十个应用,计算负担太重! 解决方案:数据前置计算 ..
-
Parquet 和 ORC 都是 hadoop 中用于存储数据的列式存储格式, hadoop 提供了 Java API 读写它们的文件,集算器把实现读取文件的 JAVA 代码做了封装,形成更易 ..
-
1 、前言 大数据技术催生了一些列式存储格式,合适的存储方案是高性能计算的基础。本文主要从应用角度上对比三种开源的列存文件:esProc 组表、ORC 和 Parquet 在数据压缩和读取方面 ..
-
1. 前 言 在 snowflake 云环境下,用户可搭建集算器 SPL 应用程序包开发环境、生成 App 安装包。用户安装 App 后,通过 SPL 函数接口调用集算器进行数据运算,将计算结 ..
-
【摘要】 作为 client 端的 python 通过服务端的 jdbc 接口调用 SPL 脚本,非常容易实现 pyth ..
-
【摘要】 集算器 SPL 支持抓取网页数据,根据抓取定义规则,可将网页数据下载到在本地进行统计分析。具体定义规则要求、使 ..
-
【摘要】 集算器 SPL 集成了对 python 程序的调用,也提供对建模算法接口支持。具体开发要求、使用详细情况,请前 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..