计算&AI •
874 引用 •
936 回帖 •
446 关注
博客
关注
-
下载测试文本 结构化文本计算需求 结构化文本文件是常见的数据存储方式,比如这个score.txt,记录了所有班级学生的成绩,第一行是列名,之后每一行是一个学生的数据,行内用制表符分隔。 [图片 ..
-
SQL 经常跑得很慢 SQL 是最常用的大数据计算语言,但是,SQL 经常跑得很慢,严重浪费硬件资源。 某银行的反洗钱准备计算,36 亿行,11 节点的 Vertica 集群跑了 1.5 小时 ..
-
有些实际业务场景中,脚本文件需要附加严格的权限来控制是否可执行,比如为了数据安全,某些脚本文件的结果数据只允许特定用户查看,或者某些脚本需要绑定硬件才能执行等等。 针对类似需求,集算器企业版和 ..
-
是的!你没看错,SPL,Structured Process Language,就是这样一种写在格子里的开源程序设计语言,专门用于处理结构化数据。 我们知道,几乎所有编程语言都是写成文本的,那 ..
-
1. 数据准备 学习本课程需要先准备测试数据。可以使用 TPC 官网提供的程序生成测试数据,也可以使用[链接] 提供的方法生成。 准备数据时,要注意数据占用硬盘的空间大小。以 TPCH-Q1 ..
-
select cntrycode, count(*) as numcust, sum(c_acctbal) as totacctbal from ( select substr(c_phone ..
-
select * from ( select s_name, count(*) as numwait from supplier,lineitem l1,orders,nation where ..
-
select s_name,s_address from supplier,nation where s_suppkey in ( select ps_suppkey from partsup ..
-
下载源文件 SPL 实践系列:多源混算 背景 应用数据的生成方式和存储形式多样,不仅依赖传统的关系型数据库,还有 NoSQL 数据库、云存储、API、文件系统等多种数据源。整合和分析这些数据就 ..
-
select sum(l_extendedprice * (1 - l_discount)) as revenue from lineitem,part where ( p_partkey = ..
-
select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_totalprice, sum(l_quantity) ..
-
select sum(l_extendedprice) / 7.0 as avg_yearly from lineitem,part where p_partkey = l_partkey a ..
-
-
Parquet 和 ORC 都是 hadoop 中用于存储数据的列式存储格式, hadoop 提供了 Java API 读写它们的文件,集算器把实现读取文件的 JAVA 代码做了封装,形成更易 ..
-
业务人员使用 Excel 做常规分析,非常得心应手。但当数据准备步骤繁琐、求解的问题相对复杂、解决的任务总是重复时,存粹使用 Excel 内部技术来实现会比较困难,理想的方法是在 Excel ..
-
select p_brand,p_type,p_size, count(distinct ps_suppkey) as supplier_cnt from partsupp,part wher ..
-
create view revenue (supplier_no, total_revenue) as select l_suppkey, sum(l_extendedprice * (1 - ..
-
select 100.00 * sum( case when p_type like 'PROMO%' then l_extendedprice * (1 - l_discount) else ..
-
select c_count, count(*) as custdist from ( select c_custkey, count(o_orderkey) c_count from cus ..
-
select l_shipmode, sum(case when o_orderpriority = '1-URGENT' or o_orderpriority = '2-HIGH' then ..
-
select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp, supplier, nation whe ..
-
select * from ( select c_custkey,c_name, sum(l_extendedprice * (1 - l_discount)) as revenue, c_a ..
-
SPL针对多种云对象存储(亚马逊S3、阿里云OSS、谷歌GCS、微软Azure)各实现了一套命令,能像读写本地数据文件一样方便的读写云上的数据,这样就容易把SPL灵活的计算能力应用到云数据。下 ..
-
select nation, o_year, sum(amount) as sum_profit from ( select n_name as nation, extract(year fr ..
-
select supp_nation, cust_nation, l_year, sum(volume) as revenue from ( select n1.n_name as supp_ ..