计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
SPL针对多种云对象存储(亚马逊S3、阿里云OSS、谷歌GCS、微软Azure)各实现了一套命令,能像读写本地数据文件一样方便的读写云上的数据,这样就容易把SPL灵活的计算能力应用到云数据。下 ..
-
select supp_nation, cust_nation, l_year, sum(volume) as revenue from ( select n1.n_name as supp_ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
全局变量 在 SSC 环境中,有时需要在多个 QVM 上的计算任务(QVM 脚本)之间共享信息,这时可以使用 SSC 全局变量(以下简称全局变量)。全局变量由 QVS 管理,通过 QVS 申请 ..
-
Download PDF [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片 ..
-
select sum(l_extendedprice * l_discount) as revenue from lineitem where l_shipdate >= date '1 ..
-
提到数据库首先想到的会是 Oracle、DB2、SQL Server、MySQL、PostgreSQL 等大名鼎鼎的产品,这些数据库都采用独立进程的方式运行,即独立部署数据库服务通过接口与应用 ..
-
问题提出 工业生产活动的目标是利用原料生产产品,从而产生利润。原料经过一系列加工过程,包括物理反应和化学反应,最终形成产品,生产的理想状态是原料到产品的转换率是确定的,工厂想生产多少产品就知道 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] Downlo ..
-
下载测试文本 结构化文本计算需求 结构化文本文件是常见的数据存储方式,比如这个score.txt,记录了所有班级学生的成绩,第一行是列名,之后每一行是一个学生的数据,行内用制表符分隔。 [图片 ..
-
-
数据分析需要探索式 对于数据分析,许多任务并非固定的查询,而是需要灵活的分析和判断。比如,电商数据中的用户行为分析、产品推荐、库存优化,或者金融行业的风险评估和客户分类等,都往往没有预先固定的 ..
-
本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据: ..
-
有些实际业务场景中,脚本文件需要附加严格的权限来控制是否可执行,比如为了数据安全,某些脚本文件的结果数据只允许特定用户查看,或者某些脚本需要绑定硬件才能执行等等。 针对类似需求,集算器企业版和 ..
-
select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp, supplier, nation whe ..
-
明确目标,准备数据 首先要明确目标,知道要预测什么东西。 比如银行放贷款时,希望预测出贷款人违约的可能性,从而判定是否放贷以及贷款利率。 保险公司制定保费时,希望预测出客户的理赔风险,从而制定 ..
-
select c_count, count(*) as custdist from ( select c_custkey, count(o_orderkey) c_count from cus ..
-
select sum(l_extendedprice) / 7.0 as avg_yearly from lineitem,part where p_partkey = l_partkey a ..
-
业务人员使用 Excel 做常规分析,非常得心应手。但当数据准备步骤繁琐、求解的问题相对复杂、解决的任务总是重复时,存粹使用 Excel 内部技术来实现会比较困难,理想的方法是在 Excel ..
-
强计算和交互性的两难 Excel 和 BI 是常用的数据分析工具,很适合完成初级的数据分析任务,比如统计各月销售总额,计算各组的平均订单金额和购买频次等。但随着业务需求升级,更复杂的任务用 E ..
-
实时热数据报表,是指能够实时查询全量冷热数据的报表。早期业务只基于单个 TP 数据库时,这种报表并不是什么问题。但数据量大了,要拆分到专门的 AP 数据库后,就不一样了。因为冷热数据分离后,再 ..
-
SQL 经常跑得很慢 SQL 是最常用的大数据计算语言,但是,SQL 经常跑得很慢,严重浪费硬件资源。 某银行的反洗钱准备计算,36 亿行,11 节点的 Vertica 集群跑了 1.5 小时 ..
-
数据结构 国家表 world.country [图片] Code 是国家编码,Name 是国家名称,Population 是国家人口。 国家语言表 world.countrylanguage ..
-
下载源文件 SPL 实践系列:多源混算 背景 应用数据的生成方式和存储形式多样,不仅依赖传统的关系型数据库,还有 NoSQL 数据库、云存储、API、文件系统等多种数据源。整合和分析这些数据就 ..
-
下载源文件 背景 应用程序可能要基于不同数据库工作,各种数据库的 SQL 语法大体一致,但仍有些差别,结果就要改造这些 SQL,而这事通常只能手工调整,工作量大还容易出错。 完全自动改造 SQ ..