- 
    
        
            
            基于对象 - 事件模式(schema)的数据计算,可以说是商业中最常见的一种数据分析任务。这里说的对象可以是电商系统用户、游戏玩家、银行账号、手机、车辆等等,通常会有个唯一的 ID,对象涉及的 ..
         
     
    
        
    
 - 
    
        
            
            头肩顶 1. 形态整体上有 3 次撞顶的过程,出现 3 座顶峰,其中第一座和第三座的顶部位置较为接近,第二座顶峰的高点比其他两座更高。 2. 形态包括第一次撞顶的“左肩”、第二次撞顶的“头部” ..
         
     
    
        
    
 - 
    
        
            
            单根 K 线 放量大阳线 大阳线是收盘价远高于开盘价所形成的 K 线。当交易量放大配合大阳线时,说明个股当天走势强劲。 其 K 线图与分时图的关系如下图: [图片] 涨停一字线 严格来讲,涨停 ..
         
     
    
        
    
 - 
    
        
            
            1,下载并安装 Java 环境 使用集算器要求有可运行的java环境,且jre版本不低于1.8。 熟悉Java的读者可以自行安装并跳过这一节。 以下安装方式仅供用户参考,OpenJRE下载地址 ..
         
     
    
        
    
 - 
    
        
            
            有工业经验表明,重要度高的出料划分生产路线时所起的作用更大,为了体现这一作用,我们尝试了层次kmeans聚类,即按出料的重要度分层次进行kmeans聚类,过程如下: 1. 将所有出料数据X在初 ..
         
     
    
        
    
 - 
    
        
            
            有了初始化类心,将其传入kmeans方法中,就能得到各生产路线的类心。当有新的收率数据Y需要确定类别(生产路线)时,只需确定Y中每个成员到哪个类心最近,该成员就属于哪一类。 过程如下: 预测数 ..
         
     
    
        
    
 - 
    
        
            
            kmeans的聚类结果受随机初始化的类心影响较大,有可能两次聚类的结果会因为初始类心的不同而不同,这会造成一种奇怪的现象,同一天的数据,因为两次聚类而属于两条生产路线,这是工业生产中不能接受的 ..
         
     
    
        
    
 - 
    
        
            
            工业上,某些装置的出料收率波动比较大,其中的一些出料量还需要特别关注,这些需要关注的出料往往与生产路线对应,比如催化装置中,汽油的收率大时,认为是汽油路线,柴油的收率大时,认为是柴油路线…现在 ..
         
     
    
        
    
 - 
    
        
            
            基本面选股条件: 1. 毛利润率不低于30%; 毛利润率=(营业收入-营业成本)/营业收入 2. 净利润率不低于15%; 净利润率=净利润/营业总收入 3. 优化净资产收益率大于等于20%;  ..
         
     
    
        
    
 - 
    
        
            
            行业财务指标非常多,本文只是抛砖引玉,以四个常用的行业财务指标为例介绍SPL计算财务指标的方法,其他财务指标可以用类似的方法计算出来。 1. 行业毛利润率 行业毛利润率=(营业收入-营业成本) ..
         
     
    
        
    
 - 
    
        
            
            DQL 重要的作用是解决表间关联,有了上一期配置好的元数据,我们就可以来操练一些 DQL 语句,下面看几种不同关联方式的例子,看看它是如何简化关联的。 多级关联 先跑出界面,仔细观察其中的元数 ..
         
     
    
        
    
 - 
    
        
            
            esProc SPL 作为数据计算引擎,具备低代码、高性能、轻架构、全场景4 个主要特点,后面的内容我们会详细讲解。 esProc 是什么? 首先我们来了解一下 esProc 是什么? [图片 ..
         
     
    
        
    
 - 
    
        
            
            OLAP 业务的数据一般不会出现大量频繁地更新动作。数据变动主要是:1、新增数据的追加,2、数据插入、修改和删除。 SPL 提供了复组表,可以有效缩短数据变动的处理时间,同时保证数据计算的性能 ..
         
     
    
        
    
 - 
    
        
            
            股价在上涨时通常会形成趋势,如果能抓住这些趋势,通常会带来不错的收益,本文就介绍一种常见的趋势交易策略。 在介绍买入策略之前先定义一些名词: 1. 最近的波谷:股价低于之前和之后 N 天的股价 ..
         
     
    
        
    
 - 
    
        
            
            1. 前言 利用AWS Lambda函数,可以运行代码而无需预置或管理服务器,可以直接从任何Web或移动应用程序调用函数获得运算结果,是非常便利的函数服务。在函数代码中可以读取业务数据,进行复 ..
         
     
    
        
    
 - 
    
        
            
            股市中,当天的股价和前几天的股价可能存在线性关系,据此我们制定策略如下: 1. 把当天之前100天的数据作为训练数据; 2. 训练数据中,每天的后一天的收盘价作为目标变量; 3. 训练数据中, ..
         
     
    
        
    
 - 
    
        
            
            实际项目中可能可能会有一种需求,不需要在浏览器端展示报表组文件,直接通过访问某个 url,直接将报表组转换成 excel 进行下载,这种需求有多种方式实现,可以通过 api 计算,这个在乾学院 ..
         
     
    
        
    
 - 
    
        
            
            交易策略如下: 1. 把第二天是否上涨作为目标(target),收盘价大于前一天,target为1,否则target为-1。 2. 增加两个特征,最高价减最低价(max_dif),收盘价减开盘 ..
         
     
    
        
    
 - 
    
        
            
            八、有序归并 我们再来看同维表和主子表的 JOIN,这两种情况的优化提速手段是类似的。 我们前面讨论过,HASH JOIN 算法的计算复杂度(即关联键的比较次数)是 sum(ni*mi),比全 ..
         
     
    
        
    
 - 
    
        
            
            做报表时经常会一些有自定义统计区间的汇总,按时间段、数值段等汇总数据,比如要根据员工信息数据按照部门统计不同年龄段的人数,员工信息数据放在 xls 中,如下: [图片] 要做到如下结果: [图 ..
         
     
    
        
    
 - 
    
        
            
            七、进一步的外键关联 我们继续讨论外键 JOIN,并延用上一篇的例子。 当数据量大到无法全部放进内存时,前述的地址化方法就不再有效了,因为在外存无法保存事先算好的地址。 一般来讲,外键指向的维 ..
         
     
    
        
    
 - 
    
        
            
            前面讲过的用数据文件、手写 SQL 都只是针对一个数据集做分析,但 BI 用户常常需要自由的分析,数据库里有很多表,要能够随意选取来做分析。 DQL 服务通过 JDBC 方式能够提供全库多表查 ..
         
     
    
        
    
 - 
    
        
            
            我们再来研究如何利用 JOIN 的特征实现性能优化,这些内容的细节较多,我们挑一些易于理解的情况来举例,更完善的连接提速算法可以参考乾学院上的《性能优化》图书及课程。 六、外键预关联 先看全内 ..
         
     
    
        
    
 - 
    
        
            
            五. 解决关联查询 我们重新审视和定义了等值 JOIN 运算,并简化了语法。一个直接的效果显然是让语句书写和理解更容易。外键属性化、同维表等同化和子表集合化方案直接消除了 JOIN 关键字,也 ..
         
     
    
        
    
 - 
    
        
            
            四. 维度对齐 我们再回顾前面的双子表例子的 SQL: SELECT Orders.id, Orders.customer, A.x, B.y FROM Orders LEFT JOIN (S ..