- 
    
        
            
            SQL 用于数据分析其实会很浅 SQL 被广泛用于数据分析,经常会被当成数据分析师的默认技能。的确,数据库环境下会写 SQL 是很方便,想查什么写句 SQL 似乎就能搞定。比如,查个用户分组销 ..
         
     
    
        
    
 - 
    
        
            
            列式存储是提高数据分析计算性能的重要手段。如果数据表的总列数很多而计算涉及的列很少,采用列存就只读取需要的列即可,能够减少硬盘访问量,提高性能。而且,同一列数据往往是同一类型的,甚至有些情况取 ..
         
     
    
        
    
 - 
    
        
            
            有参数查询的报表,有时候会需要多值模糊查询。 比如 产品清单表中,输入粉,鱼两个检索字,查询出所有产品名称包含这两个字的数据。如下图 [图片] 下面我们来看一下在润乾报表中如何处理这一需求。  ..
         
     
    
        
    
 - 
    
        
            
            润乾报表 web 页面展现时支持导出多种类型文件,报表导出的文件名默认是和报表文件名称相同的。 [图片] 但在需要定期生成报表的场景下,例如日报、月报、季报等,在文件名中加入时间戳,如 “订单 ..
         
     
    
        
    
 - 
    
        
            
            日常工作中,涉及到数据的计算分析,Excel 一定是使用最多的。但是也有不少小伙伴困惑于 Excel 的深入学习难度大,复杂问题不好做,相同问题重复烦,大数据跑不了等问题。这里我们就来聊一聊  ..
         
     
    
        
    
 - 
    
        
            
            数据结构 就诊记录表 Appointments [图片] appid 是就诊编号,patientid 是患者编号,depid 是科室编号,appdate 是就诊日期。 1. 查询 2020 与 ..
         
     
    
        
    
 - 
    
        
            
            用 csv 文件存储数据很普遍。类似的还有纯文本文件、tsv 文件等等,这些文件都是平面结构,没有层次关系,数据都存成文本字符。有些 xls 文件也是类似的平面结构。 csv 文件具有简单、通 ..
         
     
    
        
    
 - 
    
        
            
            报表在做条件查询时可以增加多个条件,用户希望在设置条件时如果某个条件值为空则忽略该条件,取符合其他条件值的数据,例如: [图片] 如果城市选择北京,取出北京下的数据,如果该条件不选,则取出所有 ..
         
     
    
        
    
 - 
    
        
            
            填报表可完成数据录入、补录等的数据采集工作,但其过程中还包括很多细节的功能,比如数据校验、使用编辑控件等。另外比较重要的一点则是权限控制,毕竟不能任何人访问同一个填报表都可随意编辑、所有内容都 ..
         
     
    
        
    
 - 
    
        
            
            数据信息化的应用项目中,大都会有报表需求,也通常都要用到报表工具,市面上相关的产品有很多,报表工具,BI 自助报表,大屏可视化,都和报表有关,怎样选对工具,一直是个难题 上网搜索报表工具选型, ..
         
     
    
        
    
 - 
    
        
            
            简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 《下载测试数据》 1、查找按顺序触发过 e2、e3、e7 事件的用户 顺序事件不要求连续。  ..
         
     
    
        
    
 - 
    
        
            
            数据结构和样例数据: [图片] 表中存储的是 2025 年 1 月 1 日飞机出发、到达城市机场的数据。 其中 FId 是航班号,AircraftId 飞机号,DepCity 出发城市,Arr ..
         
     
    
        
    
 - 
    
        
            
            有销售数据表,记录了销售员每年的销售金额。 [图片] 1. 找出 5 号销售员销售额实现增长的年份 用 Excel 先筛选出 SELLERID 为 5 的数据,然后再判断每年销售额是否增长。  ..
         
     
    
        
    
 - 
    
        
            
            软件项目中,都会有报表,而且数量还不少,做新表,改老表,原本看起来简单的报表,做起来却没完没了,资源投入也没完没了 怎样才能降本增效,让报表开发省钱又省人?一直是软件开发商的一道难题 硬编码肯 ..
         
     
    
        
    
 - 
    
        
            
            实时热数据报表,是指能够实时查询全量冷热数据的报表。早期业务只基于单个 TP 数据库时,这种报表并不是什么问题。但数据量大了,要拆分到专门的 AP 数据库后,就不一样了。因为冷热数据分离后,再 ..
         
     
    
        
    
 - 
    
        
            
            本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据:  ..
         
     
    
        
    
 - 
    
        
            
            数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 查找股价上穿中位数 T 日股价中位数是指从上市日收盘价到 T 日收盘价的中位数。 ..
         
     
    
        
    
 - 
    
        
            
            很多做数据项目的同学都遇到过报表开发没完没了的问题,总是不断的有新报表要做,老报表要改,原本以为初级工程师就可以搞定的,却始终都得有高级工程师跟着,报表开发没完没了,资源投入也没完没了,一个看 ..
         
     
    
        
    
 - 
    
        
            
            数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 计算每日收盘价的 12 日 EMA 某支股票上市第 1 天的 n 日 EMA 为 ..
         
     
    
        
    
 - 
    
        
            
            订单数据表记录了近几年的销售订单信息。 [图片] 员工信息表记录了所有员工的基本信息。 [图片] 1. 汇总并关联成宽表 将原始的订单数据汇总到年。然后再和员工信息表进行关联,做成这样一张表格 ..
         
     
    
        
    
 - 
    
        
            
            本篇接续《数据分析编程从 SQL 到 SPL:用户事件统计》, 延用用户行为表 actions,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 3、连续 4 天活跃度排名前  ..
         
     
    
        
    
 - 
    
        
            
            数据结构 国家表 world.country [图片] Code 是国家编码,Name 是国家名称,Population 是国家人口。 国家语言表 world.countrylanguage  ..
         
     
    
        
    
 - 
    
        
            
            背景 报表经常会基于多种数据源,如 RDB、NoSQL、文本、Excel、MQ 等。 [图片] 借助逻辑数据仓库可以一定程度上实现多源混算,但其架构往往过于复杂和沉重,需要繁琐的预处理过程以运 ..
         
     
    
        
    
 - 
    
        
            
            简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 1、计算每个用户会话次数 一个用户超过 2 天无操作或 e8 事件后 2  ..
         
     
    
        
    
 - 
    
        
            
            背景 与一般事务处理(TP)系统相比,报表中的 SQL 更频繁地使用各种计算函数,计算逻辑也更加复杂,对 SQL 的依赖更强。报表开发中可能应对数据库的变化,不同数据库的 SQL 语法虽大体相 ..