计算&AI  • 
                                    982 引用   • 
                                    1070 回帖  • 
                                    467  关注
                                	
                                
                        
                        博客
                     
                    
                        关注
                                        
                 
                
                
                
                
             
            
                
                
                
                
    
- 
    
        
            
            连接(JOIN)用于把来自两个或多个表的记录结合起来。本文将探讨对于连接问题,SPL 的解决方案和基本原理。 表之间存在的数据相互依赖关系,就叫做表间关联关系。表间关联关系可以分为以下几种:一 ..
         
     
    
        
    
 - 
    
        
            
            连接(JOIN)用于把来自两个或多个表的记录结合起来。本文将探讨对于连接问题,SPL 的解决方案和基本原理。 表之间存在的数据相互依赖关系,就叫做表间关联关系。表间关联关系可以分为以下几种:一 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType OS Browser ProductID … f1 f2 f3 f4 f5 … 2022/6/1 1 ..
         
     
    
        
    
 - 
    
        
            
            从一体机、超融合到云计算、HTAP,我们不断尝试将多种应用场景融合在一起并试图通过一种技术来解决一类问题,借以达到使用简单高效的目标。现在很热的湖仓一体(Lakehouse)也一样,如果能将数 ..
         
     
    
        
    
 - 
    
        
            
            很多免费开源数据处理引擎都可以嵌入 Java 应用中,其中 SQLite 历史悠久、用户众多;后起之秀 esProc SPL 功能也较强,下面对两者进行多方面的比较。 基本特征 语言风格 SQ ..
         
     
    
        
    
 - 
    
        
            
            随着大数据时代的来临,数据量不断增长,传统小机上跑数据库的模式扩容困难且成本高昂,难以支撑业务发展。很多用户开始转向分布式计算路线,用多台廉价的 PC 服务器组成集群来完成大数据计算任务。Ha ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType OS Browser ProductID … f1 f2 f3 f4 f5 … 2022/6/1 1 ..
         
     
    
        
    
 - 
    
        
            
            问题描述 国家天文台有个聚类任务:共 11 份数据,每份数据是从一张照片中提取出来的,包含 500 多万条记录,每条记录是一个天体的坐标及属性。11 张“照片”中有些天体坐标是重复的,但这些重 ..
         
     
    
        
    
 - 
    
        
            
            HTAP(Hybrid Transaction and Analytical Process,混合事务和分析处理)自 2014 年明确提出以后成为了很多数据库厂商努力的方向。其实 HATP 并 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType … 2022/6/1 10:20 1072755 Search … 2022/6/1 12:12 1 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType … 2022/6/1 10:20 1072755 Search … 2022/6/1 12:12 1 ..
         
     
    
        
    
 - 
    
        
            
            在 Java 下实现以数据库为核心的业务逻辑,需要具备三项要素:数据库表的对象化、结构化数据计算能力、流程处理能力。Hibernate 是老牌技术,很早就具备了三项要素,已经在众多项目中实现了 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventType OS Browser … f1 f2 f3 f4 f5 … 2022/6/1 10:20 10727 ..
         
     
    
        
    
 - 
    
        
            
            开源分析数据库 ClickHouse 以快著称,真的如此吗?我们通过对比测试来验证一下。 ClickHouse vs Oracle 先用 ClickHouse(简称 CH)、Oracle 数据 ..
         
     
    
        
    
 - 
    
        
            
            SQL 作为目前最常用的数据处理语言,广泛应用于查询、跑批等场景。当数据量较大时,使用 SQL(以及存储过程)经常会发生跑得很慢的情况,这就要去优化 SQL。优化 SQL 有一些特定的套路,通 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID ProductID Quantity … 2022/6/1 10:20 1072755 1 7 … 2022/6/1 1 ..
         
     
    
        
    
 - 
    
        
            
            我们工作中写 SQL 处理数据是家常便饭,不管是应用内数据处理还是临时查询分析都可以用 SQL 完成,相对其他技术(如 Java 等高级语言)也更简单。不过,SQL 的简单只限于简单需求,有些 ..
         
     
    
        
    
 - 
    
        
            
            基于 JVM 的开源数据处理语言主要有 Kotlin、Scala、SPL,下面对三者进行多方面的横向比较,从中找出开发效率最高的数据处理语言。本文的适用场景设定为项目开发中常见的数据处理和业务 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID ProductID Quantity … 2022/6/1 10:20 1072755 1 7 … 2022/6/1 1 ..
         
     
    
        
    
 - 
    
        
            
            用户画像分析需要使用众多标签来描述用户属性,通常有两类标签。一类用户标签的值可能有多个,比如用户学历是中学、大学、研究生、博士等,年龄段是 children、juvenile、youth、mi ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventTypeID ProductID Quantity 2022/6/1 10:20 1072755 3 1000 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventTypeID ProductID Quantity 2022/6/1 10:20 1072755 3 1000 ..
         
     
    
        
    
 - 
    
        
            
            高并发帐户查询的应用场景有很多,例如:手机银行查流水、电商系统查购物订单、手游帐户查充值记录等等。这些场景一般会涉及众多帐户,数据总量非常大,需要外存。每个帐户的数据量通常不大(几条到几千条) ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventTypeID EventType Product Quantity Unit Price … 2022/6/1 ..
         
     
    
        
    
 - 
    
        
            
            目标任务 用户事件表T结构和部分数据示例如下: Time UserID EventTypeID EventType 2022/6/1 10:20 1072755 3 Search 2022/6 ..