计算&AI •
902 引用 •
973 回帖 •
449 关注
博客
关注
-
无监督实时异常发现算法 算法背景 实际生产中会定时产生一些数据(比如:炼油设备的压力、液位、电气设备的电流、电压等),称为时间序列。生产活动发生异常时,很可能会有前兆反映在这些时间序列中,也就 ..
-
算法背景 之前介绍了有边界的线性拟合算法,《有边界的线性拟合算法》,它的约束条件是所有系数都须在[0,1]范围内,但实际生产环境不仅仅是这个基本的限制。 已知条件 自变量矩阵X,在生产环境中称 ..
-
有边界的线性拟合算法 已知自变量矩阵X和因变量矩阵Y,两者存在线性关系,但系数被限制在一个范围内,这个范围称为边界,试求出该边界范围内的最佳系数矩阵。 [图片] 其中X是k*m矩阵,k是样本数 ..
-
一个集合X中可能存在过大或过小的异常值,希望计算一个范围,剔除集合X中过大或过小的异常值,这个范围的上下限就是阈值,较大值称为阈值上限,记为threshold_up,较小值称为阈值下限,记为t ..
-
Python 和 esProc SPL 都是非常好用的数据分析和处理的程序语言,有些人可能只熟悉其中一种,为了方便大家进一步了解这两门语言,选择更适合自己的程序语言。这里以系列文章的形式从各个 ..
-
将两个表或者多个表关联在一起是常见的运算,这时通常使用 SQL join 的方式进行关联并进行后续计算。但有时数据并不存储在数据库,而是以文件的形式存储在文件系统,单纯为了计算而把数据存储到数 ..
-
职场人员使用 Excel 进行数据处理已经成为家常便饭。不过相信大家一定有过很无助的情况,比如复杂计算、重复计算、自动处理等,再遇上个死机没保存,整个人崩溃掉也不是完全不可能。 如果学会了程序 ..
-
Pandas 是 python 的一个数据分析包,是基于 NumPy 的一种数据分析工具,其中纳入了大量库和一些标准的数据模型,提供了快速便捷地处理数据的函数和方法,是高效地操作结构化数据集所 ..
-
在日常数据分析时,经常会遇到需要按列分组 (groupby) 的任务,如计算某公司各部门的人数,计算各部门男女平均工资,计算不同年代的员工的平均工资等等。在进行这类运算时,Pandas 提供了 ..
-
Python作为一门程序设计语言,在易读、易维护方面有独特优势,越来越多的人使用 Python 进行数据分析和处理,而 Pandas 正是为了解决数据分析任务而创建的,其包含大量能便捷处理数据 ..
-
[图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片] ..
-
简介: 目前大数据已经成为热词,但是如果真的获取了很多数据,是不是一头雾水,有一种淹死在数据海洋里面的感觉,这里我们介绍一系列在数据游泳的方法,让你畅游在数据的海洋里,体会大数据的乐趣! [图 ..
-
简介: 回归预测是指预测的目标是连续型的变量,数据探索和预处理时与分类预测有哪些相同,哪些不同,让我们用房价预测作为案例来实战分析这些问题。 [图片][图片][图片][图片][图片][图片][ ..
-
简介: 数据挖掘作为现在的热门词汇,那么什么是数据挖掘,它又是干什么的,它是怎么工作的,真的有那么神奇吗?这里我们用中学生能理解的语言告诉您这些问题的答案。 [图片][图片][图片][图片][ ..
-
简介 titanic 幸存者预测案例是数据挖掘的入门案例,非常适合初学者来学习,这里我们就以此数据作为切入点来讲述数据挖掘的过程,感受数据挖掘的魅力。 [图片][图片][图片][图片][图片] ..
-
简介: 结构化文本计算是我们日常中经常遇到的计算场景,这里我们用常见的例子来深入的了解 SPL 处理结构文本的强大之处,掰开了、揉碎了,轻松简单的让您处理结构化文本。 [图片][图片][图片] ..
-
简介: 数据量太大不方便处理,我们希望在处理大数据量的时候和小数据量的代码相同,但往往不能实现,而 SPL 中的游标的出现让这个愿望变成了可能。 [图片][图片][图片][图片][图片][图片 ..
-
简介: SPL 作为一门语言,循环、动态、子程序、并行这些都是完备的,允许程序简单快速的实现算法。 [图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图片][图 ..
-
简介: 分组运算的本质是将一个集合按照某种规则拆分成若干个子集,也就是说,返回值应当是一个由集合构成的集合,然后应用这些子集进行计算。下面来看下 SPL 的分组运算。 [图片][图片][图片] ..
-
简介: 人们对序运算是天然有兴趣的,一个数据总是不变,那看一次就行了,变化的数据才更让人关心,比上期、同期比、移动平均等等,都是有序运算。下面就让我们开始 SPL 有序的学习之旅吧。 [图片] ..
-
简介: SPL 的集合是彻底的离散化集合,集合成员可以游离在集合之外,这让许多复杂的运算简单化,会让程序既写的简单,又跑得快。 [图片][图片][图片][图片][图片][图片][图片][图片] ..
-
本节在数据量比较大的情况下,对比esproc和python。 数据量:7000多条万记录,5个字段分别是orderid,clientid,sellerid,amount,date。总大小超过3 ..
-
1. 列出分期贷款明细 题目介绍:loan 表存储着贷款信息,包括贷款 ID,贷款总额、按月分期数、年利率。数据如下: [图片] 我们的目的是列出各期明细,包括:当期还款额、当期 ..
-
1. 计算每年同月份增长比 esproc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\kaggle_data\\music_pro ..
-
1. 采样( 随机的将数据分成30% 和70%) esproc A 1 =now() 2 =file('C:\\Users\\Sean\\Desktop\\esproc_vs_p ..