图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
使用代码解析序表中的字符型字段。 求 80 后的平均工资,年龄需要从证件号码中提取。员工表部分数据如下: ID Name Identification Salary 1 Rebecca Dri ..
-
IQR=QU-QL 在QU+1.5IQR 和 QL-1.5IQR 处画两条与中位线一样的线段,称其为内栏 在QU+3IQR 和 QL-3IQR 处画两条线段,称其为外栏 落在内栏和外栏之间的观 ..
-
用正则表达式解析不定行文本数据。 日志文件由数量不定的多行组成,想要解析成结构化数据。部分日志内容如下: [图片] 函数 A.regex(rs,Fi) 用正则表达式 rs 在序列 A 的字符串 ..
-
用正则表达式解析序表中的字符型字段。 从客户地址中取出路牌号(数字号码)。客户表部分数据如下: ID Name City Address 1 VINET Beijing 124 Guangmi ..
-
计算泰坦尼克数据中各变量缺失的数量和缺失率 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.fname() 3 =A2.((y=~,A1.ali ..
-
有 Base64 编码串:eyJhIjo2MywiYyI6Mjk4LCJuIjoxLCJzIjoxLCJlIjo0MCwicCI6NH0= 需要将其转码后的 json 串({“a”:63,“c ..
-
将字符串解析为序表。 系统剪贴板中复制了中国主要城市的 GDP 和人口数据,将其输出成 csv 格式文件。部分内容如下: ID City GDP Population 1 Shanghai 3 ..
-
在SPL中可以使用pearson和spearman来评估变量之间关系的函数 例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系 A 1 =fi ..
-
在拆分字符串时,将字串解析为合适类型的数值。 有课程表和选课表,查询有哪些课没有学生选修。其中选课表可以多选,用逗号分隔,部分数据如下: Course: ID NAME TEACHERID 1 ..
-
自动解析单个字符串为相应的数据类型。 以奥运会奖牌榜为例,查询哪几届奥运会中国奖牌榜排名比俄罗斯靠前。 Game Nation Medal 30 USA [46,29,29] 30 China ..
-
连续型数据属于定量数据,对于定量数据通常可以从集中趋势测度、分散测度、相对位置测度和对称性测度四个维度来分析。 [图片] 例如泰坦尼克数据中有一个连续型变量”Age”,表示乘客的年龄,探索代码 ..
-
将百分比字符串解析为数值。 根据泰坦尼克号生存模型结果,统计生存概率超过 80% 的人员中,女性所占比例。部分数据如下: Survived PassengerId Pclass Name Se ..
-
将字符串解析为数值。 模型表现表记录了不同模型的各种指标,想要选出其中的数值目标模型(ModelType 是 2),并以指标为列名展现。其中每个模型的指标是按同一次序输出到文件中的。部分数据如 ..
-
分类数据属于定性数据,通常可以从以下几个维度来探索分析 [图片]在SPL中可以使用A.id(), A.group(),A.groups()等函数来进行相关的操作。 例如,在泰坦尼克的数据中,有 ..
-
使用正则表达式,将字符串拆分为字符串序列。 从 html 文件中剔除所有注释(),部分内容如下:
-
使用“?”或“=”作为分隔符,将字符串分别拆分为两个字符串。 在某网站记载了用户访问的 URL,要查询使用频率最高的搜索条件。部分内容如下: ID User Website 1 Rebecca ..
-
无论是数据分析还是数据挖掘,首先都会浏览数据,查看一下数据的基本情况 SPL提供交互式的操作界面,这对数据分析用户来说非常友好。 比如泰坦尼克的数据,使用SPL进行查看代码如下: A 1 =f ..
-
用逗号作为分隔符,将字符串拆分为字符串序列。 查询客户采购的产品名称,选购多个产品时用逗号分隔。产品表和客户销售表部分数据如下: Product: ID Name Website R Repo ..
-
用制表符作为分隔符,将字符串拆分为字符串序列。 把日志文件整理成结构化数据(以 USERID,UNAME,IP,TIME,URL,BROWSER,LOCATION, MODULE 为字段的序表 ..
-
将字符串拆分为单词序列。 统计某篇文章中出现频率前三名的单词。文章部分内容如下: How to Call an SPL Script in Java esProc provides its o ..
-
将字符串拆分为字符序列。 统计某个网页源码里中括号外的逗号数量。网页源码部分内容如下: ABCDEF … 使用函数 A.split() 将字符串拆分成字符序列。 脚本: A B C 1 ..
-
将序表转换为 csv 格式,用逗号分隔记录中的每个字段值。 将部门表转换成 csv 格式,复制到系统剪切板。部门表如下: ID Name Manager 1 Administration 1 ..
-
将序列中的成员连成一串,连接时成员加引号。 查询每个部门的员工分布在哪些州,州名称用空格分隔。因为有的州名本身就有空格,所以要加引号区别。员工表如下: ID NAME SURNAME STAT ..
-
将序列中的成员连成一个字符串。 表 A 和表 B 的表结构相同,使用表 B 更新表 A。当表 B 的主键在表 A 中存在时更新记录,否则新增行。 表 A: ID Amount … 1 3063 ..
-
将字符串与其他类型的数值连接在一起。 下面是两个文本,在文本 2 中查找文本 1 的字符串,希望按下面形式返回: file1 like parks went out go out file2 ..