-
为什么会用到 JAVA 数据信息化项目中的报表,现在基本都有报表工具来做了,用工具就是为了解决手工做的麻烦和困难,为啥用了工具还得手工写 JAVA 呢?而且要写的情况还挺多 这个问题其实不能完 ..
-
K-means聚类又称为快速聚类,是一种需要事先确定类别个数的聚类方法。使用K-means聚类可以将全部样本分成若干个组,如果假定包含缺失值的变量在不同分组具有不同的取值,则可以使用该变量非缺 ..
-
计算每个季度的日均销售额。 计算 2014 年每个季度的日均销售额。销售表部分数据如下: ORDERID CUSTOMERID EMPLOYEEID ORDERDATE AMOUNT 1040 ..
-
计算一周的第一日和最后一日。 当前日期是 2020/02/17,求上证指数上一周的涨幅。部分数据如下: Date Open Close Amount 2020/02/17 2924.9913 ..
-
例如在泰坦尼克的数据中,”Embarked”字段有两个缺失值,直接删除缺失的样本 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.select( ..
-
[图片] 对 DS1 数据浏览正常显示数据,但是预览报表时候就报错,请问怎么解决呢? [图片]
-
计算两个日期时间数据相差的分钟数。 对于每个 ID, Value 第一次出现 1 开始累计到 0 为止,如果 0 一直没有出现,就和系统时间比。部分数据如下: ID Time Value 1 ..
-
计算两个日期时间数据相差的天数。 查询 2015 年发货时间超过 30 天的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Amount 1024 ..
-
确实是大部分软件都有开源的,从系统到数据库到各类工具、应用,都有开源,而且开源的东西大都比较流行,拥趸众多 报表工具当然也不例外,也有开源,而且很早就有,但是开源报表工具的流行程度却是个例外 ..
-
数据中常有一些质量比较差或对建模没有意义的变量,可以定义一些规则,对其进行直接删除,以减少计算量,比如 (1)缺失率过高的变量 (2)单值变量 (3)分类数过多的变量 A 1 =file('D ..
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
解析 HTML 文件,读出序表。 从 HTML 文件中解析出成绩表,并统计每个学生的总分。 … CLASSSTUDENTIDSUBJECTSCORE Class one1Math77 Cl ..
-
MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数 MAD=median(|Xi−median(X)|) 例如,使用MAD方法检测Fare变量的异常值,阈值取3.5 A 1 =fil ..
-
解析 HTML 文件,分析正文中的信息。 查找 HTML 文件的正文中有哪些数字。文件部分内容如下: Stack Overflow - Where Developers Learn, S ..
-
将标准 SQL 语句翻译成指定数据库所使用的格式。 某公司的销售数据,部分存储在数据库 oracle 中,部分存储在数据库 mysql 中。求 2015 年 3 月 18 日到 7 月 18 ..
-
可能的异常值:|z|>2 高度可疑异常值:|z|>3 [图片] 使用Z-score方法对Fare变量检测异常值 A 1 =file('D://titanic.csv').impor ..
-
修改 SQL 语句中的过滤条件。 下面的 SQL 语句用于选出销售部门收入大于 10000 的员工,将过滤条件中的部门修改为研发部门。 select EID,NAME,SURNAME,DEPT ..
-
使用代码解析序表中的字符型字段。 求 80 后的平均工资,年龄需要从证件号码中提取。员工表部分数据如下: ID Name Identification Salary 1 Rebecca Dri ..
-
IQR=QU-QL 在QU+1.5IQR 和 QL-1.5IQR 处画两条与中位线一样的线段,称其为内栏 在QU+3IQR 和 QL-3IQR 处画两条线段,称其为外栏 落在内栏和外栏之间的观 ..
-
用正则表达式解析不定行文本数据。 日志文件由数量不定的多行组成,想要解析成结构化数据。部分日志内容如下: [图片] 函数 A.regex(rs,Fi) 用正则表达式 rs 在序列 A 的字符串 ..
-
用正则表达式解析序表中的字符型字段。 从客户地址中取出路牌号(数字号码)。客户表部分数据如下: ID Name City Address 1 VINET Beijing 124 Guangmi ..
-
计算泰坦尼克数据中各变量缺失的数量和缺失率 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.fname() 3 =A2.((y=~,A1.ali ..
-
有 Base64 编码串:eyJhIjo2MywiYyI6Mjk4LCJuIjoxLCJzIjoxLCJlIjo0MCwicCI6NH0= 需要将其转码后的 json 串({“a”:63,“c ..
-
将字符串解析为序表。 系统剪贴板中复制了中国主要城市的 GDP 和人口数据,将其输出成 csv 格式文件。部分内容如下: ID City GDP Population 1 Shanghai 3 ..
-
实践目标 集算器DQL服务器除了提供DQL语句的查询能力,还提供了模糊搜索接口,用更接近自然语言的方式查询数据库里的数据。搜索页面调用搜索接口获得多个可能的结果,并查得数据生成报表。 搜索页面 ..