图书 •
860 引用 •
253 回帖 •
4 关注
博客
关注
-
有 2022 年 1 月的日销售额统计表如下所示: [图片] 找出日销售额大于 1000 的日销售数据: =spl('=E(?1).select(Sales>1000)',A1:B32) ..
-
时间序列X: X= [x1,x2,…,xn] 特征指数是表征时间序列走势的原子化特征,数学方法有无数种,本着奥卡姆剃刀原理,即用简单的方法能解决的问题就不复杂化。这里要介绍的特征指数的计算方法 ..
-
问题 筛选法是一种古老的求不超过自然数 N(N>1)的所有质数的一种方法。具体做法是:先把 N 个自然数按次序排列起来。最小的质数是 2,所以先把 1 划去,从 2 开始,把 2 留下,而把 ..
-
使用A.smooth(T)或P.smooth(cn, T)函数,可以将变量做平滑化处理,经过平滑化处理后可以消除映射成整数后数值大小的影响。 例如还是上一小节中的“Ticket”变量,对其做平 ..
-
K-means聚类又称为快速聚类,是一种需要事先确定类别个数的聚类方法。使用K-means聚类可以将全部样本分成若干个组,如果假定包含缺失值的变量在不同分组具有不同的取值,则可以使用该变量非缺 ..
-
相关系数是度量两个变量之间相关程度的统计量,常用的有Pearson相关系数和Spearman相关系数,两者值均在[-1,1]之间分布,当其值为0时两个变量不想关,当其值为1或-1时,表示两个变 ..
-
问题 请给出未来指定的某年(如 2020)的全年日历。使用字符串输出,仿照常见日历的格式,按年月分隔,包含日期和星期信息。 思路 大致思路:循环十二个月,首先计算月标题和星期标题添加到万年历, ..
-
有数据如下: [图片] 按班级统计 90 分以上的人数、不及格的人数、去掉一个最高分去掉一个最低分后的平均分,结果填到每个班级的第一行数据上(在 D1 中计算): A 1 =E(‘A1:C19 ..
-
在建模数据中经常遇到这样一种变量,其本身是受因变量影响的(即它不但不是因变量的影响因素,反而因变量是它的影响因素),若该变量被作为自变量添加入模型,则会造成其他自变量不能进入模型。同时,由于这 ..
-
比较两个序列的大小筛选记录。 以奥运会奖牌榜为例,查询哪几届奥运会中国奖牌榜排名比俄罗斯靠前。 Game Nation Medal 30 USA 46,29,29 30 China 38,27 ..
-
有数据如下: [图片] 列数不定,目前是 C~F 列,有时候多有时候少,在每组数据下面的空白单元格中求 (C~F 列) 汇总值: A B 1 =‘A1:F15’.group@i(~ -1==n ..
-
指股票 N 日收益波动率,这里的波动率是历史波动率,评估历史收益的标准差,属风险评估指标。 波动率 = 股票涨跌幅的 N 日标准差 * sqrt(N 日) 波动率越高,金融资产价格的波动越剧烈 ..
-
有了初始化类心,将其传入kmeans方法中,就能得到各生产路线的类心。当有新的收率数据Y需要确定类别(生产路线)时,只需确定Y中每个成员到哪个类心最近,该成员就属于哪一类。 过程如下: 预测数 ..
-
有很多个主子表,分别把主表拆出来组成一个行式表,子表拆出来,也组成一个行式表 主子表文件示例如下: Orders1.xlsx: [图片] Orders2.xlsx: [图片] Orders3. ..
-
问题 这应该算是一个报表处理需求,举这个例子的目的是为了说明集算器灵活自由的运算系统,即使对于很不规则的报表处理需求,往往也能胜任。 问题很简单,将下面的 Names 表改成 3 列显示,分别 ..
-
问题 下面是某证券交易所一个月内的日收盘价记录,其中 CODE 列为股票代码,DT 为日期,CL 为收盘价。 [图片] 试找出这个月内曾连续三天涨停的股票。为避免四舍五入产生的误差,涨停的比率 ..
-
有数据如下: [图片] 分别统计 50 以下,50-60,60-70,70-80,80-90,90 以上每个分数段的人数: =spl('=E(?1).groups(if(Score<50 ..
-
在SPL中可以通过位置引用向量元素 A 1 [7,9,6,23,56,1] 2 =A1(3) 3 =A1.to(2) 4 =A1.to(3,5) 5 =A1.to(3,) 6 =A1.m(-2 ..
-
使用 group() 函数分组,将分组子集保留下来,再对分组子集进行聚合运算。这种运算方式的优点是分组子集可以保留下来,如果需要对分组子集重复使用,或者进行一些复杂的运算,可以采用此方式。 在 ..
-
有回车符分隔的数字串,找出最大数字: [图片] 代码: =spl('=?1.split@np().max()',A1) 结果:3 函数 split 将字符串拆分为序列,@n 表示按回车拆分(也 ..
-
问题 下面有一个简化的超市的库存管理系统内的一些表,为考察销售情况,需要算出 6 月份“生鲜”类的商品在超市内的平均停留时间。需要的表如下: 首先是商品表,记录各种产品的信息: [图片] 下面 ..
-
可能的异常值:|z|>2 高度可疑异常值:|z|>3 [图片] 使用Z-score方法对Fare变量检测异常值 A 1 =file('D://titanic.csv').impor ..
-
偏最小二乘回归提供一种多对多线性回归建模方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的样本量又较少时,用偏最小二乘法回归建立的模型具有传统的经典回归分析等方法多没有的有点。 ..
-
有如下销售数据: [图片] 算出每个人的累计销售额,在 D1 中计算: =spl('=E(?1).new(cum(~~+Sales;Name):'Cumulative Sales')',A1: ..
-
OBV 指标又称为能量潮,也叫成交量净额指标,是通过累计每日的需求量和供给量并予以数字化,制成趋势线,然后配合证券价格趋势图,从价格变动与成交量增减的关系,来推测市场气氛的一种技术指标。 OB ..