计算&AI •
796 引用 •
800 回帖 •
419 关注
博客
关注
-
【摘要】 “税收数据手册”主要工作是税务数据部门定期汇集各业务部门的发布表样及业务口径,要求运维公司等提供表中数据内容,由业务部门审核确认,并提交给印刷厂排版印制,最后获得纸质文档,通过分发、 ..
-
一、 问题背景与适用场景 SQL中JOIN的性能是个老大难问题,特别是关联表较多时,计算性能会急剧下降。 SQL实现JOIN一般是采用HASH分堆的办法,即先计算关联 ..
-
【摘要】 SQL 用起来虽然方便,但往往执行效率较差,且优化空间小;想用强大的 SPL,但学习需要时间,手头 ..
-
【摘要】 一些特殊的布局版面,很难通过报表工具本身提供的功能直接实现,但如果准备出合适的数据源,就能大大降低报表设计的难度!集算器就是这样的数据源准备工具,它可以很好的弥补这方面不足。其实还有 ..
-
【摘要】 定期将大数据导出到历史库以减轻生产库的压力,再基于分库计算技术,不难实现高性能的 T+0 查询报表。但如何导出却是个问题。 冷导出相对容易,但导出过程中必须停止服务。若要保证提供不间 ..
-
简介: 回归预测是指预测的目标是连续型的变量,数据探索和预处理时与分类预测有哪些相同,哪些不同,让我们用房价预测作为案例来实战分析这些问题。 [图片][图片][图片][图片][图片][图片][ ..
-
【摘要】 计算中间件是应用与数据之间,独立进行计算的可编程通用软件,常用以解决松耦合、高性能、特殊源计算、多源混算、复杂逻辑等问题。但传统计算中间件一般用硬编码实现,不仅开发效率低、维护难度大 ..
-
简介: 数据挖掘作为现在的热门词汇,那么什么是数据挖掘,它又是干什么的,它是怎么工作的,真的有那么神奇吗?这里我们用中学生能理解的语言告诉您这些问题的答案。 [图片][图片][图片][图片][ ..
-
简介 titanic 幸存者预测案例是数据挖掘的入门案例,非常适合初学者来学习,这里我们就以此数据作为切入点来讲述数据挖掘的过程,感受数据挖掘的魅力。 [图片][图片][图片][图片][图片] ..
-
【摘要】 工业设备生成的数据,通常由实时数据库进行初级采集。但实时数据过于原始,无法被信息管理系统、商业智能、数据挖掘等应用直接使用,一般需要进行标准化二次采集,形成规范一致的结构化数据服务于 ..
-
【摘要】 SQL 提供的静态转置功能 pivot 和 unpivot 适用范围很受限,要用 SQL 实现一些比较复杂的转置功能常常会遇到语句过于 ..
-
【摘要】 集算器提供 htmlparse()函数,配合 position 工具,可准确抓取 HT ..
-
在《[链接]》中我们测试过 Oracle的JDBC读出性能,现在再来测试一下写入情况。 1. ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
【摘要】 在实际的报表开发过程中,当我们遇到问题,往往并不能一开始就想到最优的解决办法。我们可以试着先用最简单、最容易的办法实现,然后再一步步进行优化;对比每种方案的存在的缺陷及改进后所带来的 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]
-
linux 打开数据文件的时间,实际测试要 10-20 毫秒。 主要原因是操作系统要按照目录去找文件。 所以性能要求非常严格的时候,要尽量减少文件的个数。 传统数据库比如 oracle,没有打 ..
-
【摘要】 数据仓库代表的是一种对数据的管理和使用的方式,它应当是一整套包括了 etl、数据管理、算法实现在内的完整的理论体系。但实际项目中的数据仓库总会存在不尽人意之处,比如数据源难以抽取、缺 ..
-
【摘要】 用户客群(标签)多的可以达到几千个,每个客群可能包括几十万甚至上千万的用户。要统计几个客群共同用户,同时要按照客户维度过滤。以 SQL 为基础的数据库技术(包括 Hadoop)一直很 ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [ ..
-
【摘要】 企业为了提高供应链的整体效率,通常都会把库龄计算作为整体经营业绩的考核指标之一。通过全局范围的库龄分析,及时了解热销商品和滞销商品及其分布情况,合理地进行库存调度和市场促销,可以大大 ..
-
一、 查询要求 Q22 语句查询可能会购买的消费者的地理分布。本查询统计在指定国家编码范围内,各国有多少消费者近 7 年没有下过订单,但帐户余 ..
-
一、 查询要求 Q21语句查询获得不能及时交货的供货商。 Q21语句的特点是:带有分组、排序、聚集、EXISTS子查询、NOT EXISTS子 ..
-
一、 查询要求 Q20 语句查询确定在某一年内,能对某给定国某一零件商品提供更有竞争力价格的供货商。所谓更有竞争力的供货商,是指那些零件有过剩 ..