Hadoop 上的商用数仓有啥技术含量

当前市场上有不少基于 Hadoop 的商用数据仓库产品,大部分都是有投资背景的,通常来讲,投资这种东西主要是因为有某种技术门槛,指望有过人的技术来挣大钱。但是,仔细分析这个业务,却很难想出它的技术逻辑在哪里,Hadoop 上的商用数据仓库缺乏技术上的核心竞争力。

这话可能很多相关从业人员不爱听,也不服气,但逻辑就是这样。

我们都知道,Hadoop 本身就提供有相对完整的数据仓库能力,开源组织还在不断地完善和丰富其功能。

那么好了,如果 Hadoop 的数仓已经做得很好,那你在上面还能干些啥?修修补补加些便利功能么?这些东西当然会有点用,但能有啥技术门槛?Hadoop 本身是开源免费的,仅凭添加的这些便利功能又该多卖几个钱?开源组织哪天不会把这些功能也搞进来一起开源免费了吗?

嗯,那一定是 Hadoop 的数仓做得不够好了,那你在这个不好的基础上又能做出什么像样的东西出来?上层做得再好,基础不灵,还不是个花架子?

还有种可能,Hadoop 的数仓还不够好,你有本事重构它的内核,把它做得更好。

好吧,但既然有这么牛的技术,又何必要基于 Hadoop 呢?自己踏踏实实地做一个完全自有的产品不更好吗?那说起来多有面儿啊?去找投资人的时候不是会显得技术含量更高吗?

左说右说,就是想不明白基于 Hadoop 做商用数仓能有什么技术上的核心竞争力?难不成就是想借用 Hadoop 的名气而已?

有点类似的是 MySQL 上的商用数据库,也很难做出太多的技术含量。和直接用开源产品相比,也就是能把便利性功能做踏实一点(开源的东西一向比较粗糙),这对于用户当然很有意义,但主要是服务性的收入,构不成多高的技术门槛。只要有客户,就会一窝蜂能冒出一大堆这样的公司来,最后大家比的根本不是技术,而是其它。不过,MySQL 情况略好一点,Oracle 收购了 MySQL 后,不会把它发展得太好,这会留出一些空间。但 Hadoop 为啥给你留空间?

这个商业逻辑在技术上是说不通的,在全世界都不通,在国外已经一定程度的证明过了,甚至现在再说这话都已经是事后诸葛亮了。

当然,你要说这个业务的竞争力并不在技术上,那没毛病,从商业上讲,这毫无问题,不以技术见长且挣大钱的企业多了去了。可是,你是这么和投资人说的吗?

投资人大多数还是期望这个业务有个技术门槛,这样才能一定程度的垄断获取高额利润。但现在分析下来,如果不赶快跑,感觉多半会血本无归了。不过,投资人的心思我也不懂,也许人家有什么神奇操作吧,

可以想像一下,在业绩压力下,这些号称为产品厂商的公司都会逐步变成服务商。因为产品本身没什么像样的增值点,那么只能是加强服务力度,打着卖产品的旗号实际上是去做项目,反正有投资人出钱养着实施团队去给客户做服务,客户当然也不会拒绝。于是看起来订单额多多,业绩好好,公司规模也不错。至于是不是赚钱,似乎所有人都不在乎。

其实,认真做好服务实施也还能有收入,管理得好了也能赚不少钱。但直接去做开源产品的服务和相关实施就好了,用不着费劲做个商用产品。你反正肯定对这些东西的内核熟得很(否则也不可能基于它做自己的产品了),甚至熟到和原作者差不多的程度,这当然也有能力做好服务了。只不过,这样说出来的商业模式听起来不够伟大,不容易找到投资罢了。

一个产品型公司的技术团队,除了研发人员外,也就是少数售前售后人员,几乎不该有实施团队。在 Hadoop 的基础上整个数仓出来,用不着几十号人,如果这公司有几百人的技术团队,你就要琢磨它的商业模式是不是在做服务实施了。