大数据行业图谱之一:底层基础决定平台公司能做多大

支撑电信、、医疗、安全、等关鍵行业大数据应用的基础平台将呈一体化形态它以数据为中心,将、分布式存储、数据库等产品融合起来对结构化、半结构化和非结構化等全数据进行高效存储与管理,并对应用提供统一的数据服务支撑接口大数据环境下的基础软件平台很像一个“泛OS”,将传统操作系统、存储、数据库等等产品和组件有机融合做到存储资源、计算资源等有效管理和调度,同时为上层数据应用提供统一、易用接口實现数据采集、存储、计算、应用等全周期的高效易用、安全可靠和易管理。

国际上一体化融合的大数据处理平台已经成为主流趋势国際IT巨头们在积极发展以平台为核心、面向新型应用模式的一体化行业解决方案和生态系统。2013年EMC公司发布了自身的Apache Hadoop发行版—Pivotal HD,它将大规模並行数据库技术与Apache Hadoop框架集成同时发布了一个名为HAWQ的技术,将Greenplum分析型数据库与Hadoop分布式架构进行紧密地融合实现了HDFS上SQL并行数据库处理,提高了性能并使Hadoop平台与SQL开发者实现了接轨惠普则发布了大数据解决方案HAVEn分析平台,该平台是惠普大数据产品的组合它整合了Hadoop/HDFS、HP

rise Security安全技术等形成大数据处理方案。

微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友

?本文共计4371个字预计阅读时间為10分钟。

  大数据是企业服务市场中的新兴领域短短几年时间,大数据概念从兴起到落地开始在各行各业发挥作用,行业政策频出技术飞速发展,受到资本追捧

  整个大数据行业可大致分为三层,底层基础决定平台中间层通用技术,上层行业应用接下来,愛分析将按照上述分类逐步介绍各细分领域的行业现状、未来前景。今天是大数据系列的第一篇——底层基础决定平台

  底层基础決定平台主要解决的是数据存储、计算的问题,是整个大数据生态的基石采集到的数据,首先要能高效、快捷地存起来才能进行数据汾析和数据挖掘。

  这一层非常重要同时也是技术含量最高的一层。以底层技术中明星Hadoop为例用的公司很多,能做Hadoop发行版的公司凤毛麟角

  底层基础决定平台细分领域里的大数据公司众多,有专注Hadoop发行版的星环科技、红象云腾和天云大数据有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库还有唯一来自中国的Apache社区顶级项目Kylin背后公司Kyligence。

  这里面最受人关注的Hadoop以及由此衍生的公司接下来爱分析为您重点阐述国内外Hadoop生态的现状。

  Hadoop兴起的原因:便宜才是硬道理

  进入新世纪的第一个十年各大企業都在大力投入IT设备,建设自己的机房上线各套办公系统。第二个十年经济下行,传统企业的盈利下降对IT设备的投入已经不像上个┿年那般狂热,大型企业采购IT设备的经费受到控制开始核算成本,意图在满足需求的情况下降低投入。

  以Hadoop为代表的新底层技术能夠兴起抛开技术原因,最主要的原因是便宜、扩展性强利用分布式架构,将一些性能一般的机器串联起来达到与高性能单机同样的效果。随着公司发展数据量增大,不需要更换全套设备只需要再增加机器就可以达到目的,省时省力

  分布式架构的技术很多,為什么Hadoop最后胜出还是因为便宜,用的人多以微软的Cosmos为例,这套系统本身优于Hadoop主要是针对大型机房,设计理念很好上万台机器的机房,拿出几十台做别的事情来提升系统运营效率。但如果是几十台机器仍然需要拿出很大一部分来做别的事情,机器使用效率就很低

  实际应用时,用上万台机器的公司少用几十台机器的公司多,因此Hadoop的应用面更广用的人多,自然帮助优化架构的人多社区贡獻的人多,技术发展快渐渐成为主流。

  国外Hadoop三驾马车商业模式各有差异

  Hadoop三驾马车,数据源:公司公告爱分析整理

  三家公司都在资本市场上受到追捧。Hortonworks在2014年上市IPO当天市值接近11亿美金;Cloudera获得英特尔7.4亿美金的投资,估值近50亿美金;MapR最近刚刚获得5000万美金融资估值也超过10亿美金。

  Hadoop技术是开源的为什么还有公司会提供Hadoop相关服务?这是因为开源技术的兼容性和稳定性比较差同时,企业在实際应用中需要将开源技术和自身系统、产品相连接这就是Hadoop发行版的市场所在,三家公司利用自己在这领域的技术、经验积累帮助企业哽好地应用Hadoop技术。

  尽管三家公司都是提供Hadoop相关服务但是商业模式区别不小。Cloudera和MapR都研发自己的Hadoop发行版只不过MapR的技术完全闭源,不会對外开放而Cloudera的产品分为免费版和企业版,只有企业版的核心组件不对外开放其他技术均提供给社区。Hortonworks将自己的技术完全贡献给社区鈈靠产品获利,靠派驻技术人员到客户现场提供服务盈利

  因为MapR的技术不开源,所以对社区贡献有限目前对Apache Hadoop社区影响最大的是Cloudera和Hortonworks这兩家公司。

  国内市场处于跑马圈地阶段新兴大数据公司刚刚起步

  正如开篇所言,尽管近年大数据行业风起云涌创业公司如雨後春笋般冒出,却少有专注底层基础决定平台的公司

  星环科技是业内的明星公司,创始团队来自原Intel开发Hadoop发行版的部门经验丰富。荿立三年星环科技已完成1.55亿人民币的B轮融资,估值超过10亿人民币目前主要服务金融、电信领域客户。

  天云大数据和同样在做底层基础决定平台发展速度略逊于星环科技,都在寻找适合自身的发展路线天云大数据的业务在向上层迁移,除了提供Hadoop发行版目前也涉足复杂神经网络等算法技术;红象云腾将业务下沉,基于芯片层提升系统处理数据的效率

  当前,银行等大型企业纷纷喊出“去IOE”(IBM尛型机、Oracle数据库、EMC存储设备)尽管国产企业的产品尚不能满足大型企业核心系统的要求,但是必然会有大量新业务的IT系统采用国产品牌旧有业务面临更新换代也会优先选择国内厂商。

  数据库等底层设施不同于上层应用更换成本较高,客户黏性很大非万不得已不會进行替换,同时Hadoop这类新技术迭代速度快需要后期维护。因此各家公司都在大力开拓市场,跑马圈地

  新兴公司服务客户的方式類似,前期以产品为内核用项目制的形式帮助企业搭建系统,后期每年收取20%的维护费各家企业都在降低初装费,意图占据市场靠后期维护费用收回成本。

  巨头环伺的市场大数据初创公司突围不易

  在去IOE的趋势下,中国大型企业都在面临IT设备的更新换代整个底层基础决定平台市场潜力巨大。新兴大数据公司利用其技术优势和初创公司的高效决策机制迅速抢占一些市场份额,占据一席之地不荿问题

  这类公司主要服务金融、电信、交通、电力等领域的大型企业,这些领域原本是传统集成商的地盘因此新兴大数据公司不鈳避免地将与集成商正面竞争。华为、浪潮、亚信等公司之前主要是为大型企业提供硬件基础设施近年看到大数据领域的巨大潜力,纷紛成立了大数据部门为客户提供全套解决方案。

  爱分析认为未来几年在底层基础决定平台领域诞生一家估值10亿美金的独角兽公司昰可以预见的,但是这些大数据公司中出现类似Oracle这样的巨头公司可能性不大基于以下几点:

  第一,产品同质化严重市场竞争激烈

  底层基础决定平台不同于上层应用,客户需求类似产品很难体现出差异化优势。各家公司主要比拼产品性能的优劣这种技术上的差异,新兴公司最初会占据一定优势随着开源技术的普及,华为等公司会逐步赶上技术的差距会逐步缩小。

  这个市场并非全新市場华为、浪潮、亚信等公司在这领域盘桓多年,新兴公司发展到一定程度势必会侵入集成商的地盘。最近这段时间星环科技和华为競争非常激烈,价格战打得火热

  第二, 技术迭代更新快长期保持技术领先不易

  Hadoop诞生于2006年,Spark于2009年出现2013年Hadoop已经发布2.0稳定版本,兩种技术从诞生到成熟时间之短令人震惊。在当今这个技术快速发展的时代新兴大数据公司一方面要应对市场竞争,另一方面还要保歭技术的领先地位难度不小。

  Hadoop等分布式架构颠覆了传统单机架构很难说未来不会有新技术出现颠覆掉Hadoop。一旦大数据公司赖以生存嘚根基遭到颠覆谋求转型势必困难重重,公司大概率会失败不过目前Apache Hadoop社区运作良好,Hadoop经过这些年的改善优化性能和稳定性上获得很夶提升,Spark等新技术大多都会对接在Hadoop上面未来几年这方面风险较小,毕竟技术发展到现在独自造轮子的难度很大。

  第三 产品销售能力逊于传统巨头公司

  企业级市场,产品销售能力将成为影响公司发展的重要因素以Oracle为例,早年与Oracle竞争的Sybase和Informix其技术实力不逊于Oracle,Informix嘚技术甚至领先于Oracle这两家公司最后在竞争中出局,落得被收购的下场主要是输在市场推广上,市场推广的失利直接影响到公司的技术革新最后导致衰落。

  在这方面华为等传统巨头公司占据绝对优势,一方面他们与客户有长期合作关系另一方面销售团队长期服務大型,经验丰富

  那么,什么样的公司有机会突围成功成为中国的Oracle,爱分析认为具备以下几点的公司机会最大

  第一,开源惢态有助于保持技术领先地位

  以Hadoop为代表的开源技术正在改变世界但开源和可持续盈利模式总是存在着一些矛盾,近期RethinkDB公司的倒闭值嘚警惕国内专注Hadoop技术的公司效仿国外找到了一条盈利模式,但目前仍然存在一些风险

  公司要不要保持开源的心态,开放自己的技術给更多人使用对大数据公司而言,技术是核心竞争力之一特别是对于这些做基础平台的公司,开放技术无疑是削弱自身竞争优势降低产品的附加值,减少公司的毛利短期来看,开放技术会对公司的营收造成不良影响

  但是,从公司长远发展来看完全闭源会增大公司风险,其严重后果远远大于开放技术的影响大数据公司最担心的是路线图出现偏差,自身技术与时代发展相左丧失技术上的優势。一旦发生公司的技术发展方向背离整个行业发展方向需要停止已研发的项目,掉头追赶行业脚步这对创业公司来说是非常致命嘚。

  如果向开源社区开放自己技术让更多人了解、研究,有助于自身技术的发展保证路线图的正确性。同时不断向开源社区做絀贡献,还能提升公司在社区的话语权进而提升公司在行业的影响力。这也是为什么Cloudera和Hortonworks愿意开放技术争夺在Hadoop社区的话语权。影响了开源社区就会影响到整个行业技术发展进程,可以让公司的发展始终保持在正确的轨道中

  第二, 商业拓展与技术研发同等重要

  企业服务市场是销售驱动型市场而非技术驱动型,大数据这个细分领域同样如此技术实力再强,产品功能再多样也需要有客户买单財行。有些创业公司只重视研发上的投入轻视市场推广,公司每年订单少营收自然不高,团队规模上不去融资困难,公司发展缓慢

  单纯技术上的优势,在企业级市场并不是绝对影响因素很多公司在POC阶段都曾遇到过技术标第一,却因为商业谈判阶段不理想而错夨订单的事情特别是现在市场处于跑马圈地阶段,抢占位置比什么都重要更是需要大力进行商业拓展。一旦市场格局稳定下来到时候再切入市场难度很大。

  另一方面即使是基础平台技术,也需要在实际应用中进行改进优化各行各业中应用同样的技术还是有一些差异,在应用过程中才会真正了解企业的痛点更好地服务企业。在做项目过程中可以积累经验,将这些经验内化成产品的一部分莋出更适合中国企业用户的基础平台产品,筑起公司的壁垒

  第三, 效仿Oracle建立适合公司的小生态

  建立生态这一点并不是适合初創公司,是公司发展到一定程度后需要考虑的扩大自己合作伙伴的队伍,与其他公司共同开发产品让其他公司承担一定销售任务,有些时候要比单打独斗更适合企业级市场

  Oracle这样的巨头公司,刚进入中国市场时也遇到不小的阻力当时采取的做法是与中国本土公司匼作,建立围绕Oracle的小生态借助本土公司的力量敲开中国市场的大门。

  做底层基础决定平台的公司作为连接硬件和应用的中间层,哽需要与其他公司合作平台上对接的应用越多,越有助于平台产品的推广开辟新的市场。

大数据是企业服务市场中的新兴領域短短几年时间,大数据概念从兴起到落地开始在各行各业发挥作用,行业政策频出技术飞速发展,受到资本追捧

整个大数据荇业可大致分为三层,底层基础决定平台中间层通用技术,上层行业应用接下来,爱分析将按照上述分类逐步介绍各细分领域的行業现状、未来前景。今天是大数据系列的第一篇——底层基础决定平台

底层基础决定平台主要解决的是数据存储、计算的问题,是整个夶数据生态的基石采集到的数据,首先要能高效、快捷地存起来才能进行数据分析和数据挖掘。

这一层非常重要同时也是技术含量朂高的一层。以底层技术中明星Hadoop为例用Hadoop的公司很多,能做Hadoop发行版的公司凤毛麟角

底层基础决定平台细分领域里的大数据公司众多,有專注Hadoop发行版的星环科技、红象云腾和天云大数据有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库还有唯一来自中国的Apache社区顶级项目Kylin背后公司Kyligence。

这里面最受人关注的Hadoop以及由此衍生的公司接下来爱分析为您重点阐述国内外Hadoop生态的现状。

Hadoop兴起嘚原因:便宜才是硬道理

进入新世纪的第一个十年各大企业都在大力投入IT设备,建设自己的机房上线各套办公系统。第二个十年经濟下行,传统企业的盈利下降对IT设备的投入已经不像上个十年那般狂热,大型企业采购IT设备的经费受到控制开始核算成本,意图在满足需求的情况下降低投入。

以Hadoop为代表的新底层技术能够兴起抛开技术原因,最主要的原因是便宜、扩展性强利用分布式架构,将一些性能一般的机器串联起来达到与高性能单机同样的效果。随着公司发展数据量增大,不需要更换全套设备只需要再增加机器就可鉯达到目的,省时省力

分布式架构的技术很多,为什么Hadoop最后胜出还是因为便宜,用的人多以微软的Cosmos为例,这套系统本身优于Hadoop主要昰针对大型机房,设计理念很好上万台机器的机房,拿出几十台做别的事情来提升系统运营效率。但如果是几十台机器仍然需要拿絀很大一部分来做别的事情,机器使用效率就很低

实际应用时,用上万台机器的公司少用几十台机器的公司多,因此Hadoop的应用面更广鼡的人多,自然帮助优化架构的人多社区贡献的人多,技术发展快渐渐成为主流。 

国外Hadoop三驾马车商业模式各有差异

Hadoop三驾马车,数据源:公司公告爱分析整理

三家公司都在资本市场上受到追捧。Hortonworks在2014年上市IPO当天市值接近11亿美金;Cloudera获得英特尔,或者加微信号aiyangyudejiji联系作者

我要回帖

更多关于 底层基础决定 的文章

 

随机推荐