如何在hbase存储上实现视频的按帧存储

  也许你已经在一些地方看到這个消息Facebook 已经开发一款新的社会化收件箱,集成了电子邮件、即时通讯、短信、文本信息、Facebook站内信息最重要的是,他们需要每个月存儲 1350 亿条信息他们在哪里存储这些信息?Facebook的Kannan Muthukkaruppan 在《信息背后的技术》一文中给出一个令人惊奇的答案:hbase存储hbase存储

  为什么这一选择令人驚奇?Facebook 创建了Cassandra其目的就是为了建造一个收件箱类型的应用程序,但是最终他们发现Cassandra的一致性模型并不能很好地适用于Facebook 新的实时信息系統。另外Facebook 还有一个扩展的MySQL 架构,不过他们发现当数据集和索引变大时,性能会变得让人无法忍受另外,他们原本可以自己开发一套系统但他们最终还是选择了 hbase存储。

  hbase存储是一个可以横向扩张的表存储系统能够为大规模数据提供速度极快的低等级更新。这正是信息系统所需要的功能另外,hbase存储是一个基于列的键值存储系统并且是构建于 BigTabe 模型之上。hbase存储善于根据键访问行以及对于一系列的荇进行扫描和过滤。同样这也是信息系统所需要的功能。不过它并不支持复杂查询。查询通常交给分析工具处理比如 Hive,Facebook创建了Hive目嘚是处理他们容量高达多个拍字节(petabyte)的数据仓库。同时Hive 是基于Hadoop的文件系统HDFS,而hbase存储使用的也是这一文件系统

  Facebook 选择了hbase存储,因为怹们对他们的应用进行了监视并明白他们到底需要什么。他们所需要的是一个可以处理以下两种类型的数据模式:

  1. 一小组经常变化嘚临时数据;

  2. 一组不断增加但很少访问的数据

  这很有道理。当前收件箱里的邮件你只会看一次之后你很少会再去翻看这些电孓邮件。这两种类似的数据是如此不同所以有人也许在想应该使用两种不同的系统。不过很明显,hbase存储 能够很好地处理这两种类型的數据他们如何处理常规的搜索功能,尚不清楚因为这并非 hbase存储 的优势所在,不过hbase存储 可以集成多个搜索系统。

  Facebook 系统的一些关键點:

  ○ 具有比Cassandra更简洁的一致性模型

  ○ 对于他们的数据模式具有很好的扩展能力和处理能力。

  ○ 大多数功能能够满足他们的需求:自动加载平衡和故障转移、压缩支持功能、单个服务器的多碎片功能等

  ○ hbase存储 所使用的文件系统HDFS,支持复制、端对端校验和以及自动再次平衡。

  ○ Facebook 的运营团队具有丰富的HDFS使用经验因为Facebook是Hadoop的大用户,而Hadoop使用 HDFS 作为它的分布式文件系统

  ● 从无到有,编寫可自定义的应用程序服务器其目的是为了满足多个不同来源流入的大量信息。

  ● 对于以下功能可访问架构服务:电子邮件账号验證、好友关系、隐私决策以及发送决策(通过聊天工具或短信发送一条消息)

  ● 保持小团队做大事情的一贯作风,15 位工程师在一年內发布了 20 项新的架构服务

  ● Facebook将不会对单个数据库平台进行标准化,对于不同的任务他们将使用不同的平台

  Facebook 通过选择hbase存储将极夶地推动该系统的采用,同时Facebook具有丰富的 HDFS/Hadoop/Hive 使用经验想到这些,就让人兴奋的无法入睡这是任何一款产品的梦想:成为另一个非常流行嘚产品的搭档,并期待成为其生态系统的一部分这正是 hbase存储 所取得的成功。hbase存储 已经在许多方面去多了不错的成绩:实时、分布、线性擴展、健壮、BigData、开源、键值、面对列我们将会看到 hbase存储 变得更加流行,尤其是它已经获得了 Facebook 的眷顾和青睐

  hbase存储是一个分布式的、媔向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”就像Bigtable利用了Google文件系统(File System)所提供的分布式数據存储一样,hbase存储在Hadoop之上提供了类似于Bigtable的能力hbase存储是Apache的 Hadoop项目的子项目。hbase存储不同于一般的关系数据库,它是一个适合于非结构化数据存储嘚数据库.另一个不同的是hbase存储基于列的而不是基于行的模式hbase存储使用和Bigtable非常相同的数据模型。用户存储数据行在一个表里一个数据行擁有一个可选择的键和任意数量的列。表是疏松的存储的因此用户可以给行定义各种不同的列。hbase存储主要用于需要随机访问实时读写伱的大数据(Big

我要回帖

更多关于 hbase存储 的文章

 

随机推荐