4)第973章 谷歌三驾马车_重生之清爽人生
字体:      护眼 关灯
上一章 目录 下一章
  e编写的程序是在成千上万的普通PC机上被并行分布式自动执行的。

  table是一个为管理大规模结构化数据而设计的分布式存储系统,可以扩展到PB级数据和上千台服务器。

  谷歌很多项目使用Bigtable存储数据,这些应用对Bigtable提出了不同的挑战,比如数据规模的要求、延迟的要求。Bigtable能满足这些多变的要求,为这些产品成功地提供了灵活、高性能的存储解决方案。

  Bigtable看起来像一个数据库,采用了很多数据库的实现策略。

  但是Bigtable并不支持完整的关系型数据模型,而是为客户端提供了一种简单的数据模型,客户端可以动态地控制数据的布局和格式,并且利用底层数据存储的局部性特征。

  Bigtable将数据统统看成无意义的字节串,客户端需要将结构化和非结构化数据串行化再存入Bigtable。

  谷歌的新三驾马车:

  在一零年的时候,谷歌的搜索引擎发生了重大变革。

  谷歌将其搜索迁移到新的软件平台,他们称之为“Caffeine”。

  Caffeine是谷歌出自自身的设计,Caffeine使谷歌能够更迅速的添加新的链接,包括新闻报道以及博客文章等,到自身大规模的网站索引系统中,相比于以往的系统,新系统可提供“50%新生”的搜索结果。

  在本质上Caffeine丢弃MapReduce转而将索引放置在由谷歌开发的分布式数据库BigTable上。

  作为继GFS和MapReduce两项创新后的又一项创新,其在设计用来针对海量数据处理情形下的管理结构型数据方面具有巨大的优势。

  这种海量数据可以定义为在云计算平台中数千台普通服务器上PB级的数据。

  Pregel在概念模型上遵循BSP模型。

  整个计算过程由若干顺序运行的超级步组成,系统从一个“超级步”迈向下一个“超级步”,直到达到算法的终止条件。

  Dremel是一种分析信息的方式,它可以跨越数千台服务器运行,允许“查询”大量的数据,如eb文档集合或数字图书馆,甚至是数以百万计的垃圾信息的数据描述。

  这类似于使用结构化查询语言分析传统关系数据库,这种方式在过去几十年被广泛使用在世界各地。

  使用Dremel就好比你拥有类似SQL的语言,并可以无需任何编程的情况下只需将请求输入命令行中就可以很容易的制定即席查询和重复查询”。

  区别在于Dremel可以在极快的速度处理网络规模的海量数据。据谷歌提交的文件显示你可以在几秒的时间处理PB级的数据查询。

  从谷歌三家马车看得出来,他们对云计算和大数据的应用主要在搜索上面。

  早在2006年,谷歌在推出了“Google101计划”的同时,也正式提出了“云”的概念与理论,随后亚马逊、微软、IBM等公司才陆续宣布了自己的“云计划”。

  但是,第一个将之落实到地的却是江燕公司,随后才是亚马逊,反观提出者谷歌一直到12年6月末,才推出了自己的云计算服务:GoogleComputeEngine。

  “既然我们已经在云计算和大数据领域超越了谷歌,获得他们的三项技术还有意义吗?”庄丁宁毕竟不是技术人员,所以对这个有点疑问。

  “当然有意义,虽然谷歌在市场应用方面不如我们,但技术底蕴却不输于我们。严格来说是他们也有技术优势,我们如果得到这三驾马车,吸收其优势,我们的微博云可以在短时间内更进一步。”潘星解释道。

  请收藏:https://m.mfxsw.cc

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章