博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[Hadoop in China 2011] HBase在淘宝平台上的应用和改进经验
阅读量:5956 次
发布时间:2019-06-19

本文共 752 字,大约阅读时间需要 2 分钟。

http://tech.it168.com/a2011/1202/1283/000001283152.shtml

在今天下午进行的NoSQL系统及应用分论坛中,来自淘宝的软件工程师张毅发表主题演讲“淘宝HBase应用和改善”,介绍了HBase在淘宝平台上使用,以及对HBase的调试和改进的经验分享。

HBase在淘宝平台上的应用和改进经验

▲淘宝软件工程师张毅

   随着淘宝的数据的快速增长,数据量每年都会翻一翻,这样的增长速度是淘宝选择HBase的重要原因。据张毅介绍,淘宝自今年年初开始对HBase进行预 演,包括线上应用和调优,以及bug的修改。这一过程包括三个阶段,第一阶段是对HBase的属性和配置等性能方面的熟悉过程;第二阶段将HBase应用 到线上;第三阶段是修改其内部代码,并投入到HBase的社区中,使其得到进一步的发展。

HBase在淘宝平台上的应用和改进经验

▲淘宝选择HBase的原因

   HBase是分布式NoSQL存储系统,其底层数据存储基于HDFS,具有高可用和高性能的特点,可以处理百亿行*百万列*上万个版本的列式存储。谈到 淘宝为什么会选择HBase,张毅表示,淘宝选择HBase就像当年选择Hadoop一样,因其具有海量数据处理的能力。淘宝每天的数据量都能达到PB 级,需要HBase应对海量数据带来的挑战。另外,HBase还具有易于横向扩展、随机读写的高性能、高可靠性和稳定性、单行写入的强一致性的特点。

HBase在淘宝平台上的应用和改进经验

▲HBase在淘宝的规模

   张毅认为数据瞬间写入量很大,数据库不好支撑或者需要很高成本支撑的场景可以考虑使用HBase,或者数据需要长久保存,且量会持续增长到比较大的场景 可以选择HBase。但是HBase毕竟不是关系型数据库,因此不适用于有Join、多级索引、表关系复杂的数据模型。

HBase在淘宝平台上的应用和改进经验

▲NoSQL专场爆满 向坐在地上的同学们致敬

转载地址:http://raexx.baihongyu.com/

你可能感兴趣的文章
JFreeChart开发_用JFreeChart增强JSP报表的用户体验
查看>>
度量时间差
查看>>
通过jsp请求Servlet来操作HBASE
查看>>
Shell编程基础
查看>>
Shell之Sed常用用法
查看>>
3.1
查看>>
校验表单如何摆脱 if else ?
查看>>
<气场>读书笔记
查看>>
web安全问题分析与防御总结
查看>>
Centos下基于Hadoop安装Spark(分布式)
查看>>
3D地图的定时高亮和点击事件(基于echarts)
查看>>
mysql开启binlog
查看>>
设置Eclipse编码方式
查看>>
分布式系统唯一ID生成方案汇总【转】
查看>>
并查集hdu1232
查看>>
Mysql 监视工具
查看>>
从前后端分离到GraphQL,携程如何用Node实现?\n
查看>>
Linux Namespace系列(09):利用Namespace创建一个简单可用的容器
查看>>
博客搬家了
查看>>
Python中使用ElementTree解析xml
查看>>