载入中。。。 'S bLog
 
载入中。。。
 
载入中。。。
载入中。。。
载入中。。。
载入中。。。
载入中。。。
 
填写您的邮件地址,订阅我们的精彩内容:


 
hadoop运行流程的工具,相关性能监控调度工具包等.
[ 2012/11/20 19:29:00 | By: 梦翔儿 ]
 
trace hadoop运行详细流程的工具,可以profiling hadoop的性能瓶颈,或者可以监控比如提交job在hadoop中如何调度,相关的好工具包推荐大家也推荐下

几年前UCBerkeley有一个用xtrace来分析hadoop的项目,你提到的细粒度的信息都能看得到。但是它是要插代码的,而且好像很久没有更新,可能facebook现在还在用这个。

如果你不希望改代码的话,那么你能看到的信息其实只有四种:
  1. 系统资源统计。用top,sysstat等工具监控整个系统资源使用情况。
  2. binary instrumentation。这方面也有很多工具,如hprof, jprof, btrace等等。特别是btrace值得看看,它可以动态的插入profile代码。
  3. Hadoop提供的JMX bean信息。JMX是Java一个监控和管理的标准,Hadoop代码中有部分关键信息通过JMX接口暴露出来。
  4. Hadoop的log。这方面有专门的Hadoop的分析工具,如Vaidya,Kahuna。其他通用的log分析工具也有很多。

另外像Ganglia啊Cacti啊这样的集群管理工具能很方便地监控集群中每台机器的运行情况,它们可以综合上面提到的四种信息。

还有最近Intel刚在ATC‘11上也发表了一篇trace分布式系统运行情况的论文,他们的系统叫HiTune,综合了binary instrumentation,系统资源统计以及log分析等方面的结果。你可以问问他们要代码,都是上海这边的团队做的。
 
 
  • 标签:hadoop 
  • 发表评论:
    载入中。。。

     
     
     

    梦翔儿网站 梦飞翔的地方 http://www.dreamflier.net
    中华人民共和国信息产业部TCP/IP系统 备案序号:辽ICP备09000550号

    Powered by Oblog.