载入中。。。 'S bLog
 
载入中。。。
 
载入中。。。
载入中。。。
载入中。。。
载入中。。。
载入中。。。
 
填写您的邮件地址,订阅我们的精彩内容:


 
The Phoenix System for MapReduce Programming
[ 2011/10/25 21:35:00 | By: 梦翔儿 ]
 

The Phoenix System for MapReduce Programming

http://mapreduce.stanford.edu/

这里有一些数据集:

Input Datasets

  • Full input datasets for the sample applications: we provide small, medium, and large datasets for each application.

    histogram (~512 MB)
    MD5: da6e1853d22100b29590c0bb307b0251

    linear regression (~212 MB)
    MD5: d9ef0440ddb8b425bb9d6c2b89e62ee0

    string match (~212 MB)
    MD5: 32eb9fdc722e395a02add2b7cde6666d

    reverse index (~154 MB)
    MD5: 964568f6fca53aa4ae82539d798cd705

    word count (~59 MB)
    MD5: 903969c78d2dbd44357fdf7cbe750bc7

原来论文是多核mapreduce的,另外这个mapreduce的工作组也不错。

http://graal.ens-lyon.fr/mapreduce/

 
 
  • 标签:dataset mapreduce 
  • 发表评论:
    载入中。。。

     
     
     

    梦翔儿网站 梦飞翔的地方 http://www.dreamflier.net
    中华人民共和国信息产业部TCP/IP系统 备案序号:辽ICP备09000550号

    Powered by Oblog.