UCI数据集是一个常用的标准测试数据集,下载地址在
http://www.ics.uci.edu/~mlearn/MLRepository.html
http://archive.ics.uci.edu/ml/datasets/Localization+Data+for+Person+Activity
http://archive.ics.uci.edu/ml/index.html
关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
http://www.cs.waikato.ac.nz/ml/weka/
很多的机器学习的经典算法都在里面。而且公布源程序,易于修改。
from:http://apps.hi.baidu.com/share/detail/22391013
近似最近邻查询的数据集下载:
这里有一些地球环境数据集
http://explore.data.gov/Geography-and-Environment/EPA-FRS-Facilities-Combined-File-CSV-Download-for-/czc2-wmpn