数据分析中数据从哪找?
1、简单、公开的数据集
先分享一些科研机构、企业、政府会开放的一些数据集和一些专业的数据下载网站。这些数据集一般都比较完善、质量相对较高,拿到手数据清洗的工作比较少,适合新手做一些简单基础的分析。
中国统计信息网:全国各级政府各年度的国民经济和社会发展统计信息,部分数据免费
国家统计局:各种民生相关的统计数据,而且所有数据都是免费,而且这个网站的友情链接里还有很多其他地方的数据以及国外数据。
2、数据可视化项目数据集
最常见的数据可视化项目就是制作某某地区人均收入区别的信息图,找数据可视化项目相关的数据集的时候,我们希望数据集尽量?干净?,减少数据清洗的工作,数据要足够有趣,能够支撑起丰富的图表。
3、数据建模、机器学习的数据集
UCI:UCI是加州大学欧文分校开放的经典数据集,是机器学习领域最有名的数据存储库。包含各种数据集,比如经典的泰坦尼克号幸存预测到最新的数据(如空气质量和GPS轨迹)。
阿里天池:作为国内互联网龙头阿里巴巴旗下的大数据竞赛网站,提供了很多比赛数据集可以练手,说不定还能顺手拿个奖,赚点奖金。