系列博客目录链接:Hadoop权威指南学习笔记:总章
可用数据集下载:
本书所实际到的数据集皆为NCDC数据集,需要已经处理好的数据集的可点击如下链接去下载:
一. 原始气象数据集下载:
如果我们想获取更多的气象原始数据集时,我们可以通过NCDC的ftp服务器获取数据,实例如下
NCDC FTP数据服务器:ftp.ncdc.noaa.gov
NCDC 原始文件路径:pub/data/noaa/
1. 使用FTP终端获取NCDC数据集
- 打开ftp终端
- 连接FTP服务器,使用匿名登录,账户名为:
anonymous,密码随便输,回车即可(如果此步输入错误,可输出user命令重新输入用户名密码)
open ftp.ncdc.noaa.gov
- 进入数据目录,关闭交互模式
cd pub/data/noaa/
prompt off
- 选择要下载的日期,通过mget下载,以下载1901年数据为例(假设下载到本地D:\NCDC目录)
lcd D:\NCDC
mget 1901