上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
3.1 自行车租赁(回归)
该数据集包含来自华盛顿特区的自行车租赁公司的自行车租赁的每日计数,以及天气和季节信息。该数据由Capital-Bikeshare 公开提供。Fanaee-T 和Gama[12] 添加了天气数据和季节信息,目的是根据天气和天数来预测会租用多少辆自行车。这些数据都可以从UCI 机器学习数据库中下载。
有许多新特征被添加到数据集中,但本书的示例并没有使用所有原始特征。下面列出本书会用到的特征列表。
·租赁数量。表示自行车租赁的数量,包括来自游客用户和注册用户。这个数量也是回归任务的预测目标。
·季节。具体包括春季、夏季、秋季和冬季。
·是否假期。表示一天是否为假期。
·年份。表示为2011 年或2012 年。
·天数。表示自2011 年1 月1 日(数据集中的第一天)起的天数。引入此特征是为了考虑随时间变化的趋势。
·是否工作日。表示一天是工作日还是非工作日。
·天气情况。包括晴、雾和雨雪。
·温度。单位为°C。
·相对湿度。相对湿度百分比(0~100%)。
·风速。单位为km/h。
对于本书中的示例,数据已进行了少量处理。读者可以在本书的GitHub 存储库中找到正在处理的R 脚本以及最终的RData 文件。