Python数据挖掘实战(微课版)
上QQ阅读APP看书,第一时间看更新

习题

1.请简述数据挖掘的主要流程。

2.半监督分类任务是指当训练数据集中的带标签的样本比较少时,可以同时采用少量的带标签样本和大量的无标签样本进行模型训练。请自行查阅资料,谈一谈半监督分类模型有哪些优点及应用场景。

3.请简要说明Jupyter Notebook开发工具有何优点,并自行学习其常用的操作和命令。


[1]一般,用B、KB、MB、GB、TB、PB、EB、ZB、YB、BB表示计算机中数的存储单位,它们之间的关系:1KB(千字节)=210B=1024B,1MB(兆字节)=1024KB,1GB(吉字节)=1024MB,1TB(万亿字节,又称太字节)=1024GB,1PB(千万亿字节,又称拍字节)=1024TB,1EB(百亿亿字节,又称艾字节)=1024PB,1ZB(十万亿亿字节,又称泽字节)=1024EB=1.1805916207174113×1021B,1YB(一亿亿亿字节,又称尧字节)=1024ZB,1BB(一千亿亿亿字节)=1024YB。