通过对泰坦尼克号的幸存者预测,进行一次项目实战,在项目的完成过程中,通过自己的思考和查阅资料,使自己对机器学习算法的整个应用过程有了更加清晰地认识,也使自己进一步熟悉了seaborn、matpliotlib等可视化库的相关操作,进一步加深自身对BP神经网络算法的理解,丰富了自身的知识体系,也是对自身的一个很好反省。
内容:
(1)首先是载入训练数据,总览数据,分析数据的集体详细信息。
(2)对其进行数据预处理,对数据的异常值、缺失值等情况进行处理。
(3)分析不同属性与生存率的关系,确定预测需要的特征
(4)对已确定的特征进行标准化和数值转换处理
(5)放入BP神经网络中进行训练预测