设为首页 - 加入收藏 阜新站长网 (http://www.0418zz.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: Note 商业 黑客 官方
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

用R语言分析与预测员工离职

发布时间:2018-10-02 00:12 所属栏目:[教程] 来源:佚名
导读:【新品产上线啦】51CTO播客,随时随地,碎片化学习 在实验室搬砖之后,继续我们的kaggle数据分析之旅,这次数据也是答主在kaggle上选择的比较火的一份关于人力资源的数据集,关注点在于员工离职的分析和预测,依然还是从数据读取,数据预处理,EDA和机器学
【新品产上线啦】51CTO播客,随时随地,碎片化学习

在实验室搬砖之后,继续我们的kaggle数据分析之旅,这次数据也是答主在kaggle上选择的比较火的一份关于人力资源的数据集,关注点在于员工离职的分析和预测,依然还是从数据读取,数据预处理,EDA和机器学习建模这几个部分开始进行,最后使用集成学习中比较火的random forest算法来预测离职情况。

数据读取

  1. setwd("E:/kaggle/human?resource")?
  2. library(data.table)?
  3. library(plotly)?
  4. library(corrplot)?
  5. library(randomForest)?
  6. library(pROC)?
  7. library(tidyverse)?
  8. library(caret)?
  9. hr<-as.tibble(fread("HR_comma_sep.csv"))?
  10. glimpse(hr)?
  11. sapply(hr,function(x){sum(is.na(x))})?
  12. ————————————————————————————————————————————————————————————————————————————————————?
  13. Observations:?14,999?
  14. Variables:?10?
  15. $?satisfaction_level?????0.38,?0.80,?0.11,?0.72,?0.37,?0.41,?0.10,?0.92,?0.89,?0.42,?0.45,?0.11,?0.84,?0.41,?0.36,?0.38,?0.45,?0.78,?0.45,?0.76,?0.11,?0.3...?
  16. $?last_evaluation????????0.53,?0.86,?0.88,?0.87,?0.52,?0.50,?0.77,?0.85,?1.00,?0.53,?0.54,?0.81,?0.92,?0.55,?0.56,?0.54,?0.47,?0.99,?0.51,?0.89,?0.83,?0.5...?
  17. $?number_project?????????2,?5,?7,?5,?2,?2,?6,?5,?5,?2,?2,?6,?4,?2,?2,?2,?2,?4,?2,?5,?6,?2,?6,?2,?2,?5,?4,?2,?2,?2,?6,?2,?2,?2,?4,?6,?2,?2,?6,?2,?5,?2,?2,?...?
  18. $?average_montly_hours???157,?262,?272,?223,?159,?153,?247,?259,?224,?142,?135,?305,?234,?148,?137,?143,?160,?255,?160,?262,?282,?147,?304,?139,?158,?242,...?
  19. $?time_spend_company?????3,?6,?4,?5,?3,?3,?4,?5,?5,?3,?3,?4,?5,?3,?3,?3,?3,?6,?3,?5,?4,?3,?4,?3,?3,?5,?5,?3,?3,?3,?4,?3,?3,?3,?6,?4,?3,?3,?4,?3,?5,?3,?3,?...?
  20. $?Work_accident??????????0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?1,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?...?
  21. $?left???????????????????1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?1,?...?
  22. $?promotion_last_5years??0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?1,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?0,?...?
  23. $?sales??????????????????"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sales",?"sa...?
  24. $?salary?????????????????"low",?"medium",?"medium",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low",?"low...?
  25. ?
  26. ?satisfaction_level???????last_evaluation????????number_project??average_montly_hours????time_spend_company?????????Work_accident??????????????????left??
  27. ????????????????????0?????????????????????0?????????????????????0?????????????????????0?????????????????????0?????????????????????0?????????????????????0??
  28. promotion_last_5years?????????????????sales????????????????salary??
  29. ????????????????????0?????????????????????0?????????????????????0??

数据集情况如下,一共10维数据,14999个观测值,变量的代表名称分别是

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章