随机森林简介

随机森林算法

假设数据集共有N个样本,M个变量,其算法如下:

随机森林的优势

R代码

原发性胆汁性肝硬化数据

字段含义
days随访时间
status0表示删失,1表示死亡
treatment1表示D-青霉胺,2表示安慰剂
age年龄(天数)
sex0男,1女
ascites腹腔积水,0表示否,1表示是
hepatom肝肿大,0表示否,1表示是
spiders蜘蛛痣,0表示否,1表示是
edema水肿,0表示否,1表示是

参考