博客
关于我
人工智能、深度学习、机器学习常见面试题141~160
阅读量:493 次
发布时间:2019-03-06

本文共 482 字,大约阅读时间需要 1 分钟。

随机森林算法中,袋外数据(OOB)是一项重要的技术概念。随机森林通过Bagging方法结合多个决策树模型来提升预测性能。在Bagging方法中,Bootstrap每次抽取的样本数量约为1313个,这些样本不会出现在最终的训练集中。这些未被使用的样本被称为袋外数据OOB,其主要用途是替代传统的测试集误差估计方法。

袋外数据的计算方法如下:在随机森林已经生成完毕后,使用袋外数据对模型性能进行测试。将袋外数据作为输入,带入之前生成的随机森林分类器中,分类器会输出相应的分类结果。由于袋外数据的真实标签已知,可以将分类器的预测结果与真实标签进行对比,统计分类错误的数量记为X。袋外数据误差的计算公式为X/O,其中O是袋外数据的总数。这种方法已经被证明是无偏估计,因此在随机森林算法中无需额外的交叉验证或单独测试集来获取测试集误差的无偏估计。

袋外数据的优势在于其无偏性,以及能够更好地反映模型在实际应用中的性能。但其也存在一些不足之处:首先,计算袋外数据需要额外的计算资源,其次,袋外数据的生成依赖于随机森林的具体实现。因此,在实际应用中需要根据具体需求权衡其优缺点。

转载地址:http://tooyz.baihongyu.com/

你可能感兴趣的文章
Oracle常用函数整理
查看>>
oracle常见操作
查看>>
Oracle数据库异常--- oracle_10g_登录em后,提示java.lang.Exception_Exception_in_sending_Request__null或Connection
查看>>
oracle数据库异常---SP2-1503: 无法初始化 Oracle 调用界面 SP2-1503: 无法初始化 Oracle 问题的解决办法
查看>>
oracle数据库核心笔记
查看>>
oracle数据库笔记---oracleweb视图使用流程,及plsql安装
查看>>
oracle数据库笔记---pl/sql的基础使用方法
查看>>
Transformer 架构解释
查看>>
Oracle数据库表空间 数据文件 用户 以及表创建的SQL代码
查看>>
oracle数据库零碎---Oracle Merge 使用,表中存在数据就修改,没有数据自动添加
查看>>
Oracle数据库验证IMP导入元数据是否会覆盖历史表数据
查看>>
oracle数据插入表,oracle同时向多表插入数据
查看>>
oracle数据类型和对应的java类型
查看>>
Oracle未开启审计情况下追踪表变更记录
查看>>
Oracle条件查询
查看>>
Oracle查看数据库会话连接
查看>>
Oracle查询前几条数据的方法
查看>>
oracle树形查询 start with connect by
查看>>
oracle毕业论文题目,历届毕业论文申报题目大全.doc
查看>>
oracle求助---win7下oracle配置相关疑问Starting Oracle Enterprise Manager 10g Database Control ...发生系统错误 5。
查看>>