留出法(Hold-out)随机抽样,一部分作为训练集,另外一部分作为验证集交叉检验法(cross vaildation)将数据集划分为大小相同的k份每一次将其中一份作为测试集,剩余的k-1份作为训练集....
2022-03-23 16:33:30
DCA(Decision Curve Analysis)决策曲线分析法是与ROC曲线相提并论的相对比较新的模型评价方法DCA曲线的绘制方法传统方法(logistic回归)ggDCA(支持logisti....
2022-03-18 07:13:19
ROC(receiver operating characteristic)应用于某指标对某疾病的诊断价值或者分类器预测结果评价横坐标是敏感性、假阳性率(sensitivity, False Posi....
2023-04-25 17:02:38
正则化技术对于高维数据,普通的变量筛选方法并不见效,或者可能需要消耗高昂的计算机算力成本。普通方法难以避免模型的过拟合,及多重共线性问题。通过正则化,我们会在残差平方和(RSS)最小化过程中,加入一个....
2022-03-25 14:48:41
logisticfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import Logisti....
2021-08-01 13:07:49
范数参考:https://blog.csdn.net/pql925/article/details/81907178向量a·b=|a||b|·cosθ 向量a在向量b方向上的投影与向量b的模的乘积ht....
2020-12-22 17:35:42
说明KNN作为惰性学习方法,训练和测试同时进行Classifying with k-Nearest Neighborstensorflow实现KNN对手写字的分类https://github.com/....
2020-12-18 00:51:56
实现y = x *2 - 1import tensorflow as tfimport numpy as npprint(tf.__version__) # 1.4.0print(np.__versi....
2020-12-11 13:05:49
基本概念计算机学习能力, 不是通过显著式编程获得。一个计算机程序可称为可以学习,是指它能够对某个任务T和某个性能指标P(花的识别率),从经验E(训练样本)中学习。这种学习的特点是,他在T上的被P所衡量....
2020-12-18 12:56:31
特征优点:精确度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高适用数据范围:数值型和标称型一般流程收集数据:可以使用任何方法准备数据:距离计算所需要的数值,最好是结构化的数据格式分....
2022-11-08 22:10:53