混淆矩阵中的错误:数据和参考因子必须具有相同数量的级别
artificial-intelligence
classification
machine-learning
r
5
0

我已经用R插入符号训练了线性回归模型。我现在正在尝试生成一个混淆矩阵,并不断出现以下错误:

confusionMatrix.default(pred,testing $ Final)中的错误:数据和参考因子必须具有相同数量的级别

EnglishMarks <- read.csv("E:/Subject Wise Data/EnglishMarks.csv", 
header=TRUE)
inTrain<-createDataPartition(y=EnglishMarks$Final,p=0.7,list=FALSE)
training<-EnglishMarks[inTrain,]
testing<-EnglishMarks[-inTrain,]
predictionsTree <- predict(treeFit, testdata)
confusionMatrix(predictionsTree, testdata$catgeory)
modFit<-train(Final~UT1+UT2+HalfYearly+UT3+UT4,method="lm",data=training)
pred<-format(round(predict(modFit,testing)))              
confusionMatrix(pred,testing$Final)

生成混淆矩阵时发生错误。两个对象的级别相同。我不知道是什么问题。它们的结构和水平在下面给出。它们应该是相同的。任何帮助将不胜感激,因为它使我崩溃了!

> str(pred)
chr [1:148] "85" "84" "87" "65" "88" "84" "82" "84" "65" "78" "78" "88" "85"  
"86" "77" ...
> str(testing$Final)
int [1:148] 88 85 86 70 85 85 79 85 62 77 ...

> levels(pred)
NULL
> levels(testing$Final)
NULL
参考资料:
Stack Overflow
收藏
评论
共 3 个回答
高赞 时间 活跃

以下内容似乎对我有用。这个想法类似于@nayriz的想法:

confusionMatrix(
  factor(pred, levels = 1:148),
  factor(testing$Final, levels = 1:148)
)

关键是要确保因子水平匹配。

收藏
评论

执行table(pred)table(testing$Final) 。您将看到测试集中至少有一个永远不会预测的数字(即pred永远不会出现)。这就是为什么“级别数不同”的原因。还有就是要解决这个问题,一个定制函数的例子在这里

但是,我发现此技巧很好用:

table(factor(pred, levels=min(test):max(test)), 
      factor(test, levels=min(test):max(test)))

它应该为您提供与该函数完全相同的混淆矩阵。

收藏
评论
confusionMatrix(pred,testing$Final)

每当您尝试构建混淆矩阵时,请确保真实值和预测值均属于因子数据类型。

这里既有预解码和testing$Final的类型必须为factor 。而不是检查级别,而是检查两个变量的类型,如果不是,则将它们转换为因数。

这里testing$finalint类型。将其收敛为因数,然后构建混淆矩阵。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号