SVM 不适合大型数据

Published on Aug. 22, 2023, 12:06 p.m.

好处

与朴素贝叶斯算法相比,SVM 分类器提供了良好的准确性并执行更快的预测。它们还使用较少的内存,因为它们在决策阶段使用了训练点的子集。SVM 在具有清晰的分离边界和高维空间的情况下工作得很好。

SVM 不适合大型数据集,因为它的训练时间长,而且与朴素贝叶斯相比,它也需要更多的训练时间。它在重叠类时效果不佳,并且对使用的内核类型也很敏感。

这里有个示例文章

https://www.datacamp.com/community/tutorials/svm-classification-scikit-learn-python


  1. 如果做大的数据集可以考虑使用深度学习来实现svm
  2. sk效果很差,打数据考虑分布式跑吧,以及分批