AJ
主页
存档
历程
Go
区块链
k8s
前端
关于我
更多
go-learning
flutter
mysql
python
运维
GitHub
流逝的是岁月,不变的是情怀.
坚持学习,是为了成就更好的自己.
公众号[中关村程序员]
#
sklearn 包
三个方法
高斯朴素贝叶斯
适应于 特征变量是连续变量 负荷高斯分布 例如身高
多项式朴素贝叶斯
适应于 特征变量是离散变量 例如单词出现的概率
伯努利朴素贝叶斯
适应于 特征变量是布尔变量 例如单词是否出现
#
TF-IDF
词频
单词在文档中的次数
逆向文档频率
单词在文档中的区分度
#
计算方法
TF
IDF
TF-IDF = TF * IDF
#
示例代码
示例代码
#
文档分类
英文分类
nltk
中文分类
jieba