标签:大数据

IT

基于马科尔夫链Python自动生成大量txt文本

嘻哈小屋 - 嘻哈 发布于 2019-04-15

最近学习spark需要大量文本文件,在之前项目的基础上进行了一定改进,在此总结一下。 首先定义MarkovChain,此处用的应该是bigram的(如果是要一阶的markov chain,由于马科尔夫链的转移矩阵可以由:P_ij的当前次数/总转移次数 来计算) import ra...

阅读(3303)评论(0)赞 (2)