Invent

临沂seo分析百度关键词是怎么分词的(一)

您现在的位置: 摘星网络_临沂网站建设优化 > 网站建设 > 临沂网站优化 >

很多人做分析关键词的时候,不知道是百度是怎么分词的。临沂seo带着大家一起来看一下。

当搜索引擎蜘蛛将网站内容索引后就会通过中文分词技术进行入库。这是一个庞大的工程,百度搜索引擎对中文分词技术掌握非常熟练,这也是在中文搜索领域百度搜索引擎一直独大的原因。下面我们来看百度中文分词的基本原理。

字符串匹配的分词方法首先来看正向最大匹配法,就是把一个词从左至右来分词。举个例子:“不知道你在说什么”,这句话采用正向最大匹配法是如何分的呢?分出来是:“不知道,你,在,说什么。”其次是反向最大匹配法。

来看上面我举的例子“不知道你在说什么”用反向最大匹配法如何分。答案是:“不,知道,你在,说,什么。”这个就分得比较多了,反向最大匹配法就是从右至左来分词。

最后是最短路径分词法。这个怎么理解呢?就是对一段话切出最少的词数。还是用上面那句话“不知道你在说什么”举例,用最短路径分词法来分,就是把这句话分成最少的词。“不知道,你在,说什么”,这就是最短路径分词法,分出来后只有3个词。当然,上面三种可以相互结合组成一些分词方法。比如,正向最大匹配法和反向最大匹配法组合起来就可以叫作双向最大匹配法。

明天我们继续分析百度关键词是怎么分词的