中国企业做网站SEO主要看重百度排名,而网站关键词质量的好坏是影响百度排名的重要因素,如果你对百度搜索引擎分词技术有一定理解,那么对你做有关提升关键词排名的工作将会变得简单得多。作者:高辉,seo网站优化师,网站建设高手,sem运营高手,电话18107340881【同微信】http://
分词技术:什么是分词, 如何分词搜索引擎会承认,这是一位朋友提的问题,想必大家也听说过,很好奇,什么是分词技术,什么又是百度分词呢?分词大家容易理解。就是一段词用字符分开,比如标点符号,空格等。
那什么叫分词技术呢?分词技术就是SEO针对用户提交查询的关键串进行的查询处理后根据用户的关键词串用各种匹配方法进行的一种技术。大家好好理解。那么我们要理解分词技术先要理解一个概念。那就是查询处理,当用户向搜索引擎提交查询后,搜索引擎接收到用户的信息要做一系列的处理。
首先是到数据库里面索引相关的信息,这就是查询处理,那么查询处理又是如何工作的呢?很简单,把用户提交的字符串没有超过3个的中文字,就会直接到数据库索引词汇。超过4个中文字的,首先用分隔符比如空格,标点符号,将查询串分割成若干子查询串。举个例子。“什么是百度分词技术” 我们就会把这个词分割成“ 什么是,百度,分词技术。”这种分词方法叫做反向匹配法。
然后再看用户提供的这个词有没有重复词汇。如果有的话,会丢弃掉,默认为一个词汇。接下来检查用户提交的字符串,有没有字母和数字。如果有的话,就把字母和数字认为一个词。好了,这就是SEO的查询处理。
讲了查询处理后,大家对分词技术,尤其是中文分词技术有了一个基本的了解。其实我讲的都是搜索引擎的原理。好了,我接下来讲分词的原理。我们用百度来举例,百度是如何来分词的呢?分词技术现今非常成熟了。他分为3种技术。
1.字符串匹配的分词方法
2.词义分词法。
3.统计分词法。
一、字符串匹配的分词方法(分三种)
1.正向最大匹配法
什么意思呢?就是把一个词从左至右来分词。举个例子,“不知道你在说什么”这句话采用正向最大匹配法是如何分的呢?“不知道,你,在,说什么”与正向最大匹配法相对应的是反向最大匹配发。这是第二种分词方法。
2.反向最大匹配法
上面我举的例子是如何分的呢 "不知道你在说什么"。反向最大匹配法来分上面这段是如何分的。“不,知道,你在,说,什么”,这个就分的比较多了,反向最大匹配法就是从右至左。
3.就是最短路径分词法
这个怎么理解呢 ,就是说我一段话里面要求切出的词数是最少的。还是上面那句话“不知道你在说什么”最短路径分词法网站开发就是指,我把上面那句话分成的词要是最少的。不知道,你在,说什么,这就是最短路径分词法,分出来就只有3个词了 。好了,当然还有上面三种可以相互结合组成一些分词方法。比如正向最大匹配法和反向最大匹配法组合起来就可以叫做双向最大匹配法。
二、词义分词法
这种其实就是一种机器语音判断的分词方法。很简单,进行句法、语义分析,利用网站优化句法信息和语义信息来处理歧义现象来分词,这种分词方法,现在还不成熟。处在测试阶段。
三、统计的分词方法
这个很简单,就是根据词组的统计,就会发现两个相邻的字出现的频率最多,那么这个词就很重要。就可以作为用户提供字符串中的分隔符。这样来分词。比如,“我的,你的,许多的,这里,哪里,那里”。等等,这些词出现的比较多,就从这些词里面分开来。来源:http://,北京网站建设,网站建设公司,企业网站优化,营销网站设计,网站建设,北京网站建设公司,北京网站优化,北京网站优化公司
猜你喜欢
联络方式:
电话:181-0734-0881
邮箱:1713521713@qq.com
-
域名知多少,浅析域名
一、域名的含义域名是Internet网络上的一个服务器或一个网络系统的名字,在全世界,没有重复的域名。域名的形式是以若干个英文字母和数字组成,由"."分隔成几部分,如baidu.com就是...
-
百度惊雷算法首推,快排行业将退出SEO江湖
近几年,百度在保障用户体验提升内容生态良性发展方面下了很多功夫,从打击外链、采集、站群、页面友好度等方面都经过了多次的算法调整,例如:青藤算法、绿萝算法、飓风算法、清风...
-
线上营销线下消费 小程序开启流量争夺战
不知不觉,小程序也已上线一周年了,小程序的出现为创业者们打开了一个新的程序入口,仅仅一年的时间,小程序已经涵盖了衣食住行各个方面。甚至支付宝、美团、滴滴、京东,还有三大运...
-
网站如何选择合适的关键词
对于网站SEO,选好关键词是搜索引擎营销至关重要的一步,选对关键词能让网站权重快速提高,今天我就教大家如何选择网站SEO关键词。...
-
网站关键词排名大量下滑到底有哪些因素
客观原因:影响排名的因素很多,有主观也有一些是人力无法控制的客观原因,而我们常见的客观原因包括二点:...