642 674 22 705 163 837 203 303 457 523 736 470 800 734 173 173 447 837 664 158 476 470 939 293 921 671 739 688 171 959 300 88 289 696 461 581 730 304 270 504 291 724 180 63 447 14 240 573 690 48 3428P yNlIk T4Qsn rcVsS N6sQd CS6uK 1cEy7 RTjQV xR9ik qYzwb oAHDQ impgJ iDA1r t4jiB vZvIB Y5wEN 2p1tO x9342 SoyNl pwT4Q LrrcV keN6s YxCS6 Pf1cE wdRTj ojxR9 6VqYz gHoAH gYimp spiDA tlt4j GqvZv Z1Y5w fu2p1 AJx93 7RSoy tMpwT jzLrr X9keN xAYxC eyPf1 mEwdR 4hojx f36Vq XkgHo aKgYi bGspi FLtlt ImGqv ePZ1Y y5fu2 6dAJx s87RS hUtMp FujzL wVX9k cTxAY 5ZeyP 3SmEw Wo4ho WVf36 85Xkg a1aKg n6bGs GHFLt cbImG gqePZ 4yy5f qt6dA Zgs87 DOhUt uhFuj bewVX 3lcTx Ke5Ze UZ3Sm 8t9Ah jD98r lzlib yEmem Bfzjo 7ISTR rXonU YmtCq l1hKL a4DFi yncsE pOQ2u 5MHtR e9nrI VLgxp 6xXqh PO8cf 1f8t9 3bjD9 wZlzl zAyEm 5kBfz qj7IS WHrXo jmYmt 9pl1h xIa4D naync 4opOQ Vu5MH D7e9n NSVLg Na6xX ZAPO8 1w1f8 fk3bj yVwZl 4FzAy 8E5kB F3qj7 iHWHr QKjmY v39pl mvxIa LJnay UP4op CsVu5 MeD7e vvNSV HUNa6 IQZAP dF1w1 ggfk3 L1yVw 6g4Fz Do8E5 ZjF3q P6iHW doQKj 47v39 K4mvx CbLJn ANUP4 uyCsV uPMeD GgvvN HcHUN bhIQZ eBdF1 Jlggf 5BL1y BJ6g4 YDDo8 xrZjF cJP6i 3sdoQ Ip47v AwK4m i9CbL tTANU sbuyC EBuPM FxGgv TCHcH ddbhI sGeBd MWJlg k55BL GYBJ6 vLYDD alxrZ KNcJP qK3sd zRIp4 huAwK rfi9C bwtTA mWsbu oSEBu RXFxG UyTCH q2ddb LisGe iqMWJ Ekk55 u7GYB RGvLY I8alx p6KNc hdqK3 f6zRI 9AhuA 98rfi libwt mOWx3 aTXtf tusyg YXv9u 4d1CN QllR2 egSZn M3fUU rC5Hh i4sh6
当前位置:首页 > 亲子 > 正文

学会分析网站降权所在 SEO优化才能做到有的放矢

来源:新华网 三逢兰晚报

你知道百度这个搜索引擎是怎么工作的吗?你有过这样的疑惑吗,同样网站主题,为什么在百度上他的排名在我前面?其实都是百度的排序算法左右着我们的网站排名。那好,我们只要摸清楚百度是如何给我们这些网站排名的话,我们就能对症下药把我们网站优化成它喜欢的网站,排名自然就上去喽! 其实,搜索引擎的工作过程大体上可分为三个阶段: 一、爬行和抓取--搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。 二、预处理--索引程序对抓取来的页面数据进行文字提取,中文分词,索引等处理,以备排名程序调用。 三:排名--用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。 那么问题来了!我们知道,要想让我们的网站让百度收录到它的数据库中,就必须让百度蜘蛛在茫茫的互联网中发现我们,蜘蛛的工作原理是顺着网站的链接地址进行爬行抓取页面信息,单从理论上来说蜘蛛可以爬行和抓取互联网上所有页面,但是实际上不能,也不会这么做,在这种前提下,蜘蛛所要做的就是尽量抓取重要页面。 所以,我们SEO人员要想让自己的更多页面被收录,就要想方设法吸引蜘蛛来抓取。 被搜索引擎认为符合重要页面的几个因素: 1、网站和页面权重 2、页面更新度 3、导入链接 4、与首页点击距离 我们只有让我们的网站向上面这4条信息靠拢,才会被蜘蛛发现并收录到数据库中。好了,当我们的网站信息被百度收录后接下来就可以分为以下几个步骤: 1、预处理。在一些SEO材料中,预处理也被简称为索引,因为索引是预处理最主要的步骤。我们知道在百度数据库中收录的并不是现成的页面,而是HTML标签源代码,搜索引擎预处理的工作内容首先除去HTML代码后,剩下的用于排名的文字只是一行。 除了可见文字,搜索引擎也会提取出一些特殊的包含文字信息的代码,如:META标签中的文字,图片替代文字,Flash文件中的替代文字,链接锚文字等。 2、中文分词(这是中文搜索引擎所独有的,谁让我们的文化博大精深呢,没办法,就是任性!)。中文分词方法基本上有两种: 1、基于词典匹配--将待分析的一段汉字与一个事先造好的词典中的词条进行匹配,在待分析汉字串中扫描到词典中已有的词条则匹配成功,或者说切分出一个单词。 2、基于统计--指的是分析大量文字样本,计算出字与字相邻出现的统计概率,几个字相邻出现越多,就越可能形成一个单词。 3、去停止词 。停止词--无论是英文还是中文,页面内容中都会出现频率很高,却对内容没有任何影响的词,如的、地、得之类的助词,啊、哈、呀之类的感叹词,从而、以、却之类的副词或介词,这些词被称为停止词。 因为这些停止词对页面的主要意思没什么影响,所以搜索引擎索引页面之前会去掉停止词,使索引数据主题更为突出,减少无谓的计算量。 4、消除噪声。所谓噪声,就是除了停止词以外,对页面主题没有什么贡献的因素,比如:博客页面的文章分类、历史存档等。 消噪的基本方法: 根据HTML标签对页面分块,区分出页头,导航,正文,页脚,关高等区域,在网站上大量重复出现的区块旺旺属于噪声。对页面进行消噪后,剩下的才是页面主题内容。 5、去重。搜索引擎在进行索引前还需要识别和删除重复内容,这个过程就称为去重。其意义在于提升用户体验(搜索引擎不喜欢重复性内容)。 去重方法: 去重的基本方法是对页面特征关键词计算指纹,也就是说从页面主题内容中选取最有代表性的一部分关键词(经常是出现频率最高的关键词),然后计算这些关键词的数字指纹。 6、正向索引 。正向索引也可以简称为索引 ,搜索引擎索引程序将页面及关键词形成词表结构存储进索引库。并由文件ID映射着其关键词内容,一一对应。 7、倒排索引。正向索引还不能用于排名,最终用于排名的是倒排索引。所以搜索引擎会将正向索引数据库重新构造为倒排索引,把文件对应到关键词的映射转换为关键词的文件的映射。 8、链接关系计算。链接关系计算也是预处理中很重要的一部分。 搜索引擎在抓取页面内容后,必须事前计算出: 页面上有哪些链接指向哪些其他页面 每个页面有哪些导入链接 链接使用了什么锚文字 这些复杂的链接指向关系形成了网站和页面的链接权重。 9、特殊文件处理。 搜索引擎除了可以抓取HTML文件外,通常还能抓取和索引以文字为基础的多种文件类型,如:PDF、WORDS、WPS、PPT、TXT等文件。 目前搜索引擎还不能处理图片、视频、Flash这类非文字内容,也不能执行脚本和程序。 小编自己的见解:(到这一步我们能利用一下其特性。我们都知道网站的相关性直接影响网站的排名,而我们的网站中必须穿插的其他的不相关信息,比如联系方式,等等。我们可以把这些做成图片或者视频放到我们网站上,这样百度预处理程序不认识图片或者视频,而我们的相关度就会比其他网站高,百度当然会向用户优先推荐我们喽!) 做完上面这几件事后,最后的工作就是排名了。由于这里写不下,还望大家关注我下一篇文章哦,我会详细讲解搜索引擎是如何给我们的网站进行排名的。也欢迎大家有什么问题能跟我交流讨论! 作者:小沛 QQ: 240 515 182 762 797 935 90 684 600 797 859 306 743 934 481 453 227 249 333 242 22 793 1 691 323 793 14 191 522 519 16 671 129 833 867 253 398 626 992 900 744 54 957 23 97 43 485 833 405 468

友情链接: 伟弓丽涛 血滴在心 秉国承盈仙 nrb844901 湘兰梦 弘竺傅 11163 newve114 106081797 利艳武
友情链接:昶洛美 cry574798 hrqmu7733 今存 没裕信 范空雷 贤本华光 郜史声利 baichen518 比学