關(guān)于遨游建站優(yōu)勢行業(yè)動態(tài)網(wǎng)站開發(fā)流程網(wǎng)站樣板網(wǎng)站功能與價格網(wǎng)站建設(shè)方案與報價手機(jī)網(wǎng)站設(shè)計網(wǎng)站改版升級響應(yīng)式網(wǎng)站開發(fā)營銷型網(wǎng)站開發(fā)集團(tuán)型網(wǎng)站設(shè)計自適應(yīng)網(wǎng)站設(shè)計手機(jī)網(wǎng)站建設(shè)問題網(wǎng)站改版升級問題微信網(wǎng)站開發(fā)外貿(mào)網(wǎng)站開發(fā)保姆網(wǎng)站開發(fā)網(wǎng)站建設(shè)知識案例展示商城樣板商城功能購物網(wǎng)站制作小程序樣板小程序功能小程序設(shè)計百度搜索推廣谷歌搜索(MCC/GMC賬戶)推廣360搜索推廣搜狗搜索推廣神馬搜索推廣搜索引擎廣告微信(ADQ/視頻號微信豆)廣告今日頭條推廣新浪扶翼廣告UC頭條推廣一點(diǎn)資訊推廣搜狐匯算推廣網(wǎng)易推廣移動信息流廣告抖音(巨量AD/CID廣告)快手(磁力金牛)愛奇藝廣告優(yōu)酷廣告視頻營銷平臺小紅書(聚光/蒲公英種草)知乎營銷推廣陌陌廣告社交自媒體網(wǎng)站托管費(fèi)用網(wǎng)站托管協(xié)議域名備案域名回收企業(yè)郵箱互動營銷活動SSL證書數(shù)據(jù)恢復(fù)關(guān)鍵詞快速排名地圖標(biāo)注創(chuàng)意設(shè)計企業(yè)百家號認(rèn)證企業(yè)抖音號藍(lán)V認(rèn)證網(wǎng)站建設(shè)問題企業(yè)網(wǎng)站建設(shè)公司網(wǎng)站制作企業(yè)網(wǎng)站設(shè)計企業(yè)建網(wǎng)站企業(yè)網(wǎng)站優(yōu)化建站技術(shù)域名知識SEO學(xué)院SEO課程SEO工具

百度搜索引擎工作原理

 二維碼 454
發(fā)表時間:2015-12-23 20:07作者:敖游來源:遨游建站網(wǎng)址:http://www.ibainong.com

  1, 重復(fù)內(nèi)容的網(wǎng)頁:互聯(lián)網(wǎng)上已有的內(nèi)容,百度必然沒有必要再收錄。

  2, 主體內(nèi)容空短的網(wǎng)頁

  1)有些內(nèi)容使用了百度spider無法解析的技術(shù),如JS、AJAX等,雖然用戶訪問能看到豐富的內(nèi)容,依然會被搜索引擎拋棄

  2)加載速度過慢的網(wǎng)頁,也有可能被當(dāng)作空短頁面處理,注意廣告加載時間算在網(wǎng)頁整體加載時間內(nèi)。

  3)很多主體不突出的網(wǎng)頁即使被抓取回來也會在這個環(huán)節(jié)被拋棄。

  3, 部分作弊網(wǎng)頁

  第二節(jié)-檢索排序

  搜索引擎索引系統(tǒng)概述

  眾所周知,搜索引擎的主要工作過程包括:抓取、存儲、頁面分析、索引、檢索等幾個主要過程。上一章我們主要介紹了部分抓取存儲環(huán)節(jié)中的內(nèi)容,此章簡要介紹一下索引系統(tǒng)。

  在以億為單位的網(wǎng)頁庫中查找特定的某些關(guān)鍵詞猶如大海里面撈針,也許一定的時間內(nèi)可以完成查找,但是用戶等不起,從用戶體驗(yàn)角度我們必須在毫秒級別給予用戶滿意的結(jié)果,否則用戶只能流失。怎樣才能達(dá)到這種要求呢?

  如果能知道用戶查找的關(guān)鍵詞(query切詞后)都出現(xiàn)在哪些頁面中,那么用戶檢索的處理過程即可以想象為包含了query中切詞后不同部分的頁面集合求交的過程,而檢索即變成了頁面名稱之間的比較、求交。這樣,在毫秒內(nèi)以億為單位的檢索成為了可能。這就是通常所說的倒排索引及求交檢索的過程。如下為建立倒排索引的基本過程:

  

  1,頁面分析的過程實(shí)際上是將原始頁面的不同部分進(jìn)行識別并標(biāo)記,例如:title、keywords、content、link、anchor、評論、其他非重要區(qū)域等等;

  2,分詞的過程實(shí)際上包括了切詞分詞同義詞轉(zhuǎn)換同義詞替換等等,以對某頁面title分詞為例,得到的將是這樣的數(shù)據(jù):term文本、termid、詞類、詞性等等;

  3,之前的準(zhǔn)備工作完成后,接下來即是建立倒排索引,形成{termàdoc},下圖即是索引系統(tǒng)中的倒排索引過程。

  

  倒排索引是搜索引擎實(shí)現(xiàn)毫秒級檢索非常重要的一個環(huán)節(jié),下面我們要重要介紹一下索引系統(tǒng)建立倒排索引的重要過程——入庫寫庫。

  倒排索引的重要過程——入庫寫庫

  索引系統(tǒng)在建立倒排索引的最后還需要有一個入庫寫庫的過程,而為了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,并且對數(shù)據(jù)進(jìn)行壓縮,這涉及到的過于技術(shù)化在此就不多提了。在此簡要給大家介紹一下索引之后的檢索系統(tǒng)。

  檢索系統(tǒng)主要包含了五個部分,如下圖所示:

  

 ?。?)Query串切詞分詞即將用戶的查詢詞進(jìn)行分詞,對之后的查詢做準(zhǔn)備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):

  10 0x123abc

  號 0x13445d

  線 0x234d

  地鐵 0x145cf

  故障 0x354df

 ?。?)查出含每個term的文檔集合,即找出待選集合,如下:

  0x123abc 1 2 3 4 7 9…..

  0x13445d 2 5 8 9 10 11……

  ……

  ……

 ?。?)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實(shí)際上關(guān)系著整個系統(tǒng)的性能,這里面包含了使用緩存等等手段進(jìn)行性能優(yōu)化;

 ?。?)各種過濾,舉例可能包含過濾掉死鏈、重復(fù)數(shù)據(jù)、色情、垃圾結(jié)果以及你懂的;

 ?。?)最終排序,將最能滿足用戶需求的結(jié)果排序在最前,可能包括的有用信息如:網(wǎng)站的整體評價、網(wǎng)頁質(zhì)量、內(nèi)容質(zhì)量、資源質(zhì)量、匹配程度、分散度、時效性等等

  影響搜索結(jié)果排序的因素

  上面的內(nèi)容好象有些深奧,因?yàn)樯婕按罅考夹g(shù)細(xì)節(jié),我們只能說到這兒了。那下面我們說說大家最感興趣的排序問題吧。用戶輸入關(guān)鍵詞進(jìn)行檢索,百度搜索引擎在排序環(huán)節(jié)要做兩方面的事情,第一是把相關(guān)的網(wǎng)頁從索引庫中提取出來,第二是把提取出來的網(wǎng)頁按照不同維度的得分進(jìn)行綜合排序?!安煌S度”包括:

  1,相關(guān)性:網(wǎng)頁內(nèi)容與用戶檢索需求的匹配程度,比如網(wǎng)頁包含的用戶檢查關(guān)鍵詞的個數(shù),以及這些關(guān)鍵詞出現(xiàn)的位置;外部網(wǎng)頁指向該頁面所用的錨文本等

  2,權(quán)威性:用戶喜歡有一定權(quán)威性網(wǎng)站提供的內(nèi)容,相應(yīng)的,百度搜索引擎也更相信優(yōu)質(zhì)權(quán)威站點(diǎn)提供的內(nèi)容。

  3,時效性:時效性結(jié)果指的是新出現(xiàn)的網(wǎng)頁,且網(wǎng)頁內(nèi)承載了新鮮的內(nèi)容。目前時效性結(jié)果在搜索引擎中日趨重要。

  4,重要性:網(wǎng)頁內(nèi)容與用戶檢查需求匹配的重要程度或受歡迎程度

  5,豐富度:豐富度看似簡單卻是一個覆蓋范圍非常廣的命題??梢岳斫鉃榫W(wǎng)頁內(nèi)容豐富,可以完全滿足用戶需求;不僅可以滿足用戶單一需求,還可以滿足用戶的延展需求。

  6,受歡迎程度:指該網(wǎng)頁是不是受歡迎。

  以上便是百度搜索引擎決定搜索結(jié)果排序時考慮的六大原則,那么六大原則的側(cè)重點(diǎn)是怎樣的呢?哪個原則在實(shí)際應(yīng)用時占比最大呢?其實(shí)在這里沒有一個確切的答案。在百度搜索引擎早期,這些閾值的確是相對固定的,比如“相關(guān)性”在整體排序中的重量可以占到七成。但隨著互聯(lián)網(wǎng)的不斷發(fā)展,檢索技術(shù)的進(jìn)步,網(wǎng)頁數(shù)量的爆發(fā)式增長,相關(guān)性已經(jīng)不是難題。于是百度搜索引擎引入了機(jī)器學(xué)習(xí)機(jī)制,讓程序自動產(chǎn)出計算公式,推進(jìn)排序策略更加合理。

  低質(zhì)網(wǎng)頁狙擊策略——石榴算法

  我們理解網(wǎng)站生存發(fā)展需要資金支持,從來不反對網(wǎng)站添加各種合法廣告,不要再問我們“我們網(wǎng)站加了XX聯(lián)盟的廣告會不會被處罰”這類問題。有些站點(diǎn)好不容易在百度有了比較好的排位,卻在頁面上放置大量有損訪問用戶體驗(yàn)的廣告,已經(jīng)嚴(yán)重影響到百度搜索引擎用戶的使用感受。為此,百度質(zhì)量團(tuán)隊2013年5月17日發(fā)布公告:針對低質(zhì)量網(wǎng)頁推出了石榴算法,旨在打擊含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面,尤其是彈出大量低質(zhì)廣告、存在混淆頁面主體內(nèi)容的垃圾廣告的頁面。

  如以下網(wǎng)頁截圖,用戶要花很長時間去尋找真正的下載地址,是百度無法接受容忍的。

  

  百度質(zhì)量團(tuán)隊希望站長能夠多從用戶角度出發(fā),朝著長遠(yuǎn)發(fā)展考慮,在不影響用戶體驗(yàn)的前提下合理地放置廣告,贏得用戶的長期青睞才是一個網(wǎng)站發(fā)展壯大的基礎(chǔ)。

  第三節(jié)-外部投票

  外鏈的作用(2014版)

  曾經(jīng),“內(nèi)容為王超鏈為皇”的說法流行了很多年,通過超鏈計算得分來體現(xiàn)網(wǎng)頁的相關(guān)性和重要性,的確曾經(jīng)是搜索引擎用來評估網(wǎng)頁的重要參考因素之一,會直接參與搜索結(jié)果排序計算。但隨著該技術(shù)被越來越多的SEO人員了解,超鏈已經(jīng)逐漸失去作為投票的重要意義,無論是谷歌還是百度,對超鏈數(shù)據(jù)的依賴程度都越來越低。那么,在現(xiàn)在,超鏈在發(fā)揮著怎樣的作用?

  1, 吸引蜘蛛抓?。弘m然百度在挖掘新好站點(diǎn)方面下了很大工夫,開放了多個數(shù)據(jù)提交入口,開避了社會化發(fā)現(xiàn)渠道,但超鏈依然是發(fā)現(xiàn)收錄鏈接的最重要入口。

  2, 向搜索引擎?zhèn)鬟f相關(guān)性信息:百度除了通過TITLE、頁面關(guān)鍵詞、H標(biāo)簽等對網(wǎng)頁內(nèi)容進(jìn)行判斷外,還會通過錨文本進(jìn)行鋪助判斷。使用圖片作為點(diǎn)擊入口的超鏈,也可以通過alt屬性和title標(biāo)簽向百度傳情達(dá)意。

  3, 提升排名:百度搜索引擎雖然降低了對超鏈的依賴,但對超鏈的識別力度從未下降,制定出更加嚴(yán)格的優(yōu)質(zhì)鏈接、正常鏈接、垃圾鏈接和作弊鏈接標(biāo)準(zhǔn)。對于作弊鏈接,除了對鏈接進(jìn)行過濾清理外,也對鏈接的受益站進(jìn)行一定程度的懲罰。相應(yīng)的,對優(yōu)質(zhì)鏈接,百度依然持歡迎的態(tài)度。

廣告投放問題
網(wǎng)站建設(shè)問題
小程序設(shè)計問題

以信載商,良心建站。遨游始終秉承“一次建站、終身維護(hù)”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團(tuán)型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。

公司:網(wǎng)站建設(shè)_小程序設(shè)計_競價托管代運(yùn)營公司;郵箱:1013601535@qq.com

手機(jī):17073547034;QQ: 1013601535

在線留言咨詢,24小時內(nèi)回復(fù)
我想咨詢
*
企業(yè)名稱
手機(jī)號碼
*
您的姓名
所在城市
提交
最新發(fā)布
注冊體驗(yàn)
企業(yè)郵箱
域名注冊
SSL證書
地圖標(biāo)注
網(wǎng)站備案
服務(wù)器
友情鏈接
我們是中小企業(yè)可信賴的合作伙伴!始終專注一件事,一站式互聯(lián)網(wǎng)信息技術(shù)服務(wù)商
19240102767
全國統(tǒng)一服務(wù)熱線
遨游建站是全國高端網(wǎng)站建設(shè)公司,提供廣州企業(yè)網(wǎng)站建設(shè)/小程序開發(fā)/購物網(wǎng)站設(shè)計制作與競價托管代運(yùn)營服務(wù);秉承“一次建站,終身維護(hù)”的宗旨,有償提供互聯(lián)網(wǎng)技術(shù)支持。
本站部分圖片、音頻、視頻來源于網(wǎng)絡(luò),版權(quán)歸原作者,如有侵權(quán)請聯(lián)系我們刪除。
機(jī)
乌拉特后旗| 东乌珠穆沁旗| 甘孜县| 彭阳县| 成武县| 阿克苏市| 虞城县| 弋阳县| 镇康县| 汝城县| 淮北市| 突泉县| 湘阴县| 衡水市| 湖州市| 庐江县| 芦溪县| 湘乡市| 大田县| 庆元县| 临湘市| 公安县| 改则县| 阿图什市| 通渭县| 崇义县| 乐东| 兰西县| 洪雅县| 曲阳县| 仁布县| 洛川县| 遂川县| 贺州市| 龙胜| 甘肃省| 吉林省| 佛山市| 桂平市| 天等县| 乌鲁木齐市|