關(guān)于遨游建站優(yōu)勢(shì)行業(yè)動(dòng)態(tài)網(wǎng)站開(kāi)發(fā)流程網(wǎng)站樣板網(wǎng)站功能與價(jià)格網(wǎng)站建設(shè)方案與報(bào)價(jià)手機(jī)網(wǎng)站設(shè)計(jì)網(wǎng)站改版升級(jí)響應(yīng)式網(wǎng)站開(kāi)發(fā)營(yíng)銷(xiāo)型網(wǎng)站開(kāi)發(fā)集團(tuán)型網(wǎng)站設(shè)計(jì)自適應(yīng)網(wǎng)站設(shè)計(jì)手機(jī)網(wǎng)站建設(shè)問(wèn)題網(wǎng)站改版升級(jí)問(wèn)題微信網(wǎng)站開(kāi)發(fā)外貿(mào)網(wǎng)站開(kāi)發(fā)保姆網(wǎng)站開(kāi)發(fā)網(wǎng)站建設(shè)知識(shí)案例展示商城樣板商城功能購(gòu)物網(wǎng)站制作小程序樣板小程序功能小程序設(shè)計(jì)百度搜索推廣谷歌搜索(MCC/GMC賬戶)推廣360搜索推廣搜狗搜索推廣神馬搜索推廣搜索引擎廣告微信(ADQ/視頻號(hào)微信豆)廣告今日頭條推廣新浪扶翼廣告UC頭條推廣一點(diǎn)資訊推廣搜狐匯算推廣網(wǎng)易推廣移動(dòng)信息流廣告抖音(巨量AD/CID廣告)快手(磁力金牛)愛(ài)奇藝廣告優(yōu)酷廣告視頻營(yíng)銷(xiāo)平臺(tái)小紅書(shū)(聚光/蒲公英種草)知乎營(yíng)銷(xiāo)推廣陌陌廣告社交自媒體網(wǎng)站托管費(fèi)用網(wǎng)站托管協(xié)議域名備案域名回收企業(yè)郵箱互動(dòng)營(yíng)銷(xiāo)活動(dòng)SSL證書(shū)數(shù)據(jù)恢復(fù)關(guān)鍵詞快速排名地圖標(biāo)注創(chuàng)意設(shè)計(jì)企業(yè)百家號(hào)認(rèn)證企業(yè)抖音號(hào)藍(lán)V認(rèn)證網(wǎng)站建設(shè)問(wèn)題企業(yè)網(wǎng)站建設(shè)公司網(wǎng)站制作企業(yè)網(wǎng)站設(shè)計(jì)企業(yè)建網(wǎng)站企業(yè)網(wǎng)站優(yōu)化建站技術(shù)域名知識(shí)SEO學(xué)院SEO課程SEO工具

解讀搜索引擎原理

 二維碼 618
發(fā)表時(shí)間:2019-03-20 16:08作者:敖游來(lái)源:遨游建站網(wǎng)址:http://www.ibainong.com

四、集成搜索引擎


集成搜索引擎(All-in-One Search Page)亦稱(chēng)為“多引擎同步檢索系統(tǒng) ”,是在一個(gè)WWW頁(yè)面上鏈接若干種獨(dú)立的搜索引擎,檢索時(shí)需點(diǎn)選或指定搜索引擎,一次檢索輸入,多引擎同時(shí)搜索,用起來(lái)相當(dāng)方便。

集成搜索引擎無(wú)自建數(shù)據(jù)庫(kù),不需研發(fā)支持技術(shù),當(dāng)然也不能控制和優(yōu)化檢索結(jié)果。但集成搜索引擎制作與維護(hù)技術(shù)簡(jiǎn)單,可隨時(shí)對(duì)所鏈接的搜索引擎進(jìn)行增刪調(diào)整和及時(shí)更新,尤其大規(guī)模專(zhuān)業(yè)(如FLASH、MP3等)搜索引擎集成鏈接,深受特定用戶群歡迎。

集成搜索引擎是通過(guò)網(wǎng)絡(luò)技術(shù),在一個(gè)網(wǎng)頁(yè)上鏈接很多個(gè)獨(dú)立搜索引擎,查詢時(shí),點(diǎn)選或指定搜索引擎,一次輸入,多個(gè)搜索引擎同時(shí)查詢,搜索結(jié)果由各搜索引擎分別以不同頁(yè)面顯示。

任何搜索引擎的設(shè)計(jì),均有其特定的數(shù)據(jù)庫(kù)索引范圍、獨(dú)特的功能和使用方法,以及預(yù)期的用戶群指向。一種搜索引擎不可能滿足所有人或一個(gè)人所有的檢索需求。在某些情況下,如文獻(xiàn)普查、專(zhuān)題查詢、新聞?wù){(diào)查與溯源、軟件及MP3下載地址搜索等等,人們往往需要使用多種搜索引擎,對(duì)搜索結(jié)果進(jìn)行比較、篩選和相互印證。為解決逐一登陸各搜索引擎,并在各搜索引擎中分別多次輸入同一檢索請(qǐng)求(檢索字串)等煩瑣操作,集成搜索引擎和元搜索引擎應(yīng)運(yùn)而生。

集成搜索引擎起源

因特網(wǎng)上沖浪,你也許有這種痛苦經(jīng)歷:利用搜索引擎進(jìn)行網(wǎng)頁(yè)搜索時(shí),在第一個(gè)搜索引擎中沒(méi)有找到滿意的結(jié)果,于是在第二、第三……個(gè)搜索引擎間奔波,為找到滿意的結(jié)果而費(fèi)時(shí)費(fèi)力。其實(shí),在因特網(wǎng)上已有不少聰明人開(kāi)發(fā)出了一種Metasearch技術(shù),即集成搜索,也叫索引搜索,來(lái)幫助上網(wǎng)者快速、全面、準(zhǔn)確地搜索到自己確實(shí)需要的網(wǎng)頁(yè)。這種技術(shù)的特點(diǎn)是:這些網(wǎng)站上集成了許多搜索引擎,你輸入一個(gè)查詢要求,它會(huì)將其適當(dāng)格式化后提交給許多搜索引擎進(jìn)行搜索,然后將返回的搜索結(jié)果進(jìn)行整理、合并、集成為一個(gè)頁(yè)面,或一份報(bào)告,內(nèi)容就是你要的搜索結(jié)果。

集成搜索引擎優(yōu)點(diǎn)

集成搜索引擎的優(yōu)點(diǎn)是明顯的:首先,它在一個(gè)網(wǎng)站上同時(shí)搜索許多搜索引擎,最終返回的結(jié)果被進(jìn)行了適當(dāng)?shù)恼?,刪除了一些不適合和重復(fù)的網(wǎng)頁(yè),從而大大地節(jié)省你的時(shí)間、金錢(qián)和精力,使搜索變得更有效率;其次,它使你的搜索結(jié)果更為全面、準(zhǔn)確,也更容易找到符合你需要的結(jié)果。


搜索引擎工作狀態(tài).jpg


搜索引擎的發(fā)展趨勢(shì)


一個(gè)好的搜索引擎,不僅數(shù)據(jù)庫(kù)容量要大,更新頻率、檢索速度要快,支持對(duì)多語(yǔ)言的搜索,而且隨著數(shù)據(jù)庫(kù)容量的不斷膨脹,還要能從龐大的資料庫(kù)中精確地找到正確的資料。

1、提高搜索引擎對(duì)用戶檢索提問(wèn)的理解。

為了提高搜索引擎對(duì)用戶檢索提問(wèn)的理解,就必須有一個(gè)好的檢索提問(wèn)語(yǔ)言。為了克服關(guān)鍵詞檢索和目錄查詢的缺點(diǎn),現(xiàn)在已經(jīng)出現(xiàn)了自然語(yǔ)言智能答詢。用戶可以輸入簡(jiǎn)單的疑問(wèn)句,比如“如何能殺死計(jì)算機(jī)中的病毒”,搜索引擎在對(duì)提問(wèn)進(jìn)行結(jié)構(gòu)和內(nèi)容的分析之后,或直接給出提問(wèn)的答案,或引導(dǎo)用戶從幾個(gè)可選擇的問(wèn)題中進(jìn)行再選擇。自然語(yǔ)言的優(yōu)勢(shì)在于,一是使網(wǎng)絡(luò)交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來(lái)講,如果用關(guān)鍵詞查詢,多半人會(huì)用“病毒”這個(gè)詞來(lái)檢索,結(jié)果中必然會(huì)包括各類(lèi)病毒的介紹,病毒是怎樣產(chǎn)生的等等許多無(wú)用信息,而用“如何能殺死計(jì)算機(jī)中的病毒”檢索,搜索引擎會(huì)將怎樣殺死病毒的信息提供給用戶,提高了檢索效率。

2、垂直主題搜索引擎有著極大的發(fā)展空間。

網(wǎng)上的信息浩如煙海,網(wǎng)絡(luò)資源以驚人的速度增長(zhǎng),一個(gè)搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各主題都做得精確而又專(zhuān)業(yè),使得檢索結(jié)果垃圾太多。這樣以來(lái),垂直主題的搜索引擎以其高度的目標(biāo)化和專(zhuān)業(yè)化在各類(lèi)搜索引擎中占據(jù)了一席之地。目前,一些主要的搜索引擎,都提供了新聞、Mp3、圖片、Flash等的搜索,加強(qiáng)了檢索的針對(duì)性。

3、元搜索引擎,能夠提供全面且較為準(zhǔn)確的查詢結(jié)果。

現(xiàn)在的許多搜索引擎,其收集信息的范圍、索引方法、排名規(guī)則等都各不相同,每個(gè)搜索引擎平均只能涉及到整個(gè)Web資源的30-50%,這樣導(dǎo)致同一個(gè)搜索請(qǐng)求在不同搜索引擎中獲得的查詢結(jié)果的重復(fù)率不足34%,而每一個(gè)搜索引擎的查準(zhǔn)率不到45%。元搜索引擎(META Search Engine)是將用戶提交的檢索請(qǐng)求發(fā)送到多個(gè)獨(dú)立的搜索引擎上去搜索,并將檢索結(jié)果集中統(tǒng)一處理,以統(tǒng)一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱(chēng)。它的主要精力放在提高搜索速度、智能化處理搜索結(jié)果、個(gè)性化搜索功能的設(shè)置和用戶檢索界面的友好性上,查全率和查準(zhǔn)率都比較高。


主要的搜索引擎介紹


這里介紹的是在國(guó)內(nèi)外影響比較大的主要的一些搜索引擎和分類(lèi)目錄站點(diǎn),由于現(xiàn)在的站點(diǎn)一般都同時(shí)提供全文搜索和分類(lèi)目錄兩種服務(wù),所以我們按照其自有的技術(shù)進(jìn)行分類(lèi)和介紹。

1、主要的全文搜索引擎

  • Google(http://www.google.com/)。Google成立于1997年,幾年間迅速發(fā)展成為世界范圍內(nèi)規(guī)模最大的搜索引擎。Google數(shù)據(jù)庫(kù)現(xiàn)存有42.8億個(gè)Web文件,每天處理的搜索請(qǐng)求已達(dá)2億次,而且這一數(shù)字還在不斷增長(zhǎng)。Google借用Dmoz(http://dmoz.org/)的分類(lèi)目錄提供“網(wǎng)頁(yè)目錄”查詢(http://www.google.com/dirhp?hl=zh-CN&tab=wd&ie=UTF-8&oe=UTF-8&q=),但默認(rèn)網(wǎng)站排列順序并非按照字母順序,而是根據(jù)網(wǎng)站PageRank的分值高低排列。

  • 百度(http://www.baidu.com/)。百度是國(guó)內(nèi)最早的商業(yè)化(早期為其它門(mén)戶網(wǎng)站提供搜索服務(wù),現(xiàn)在的競(jìng)價(jià)排名更是日進(jìn)斗金)全文搜索引擎,擁有自己的網(wǎng)絡(luò)機(jī)器人和索引數(shù)據(jù)庫(kù),專(zhuān)注于中文的搜索引擎市場(chǎng),除有網(wǎng)頁(yè)搜索外,百度還有新聞、MP3、圖片等搜索,并在2003年底推出“貼吧”、按地域搜索等功能。

  • 中國(guó)搜索(http://www.huicong.com/)。中國(guó)搜索的前身是慧聰搜索,原慧聰搜索在聯(lián)合中國(guó)網(wǎng)等30多家知名網(wǎng)站的基礎(chǔ)上,2002年9月25日,正式組建了中國(guó)搜索聯(lián)盟,經(jīng)過(guò)一年多的發(fā)展,聯(lián)盟成員就已達(dá)630多家,成為中國(guó)互聯(lián)網(wǎng)一支重要的力量。由于發(fā)展迅速,慧聰集團(tuán)借上市之機(jī),將慧聰搜索更名為中國(guó)搜索,全力發(fā)展其在搜索引擎方面的業(yè)務(wù),以打造中文搜索領(lǐng)域的全新品牌。

2、主要分類(lèi)目錄

  • 雅虎中國(guó)分類(lèi)目錄(http://cn.yahoo.com/)。雅虎中國(guó)的分類(lèi)目錄是最早的分類(lèi)目錄,現(xiàn)有14個(gè)主類(lèi)目,包括“商業(yè)與經(jīng)濟(jì)”、“藝術(shù)與人文”等,可以逐層進(jìn)入進(jìn)行檢索,也可以利用關(guān)鍵詞對(duì)“分類(lèi)網(wǎng)站”進(jìn)行搜索(http://m6.search.cnb.yahoo.com/dirsrch/)。此外,雅虎中國(guó)也可以對(duì)“所有網(wǎng)站”進(jìn)行關(guān)鍵詞搜索(http://cn.search.yahoo.com/websrch/),早期,他的搜索結(jié)果使用Google的數(shù)據(jù),2004年2月正式推出自己的全文搜索引擎,并結(jié)束了與Google的合作。

  • 新浪分類(lèi)目錄(http://dir.sina.com.cn/)。新浪的分類(lèi)目錄目前共有18個(gè)大類(lèi)目,用戶可按目錄逐級(jí)向下瀏覽,直到找到所需網(wǎng)站。就好像用戶到圖書(shū)館找書(shū)一樣,按照類(lèi)別大小,層層查找,最終找到需要的網(wǎng)站或內(nèi)容。通過(guò)和其它全文搜索引擎的合作,現(xiàn)在,也可以使用關(guān)鍵詞對(duì)新浪的“分類(lèi)網(wǎng)站”或“全部網(wǎng)站”進(jìn)行搜索。

  • 搜狐分類(lèi)目錄(http://dir.sohu.com/)。搜狐分類(lèi)目錄把網(wǎng)站作為收錄對(duì)象,具體的方法就是將每個(gè)網(wǎng)站首頁(yè)的URL地址提供給搜索用戶,并且將網(wǎng)站的題名和整個(gè)網(wǎng)站的內(nèi)容簡(jiǎn)單描述一下,但是并不揭示網(wǎng)站中每個(gè)網(wǎng)頁(yè)的信息內(nèi)容。除此之外,也可以使用關(guān)鍵詞對(duì)搜狐的“分類(lèi)目錄”或所有網(wǎng)站進(jìn)行搜索。

  • 網(wǎng)易分類(lèi)目錄(http://search.163.com/)。網(wǎng)易的分類(lèi)目錄采用“開(kāi)放式目錄”管理方式,在功能齊全的分布式編輯和管理系統(tǒng)的支持下,現(xiàn)有5000多位各界專(zhuān)業(yè)人士參與可瀏覽分類(lèi)目錄的編輯工作,極大地適應(yīng)了互聯(lián)網(wǎng)信息爆炸式增長(zhǎng)的趨勢(shì)。在加強(qiáng)與其它搜索引擎合作的基礎(chǔ)上,新版搜索引擎支持使用關(guān)鍵詞對(duì)所有網(wǎng)站進(jìn)行檢索。


百度搜索引擎工作方式


我所知道的百度搜索:由于工作的關(guān)系,小生有幸一直在使用百度的百事通企業(yè)搜索引擎(該部門(mén)現(xiàn)已被裁員,主要是百度的戰(zhàn)略開(kāi)始向谷歌靠攏,不再單獨(dú)銷(xiāo)售搜索引擎,轉(zhuǎn)向搜索服務(wù)),據(jù)百度的銷(xiāo)售人員稱(chēng),百事通的搜索核心和大搜索的相同,只有可能版本稍低,因此我有理由相信搜索的工作方式大同小異。下面是一些簡(jiǎn)單介紹和注意點(diǎn):

1、關(guān)于網(wǎng)站搜索的更新頻率

百度搜索可以設(shè)定網(wǎng)站的更新頻率和時(shí)間,一般對(duì)于大網(wǎng)站更新頻度很快,而且會(huì)專(zhuān)門(mén)開(kāi)設(shè)獨(dú)立的爬蟲(chóng)進(jìn)行跟蹤,不過(guò)百度是比較勤奮的,中小網(wǎng)站一般也會(huì)每天更新。因此,如果你希望自己的網(wǎng)站更新得更快,最好是在大型的分類(lèi)目錄(例如yahoosina網(wǎng)易)中有你的鏈接,或者在百度自己的相關(guān)網(wǎng)站中,有你網(wǎng)站的超鏈接,在或者你的網(wǎng)站就在一些大型網(wǎng)站里面,例如大型網(wǎng)站的blog。

2、關(guān)于采集的深度

百度搜索可以定義采集的深度,就是說(shuō)不見(jiàn)得百度會(huì)檢索你網(wǎng)站的全部?jī)?nèi)容,有可能只索引你的網(wǎng)站的首頁(yè)的內(nèi)容,尤其對(duì)小型網(wǎng)站來(lái)說(shuō)。

3、關(guān)于對(duì)時(shí)常不通網(wǎng)站的采集

百度對(duì)于網(wǎng)站的通斷是有專(zhuān)門(mén)的判斷的,如果一旦發(fā)現(xiàn)某個(gè)網(wǎng)站不通,尤其是一些中小網(wǎng)站,百度的自動(dòng)停止往這些網(wǎng)站派出爬蟲(chóng),所以選擇好的服務(wù)器,保持網(wǎng)站24小時(shí)暢通非常重要。

4、關(guān)于更換IP的網(wǎng)站

百度搜索能夠基于域名或者ip地址,如果是域名,會(huì)自動(dòng)解析為對(duì)應(yīng)的ip地址,因此就會(huì)出現(xiàn)2個(gè)問(wèn)題,第一就是如果你的網(wǎng)站和別人使用相同的IP地址,如果別人的網(wǎng)站被百度懲罰了,你的網(wǎng)站會(huì)受到牽連,第二就是如果你更換了ip地址,百度會(huì)發(fā)現(xiàn)你的域名和先前的ip地址沒(méi)有對(duì)應(yīng),也會(huì)拒絕往你的網(wǎng)站派出爬蟲(chóng)。因此建議,不要隨意更換ip地址,如果有可能盡量獨(dú)享ip,保持網(wǎng)站的穩(wěn)定很重要。

5、關(guān)于靜態(tài)和動(dòng)態(tài)網(wǎng)站的采集

很多人擔(dān)心是不是類(lèi)似asp?id=之類(lèi)的頁(yè)面很難被收集,html這樣的頁(yè)面容易被收集,事實(shí)上情況并沒(méi)有想的這么糟,現(xiàn)在的搜索引擎大部分都支持動(dòng)態(tài)網(wǎng)站的采集和檢索,包括需要登陸的網(wǎng)站都可以檢索到,因此大可不必?fù)?dān)心自己的動(dòng)態(tài)網(wǎng)站搜索引擎無(wú)法識(shí)別,百度搜索中對(duì)于動(dòng)態(tài)的支持可以自定義。但是,如果有可能,還是盡量生成靜態(tài)頁(yè)面。同時(shí),對(duì)于大部分搜索引擎,依然對(duì)腳本跳轉(zhuǎn)(JS)、框架(frame)、

Flash超鏈接,動(dòng)態(tài)頁(yè)面中含有非法字符的頁(yè)面無(wú)可奈何。

6、關(guān)于索引的消失

前面講過(guò),搜索的索引需要?jiǎng)?chuàng)建,一般好的搜索,索引都是文本文件,而不是數(shù)據(jù)庫(kù),因此索引中需要?jiǎng)h除一條記錄,并不是一件方便的事情。例如百度,需要使用專(zhuān)門(mén)的工具,人工刪除某條索引記錄。據(jù)百度員工稱(chēng),百度專(zhuān)門(mén)有一群人負(fù)責(zé)這件事情——接到投訴,刪除記錄,手工。當(dāng)然還能直接刪除某個(gè)規(guī)則下的所有索引,也就是可以刪除某個(gè)網(wǎng)站下的所有索引。還有一個(gè)機(jī)制(未經(jīng)驗(yàn)證),就是對(duì)于過(guò)期的網(wǎng)頁(yè)和作弊的網(wǎng)頁(yè)(主要是網(wǎng)頁(yè)標(biāo)題、關(guān)鍵詞和內(nèi)容不匹配),在重建索引的過(guò)程中也會(huì)被刪除。

7、關(guān)于去重

百度搜索的去重不如谷歌的理想,主要還是判別文章的標(biāo)題和來(lái)源地址,只要不相同,就不會(huì)自動(dòng)去重,因此不必?fù)?dān)心采集的內(nèi)容雷同而很快被搜索懲罰,谷歌的有所不同,標(biāo)題相同的被同時(shí)收錄的不多。

補(bǔ)充一句,不要把搜索引擎想得這么智能,基本上都是按照一定的規(guī)則和公式,想不被搜索引擎懲罰,避開(kāi)這些規(guī)則即可。


谷歌搜索排名技術(shù)


對(duì)于搜索來(lái)說(shuō),谷歌強(qiáng)于百度,主要的原因就是谷歌更加公正,而百度有很多人為的因素,google之所以公正,源于他的排名技術(shù)PageRank。

很多人知道PageRank,是網(wǎng)站的質(zhì)量等級(jí),越小表示網(wǎng)站越優(yōu)秀。其實(shí)PageRank是依靠一個(gè)專(zhuān)門(mén)的公式計(jì)算出來(lái)的,當(dāng)我們?cè)趃oogle搜索關(guān)鍵詞的時(shí)候,頁(yè)面等級(jí)小的網(wǎng)頁(yè)排序會(huì)越靠前,這個(gè)公式并沒(méi)有人工干預(yù),因此公正。

PageRank的最初想法來(lái)自于論文檔案的管理,我們知道每篇論文結(jié)尾都有參考文獻(xiàn),假如某篇文章被不同論文引用了多次,就可以認(rèn)為這篇文章是篇優(yōu)秀的文章。

同理,簡(jiǎn)單的說(shuō),PageRank能夠?qū)W(wǎng)頁(yè)的重要性做出客觀的評(píng)價(jià)。PageRank 并不計(jì)算直接鏈接的數(shù)量,而是將從網(wǎng)頁(yè) A 指向網(wǎng)頁(yè) B 的鏈接解釋為由網(wǎng)頁(yè) A對(duì)網(wǎng)頁(yè) B 所投的一票。這樣,PageRank 會(huì)根據(jù)網(wǎng)頁(yè) B 所收到的投票數(shù)量來(lái)評(píng)估該頁(yè)的重要性。此外,PageRank還會(huì)評(píng)估每個(gè)投票網(wǎng)頁(yè)的重要性,因?yàn)槟承┚W(wǎng)頁(yè)的投票被認(rèn)為具有較高的價(jià)值,這樣,它所鏈接的網(wǎng)頁(yè)就能獲得較高的價(jià)值。

Page Rank的公式這里省略,說(shuō)說(shuō)影響Page Rank的主要因素

1、指向你的網(wǎng)站的超鏈接數(shù)量(你的網(wǎng)站被別人引用),這個(gè)數(shù)值越大,表示你的網(wǎng)站越重要,通俗的說(shuō),就是其它網(wǎng)站是否友情鏈接,或者推薦鏈接到你的網(wǎng)站;

2、超鏈接你的網(wǎng)站的重要程度,意思就是一個(gè)質(zhì)量好的網(wǎng)站有你的網(wǎng)站的超鏈接,說(shuō)明你的網(wǎng)站也很優(yōu)秀。

3、網(wǎng)頁(yè)特定性因素:包括網(wǎng)頁(yè)的內(nèi)容、標(biāo)題及URL等,也就是網(wǎng)頁(yè)的關(guān)鍵詞及位置。


搜索引擎的發(fā)展趨勢(shì)


一個(gè)好的搜索引擎,不僅數(shù)據(jù)庫(kù)容量要大,更新頻率、檢索速度要快,支持對(duì)多語(yǔ)言的搜索,而且隨著數(shù)據(jù)庫(kù)容量的不斷膨脹,還要能從龐大的資料庫(kù)中精確地找到正確的資料。

1、提高搜索引擎對(duì)用戶檢索提問(wèn)的理解。

為了提高搜索引擎對(duì)用戶檢索提問(wèn)的理解,就必須有一個(gè)好的檢索提問(wèn)語(yǔ)言。為了克服關(guān)鍵詞檢索和目錄查詢的缺點(diǎn),現(xiàn)在已經(jīng)出現(xiàn)了自然語(yǔ)言智能答詢。用戶可以輸入簡(jiǎn)單的疑問(wèn)句,比如“如何能殺死計(jì)算機(jī)中的病毒”,搜索引擎在對(duì)提問(wèn)進(jìn)行結(jié)構(gòu)和內(nèi)容的分析之后,或直接給出提問(wèn)的答案,或引導(dǎo)用戶從幾個(gè)可選擇的問(wèn)題中進(jìn)行再選擇。自然語(yǔ)言的優(yōu)勢(shì)在于,一是使網(wǎng)絡(luò)交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來(lái)講,如果用關(guān)鍵詞查詢,多半人會(huì)用“病毒”這個(gè)詞來(lái)檢索,結(jié)果中必然會(huì)包括各類(lèi)病毒的介紹,病毒是怎樣產(chǎn)生的等等許多無(wú)用信息,而用“如何能殺死計(jì)算機(jī)中的病毒”檢索,搜索引擎會(huì)將怎樣殺死病毒的信息提供給用戶,提高了檢索效率。

2、垂直主題搜索引擎有著極大的發(fā)展空間。

網(wǎng)上的信息浩如煙海,網(wǎng)絡(luò)資源以驚人的速度增長(zhǎng),一個(gè)搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各主題都做得精確而又專(zhuān)業(yè),使得檢索結(jié)果垃圾太多。這樣以來(lái),垂直主題的搜索引擎以其高度的目標(biāo)化和專(zhuān)業(yè)化在各類(lèi)搜索引擎中占據(jù)了一席之地。目前,一些主要的搜索引擎,都提供了新聞、Mp3、圖片、Flash等的搜索,加強(qiáng)了檢索的針對(duì)性。

3、元搜索引擎,能夠提供全面且較為準(zhǔn)確的查詢結(jié)果。

現(xiàn)在的許多搜索引擎,其收集信息的范圍、索引方法、排名規(guī)則等都各不相同,每個(gè)搜索引擎平均只能涉及到整個(gè)Web資源的30-50%,這樣導(dǎo)致同一個(gè)搜索請(qǐng)求在不同搜索引擎中獲得的查詢結(jié)果的重復(fù)率不足34%,而每一個(gè)搜索引擎的查準(zhǔn)率不到45%。元搜索引擎(META Search Engine)是將用戶提交的檢索請(qǐng)求發(fā)送到多個(gè)獨(dú)立的搜索引擎上去搜索,并將檢索結(jié)果集中統(tǒng)一處理,以統(tǒng)一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱(chēng)。它的主要精力放在提高搜索速度、智能化處理搜索結(jié)果、個(gè)性化搜索功能的設(shè)置和用戶檢索界面的友好性上,查全率和查準(zhǔn)率都比較高。


新網(wǎng)站如何應(yīng)對(duì)搜索


1、搜索引擎為什么不收錄你的網(wǎng)站,存在以下可能(不絕對(duì),根據(jù)各自情況不同)

  • 沒(méi)有任何指向鏈接的孤島網(wǎng)頁(yè),沒(méi)有被收錄的網(wǎng)站指向你的超鏈接,搜索引擎就無(wú)法發(fā)現(xiàn)你;

  • 網(wǎng)站中的網(wǎng)頁(yè)性質(zhì)及文件類(lèi)型(如flash、JS跳轉(zhuǎn)、某些動(dòng)態(tài)網(wǎng)頁(yè)、frame等)搜索引擎無(wú)法識(shí)別;

  • 你的網(wǎng)站所在服務(wù)器曾被搜索引擎懲罰,而不收錄相同IP的內(nèi)容;

  • 近期更換過(guò)服務(wù)器的IP地址,搜索引擎需要一定時(shí)間重新采集;

  • 服務(wù)器不穩(wěn)定、頻繁宕機(jī),或者經(jīng)不起爬蟲(chóng)采集的壓力;

  • 網(wǎng)頁(yè)代碼劣質(zhì),搜索無(wú)法正確分析頁(yè)面內(nèi)容,請(qǐng)至少學(xué)習(xí)一下HTML的基本語(yǔ)法,建議使用XHTML;

  • 網(wǎng)站用robots(robots.txt)協(xié)議拒絕搜索引擎抓取的網(wǎng)頁(yè);

  • 使用關(guān)鍵詞作弊的網(wǎng)頁(yè),網(wǎng)頁(yè)的關(guān)鍵詞和內(nèi)容嚴(yán)重不匹配,或者某些關(guān)鍵詞密度太大;

  • 非法內(nèi)容的網(wǎng)頁(yè);

  • 相同網(wǎng)站內(nèi)存在大量相同標(biāo)題的網(wǎng)頁(yè),或者網(wǎng)頁(yè)的標(biāo)題沒(méi)有實(shí)際含義;


2、新站如何做才正確(僅供參考)

  • 和優(yōu)秀的網(wǎng)站交換鏈接;

  • 廣泛登錄各種大網(wǎng)站的網(wǎng)站目錄列表;

  • 多去質(zhì)量好的論壇發(fā)言,發(fā)言要有質(zhì)量,最好不要回復(fù),發(fā)言中留下自己網(wǎng)站地址;

  • 申請(qǐng)大網(wǎng)站的博客(新浪、網(wǎng)易、CSDN),并在博客中推廣自己的網(wǎng)站;

  • 使用好的建站程序,最好能生成靜態(tài)頁(yè)面和自動(dòng)生成關(guān)鍵詞;

  • 重視每個(gè)網(wǎng)頁(yè)的標(biāo)題,以及<head>區(qū)域,盡量把符合的關(guān)鍵詞放在這些容易被搜索索引的位置,重視文章的開(kāi)頭部分,盡可能在文章的開(kāi)始部分使用類(lèi)似摘要的功能(可以學(xué)學(xué)網(wǎng)易的文章樣式)。

例如“基于開(kāi)源jabber(XMPP)架設(shè)內(nèi)部即時(shí)通訊服務(wù)的解決方案”;

標(biāo)題部分:<title>基于開(kāi)源jabber(XMPP)架設(shè)內(nèi)部即時(shí)通訊服務(wù)的解決方案- 肥龍龍(expendable)的專(zhuān)欄 -CSDNBlog</title>

關(guān)鍵詞部分:<meta name="keywords"cCOLOR:#c00000">安裝,">

文章描述部分:<metaname="description" cCOLOR:#c00000">是著名的即時(shí)通訊服務(wù)服務(wù)器,它是一個(gè)自由開(kāi)源軟件,能讓用戶自己架即時(shí)通訊服務(wù)器,可以在Internet上應(yīng)用,也可以在局域網(wǎng)中應(yīng)用。

XMPP(可擴(kuò)展消息處理現(xiàn)場(chǎng)協(xié)議)是基于可擴(kuò)展標(biāo)記語(yǔ)言(XML)的協(xié)議,它用于即時(shí)消息(IM)以及在線現(xiàn)場(chǎng)探測(cè)。它在促進(jìn)服務(wù)器之間的準(zhǔn)即時(shí)操作。這個(gè)協(xié)議可能最終允許因特網(wǎng)用戶向因特網(wǎng)上的其他任何人發(fā)送即時(shí)消息,即使其操作系統(tǒng)和瀏覽器不同。XMPP的技術(shù)來(lái)自于Jabber,其實(shí)它是Jabber的核心協(xié)定,所以XMPP有時(shí)被誤稱(chēng)為Jabber協(xié)議。Jabber是一個(gè)基于XMPP協(xié)議的IM應(yīng)用,除Jabber之外,XMPP還支持很多應(yīng)用。


上一頁(yè) 1 2 下一頁(yè)
廣告投放問(wèn)題
網(wǎng)站建設(shè)問(wèn)題
小程序設(shè)計(jì)問(wèn)題

以信載商,良心建站。遨游始終秉承“一次建站、終身維護(hù)”的宗旨,竭誠(chéng)為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁(yè)更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無(wú)論是傳統(tǒng)型企業(yè)官網(wǎng)、集團(tuán)型品牌官網(wǎng),還是營(yíng)銷(xiāo)型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。

公司:網(wǎng)站建設(shè)_小程序設(shè)計(jì)_競(jìng)價(jià)托管代運(yùn)營(yíng)公司;郵箱:1013601535@qq.com

手機(jī):17073547034;QQ: 1013601535

在線留言咨詢,24小時(shí)內(nèi)回復(fù)
我想咨詢
*
企業(yè)名稱(chēng)
手機(jī)號(hào)碼
*
您的姓名
所在城市
提交
最新發(fā)布
注冊(cè)體驗(yàn)
企業(yè)郵箱
域名注冊(cè)
SSL證書(shū)
地圖標(biāo)注
網(wǎng)站備案
服務(wù)器
友情鏈接
我們是中小企業(yè)可信賴的合作伙伴!始終專(zhuān)注一件事,一站式互聯(lián)網(wǎng)信息技術(shù)服務(wù)商
19240102767
全國(guó)統(tǒng)一服務(wù)熱線
遨游建站是全國(guó)高端網(wǎng)站建設(shè)公司,提供廣州企業(yè)網(wǎng)站建設(shè)/小程序開(kāi)發(fā)/購(gòu)物網(wǎng)站設(shè)計(jì)制作與競(jìng)價(jià)托管代運(yùn)營(yíng)服務(wù);秉承“一次建站,終身維護(hù)”的宗旨,有償提供互聯(lián)網(wǎng)技術(shù)支持。
本站部分圖片、音頻、視頻來(lái)源于網(wǎng)絡(luò),版權(quán)歸原作者,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
機(jī)
臺(tái)
商城县| 工布江达县| 甘谷县| 清原| 温泉县| 汉沽区| 左云县| 常德市| 宣汉县| 望谟县| 饶阳县| 六枝特区| 东乌珠穆沁旗| 扶绥县| 黎城县| 康马县| 安宁市| 西昌市| 广德县| 原阳县| 大余县| 衡山县| 乌拉特中旗| 綦江县| 湄潭县| 武乡县| 昭通市| 彰化市| 唐海县| 满洲里市| 东辽县| 云龙县| 云浮市| 新泰市| 六枝特区| 义乌市| 昌黎县| 安顺市| 玉龙| 桂阳县| 循化|