Simple SiteMap Editor(站點地圖編輯器)是一款輕便、便攜、免費的應用程序,它可以讓你快速、輕松地手動編輯sitemap xml文件內容,或者創(chuàng)建你自己的新sitemap文件。有需要的小伙伴歡迎來西西下載體驗。
軟件簡介:
站點地圖是網站站長通知搜索引擎有關其站點上可進行爬網的頁面的一種簡便方法。Sitemap是最簡單的形式,它是一個XML文件,其中列出了站點的URL以及有關每個URL的其他元數(shù)據(相對于站點中其他URL的最新更新時間,通常更改的頻率以及重要性) ),以便搜索引擎可以更智能地抓取該網站。
Web爬網程序通常從站點內的鏈接和其他站點發(fā)現(xiàn)頁面。Sitemap補充了這些數(shù)據,以使支持Sitemap的搜尋器可以拾取Sitemap中的所有URL,并使用關聯(lián)的元數(shù)據來了解這些URL。使用Sitemaps 協(xié)議不能保證網頁會包含在搜索引擎中,但是會為網絡爬蟲提供提示,以幫助他們更好地爬網您的網站。
Sitemap 0.90是根據 Attribution-ShareAlike Creative Commons許可條款提供的,已得到廣泛采用,包括Google,Yahoo!和Microsoft的支持。
常見問題答疑:
問: 如何在站點地圖中表示網址?
與所有XML文件一樣,任何數(shù)據值(包括URL)都必須對以下字符使用 實體轉義碼:&符,單引號('),雙引號(“),小于(<)和大于( >)。您還應確保所有URL都遵循URI 的 RFC-3986 標準,IRI 的RFC-3987標準以及XML標準。。如果您使用腳本來生成URL,則通?梢詫RL作為該腳本的一部分進行轉義。您仍然需要使實體逃脫它們。例如,以下python腳本實體轉義了http://www.example.com/view?widget=3&count>2
$蟒蛇Python 2.2.2(#1,F(xiàn)eb 24 2003,19:13:11) >>>導入xml.sax.saxutils>>> xml.sax.saxutils.escape(“ http://www.example.com/view?widget=3&count>2”)
上面示例中的結果URL為:
http://www.example.com/view?widget=3&count>2
問: 我用來生成站點地圖文件的哪種字符編碼方法有關系嗎?
是。您的站點地圖文件必須使用UTF-8編碼。
問: 如何指定時間?
對于此協(xié)議中的lastmod時間戳和所有其他日期和時間, 請使用W3C Datetime編碼。例如2004-09-22T14:12:14 + 00:00。
這種編碼使您可以省略ISO8601格式的時間部分。例如2004-09-22也有效。但是,如果您的網站經常更改,建議您將時間部分包括在內,以便搜尋器具有有關您的網站的更完整的信息。
問: 如何計算lastmod日期?
對于靜態(tài)文件,這是實際的文件更新日期。您可以使用UNIX date命令獲取此日期:
$ date --iso-8601 = seconds -u -r /home/foo/www/bar.php>> 2004-10-26T08:56:39 + 00:00
對于許多動態(tài)URL,您可以根據基礎數(shù)據的更改時間或通過使用基于定期更新的近似值(如果適用)來輕松計算lastmod日期。甚至使用大概的日期或時間戳也可以幫助爬網程序避免對未更改的URL進行爬網。這將減少Web服務器的帶寬和CPU要求。
問: 我應該在哪里放置我的站點地圖?
強烈建議您將Sitemap放在HTML服務器的根目錄下;也就是說,將其放在http://example.com/sitemap.xml。
在某些情況下,您可能想針對站點上的不同路徑生成不同的站點地圖-例如,如果組織中的安全權限劃分了對不同目錄的寫訪問權限。
我們假設如果您有權上傳http://example.com/path/sitemap.xml,那么您也有權在http://example.com/path/下報告元數(shù)據。
站點地圖中列出的所有URL必須與站點地圖位于同一主機上。例如,如果站點地圖位于http://www.example.com/sitemap.xml,則它不能包含來自http://subdomain.example.com的URL。如果站點地圖位于http://www.example.com/myfolder/sitemap.xml,則不能包含來自http://www.example.com的URL。
回到頂部
問: 我的站點地圖有多大?
站點地圖不得大于50MB(52,428,800字節(jié)),并且最多可以包含50,000個URL。這些限制有助于確保Web服務器不會因提供非常大的文件而陷入困境。這意味著,如果您的站點包含超過50,000個URL,或者您的站點地圖大于50MB,則必須創(chuàng)建多個站點地圖文件并使用站點地圖索引文件。即使您的網站很小,也應該使用Sitemap索引文件,但計劃將其擴展到50,000個以上的URL或文件大小為50MB。Sitemap索引文件最多可以包含50,000個Sitemap,并且不得超過50MB(52,428,800字節(jié))。您還可以使用gzip壓縮站點地圖。
問: 我的網站有數(shù)千萬個URL。我可以以某種方式僅提交最近更改的那些嗎?
您可以列出少量站點地圖中經常更改的URL,然后在 站點地圖索引文件中使用lastmod標記來識別那些站點地圖文件。然后,搜索引擎可以僅對已更改的站點地圖進行漸進爬網。
問: 創(chuàng)建站點地圖后該怎么辦?
創(chuàng)建Sitemap后,請直接向他們提交,對其進行ping操作或將Sitemap位置添加到robots.txt文件中,以 讓搜索引擎知道它。
問: 站點地圖中的網址是否需要完整指定?
是。您需要在URL中包含協(xié)議(例如,http)。如果您的Web服務器需要一個斜杠,則還需要在URL中包括一個斜杠。例如,http://www.example.com/是站點地圖的有效URL,而www.example.com不是。
問: 我的站點同時具有URL的“ http”和“ https”版本。我需要同時列出兩者嗎?
否。請在您的站點地圖中僅列出一個版本的URL。包括多個版本的URL可能會導致您的網站不完全爬網。
問: 我網站上的URL中包含會話ID。我需要刪除它們嗎?
是。在URL中包含會話ID可能會導致不完整和多余的網站爬網。
問: 網址在Sitemap中的位置是否會影響其使用?
否。URL在站點地圖中的位置不太可能影響搜索引擎使用或查看URL的方式。
問: 我網站上的某些頁面使用框架。我應該包括框架集URL還是框架內容的URL?
請同時包含兩個網址。
問: 我可以壓縮站點地圖,還是必須將其壓縮?
請使用gzip壓縮您的站點地圖。請記住,無論是否壓縮,您的站點地圖都不得大于50MB(52,428,800字節(jié))。
問: XML Sitemap中的“優(yōu)先級”提示會改變我的頁面在搜索結果中的排名嗎?
Sitemap中的“優(yōu)先級”提示僅表示相對于您自己網站上其他URL的特定URL的重要性,并不意味著對搜索結果中頁面的排名有任何影響。