功能說明 提交工具可以向頭條搜索提交網站的文件,幫助頭條更好的抓取您的網站。您可以在此工具下選擇已經驗證的站點,進行驗證站點的文件提交。提交后,頭條搜索會根據了解網站中數據情況。要求 文件要求 XML數據文件規范 注意事項 提交的有作弊嫌疑的url,頭條將進行嚴厲處罰并取消相關權限頭條有自身的爬取規則,只是幫助頭條更好的收錄您的網站,提交并不會決定網站收錄或者排名工具使用方法 1. 索引格式
<sitemapindex>
https://www.toutiao.com/1.xml
2019-12-05
https://www.toutiao.com/2.xml
2019-12-05

2. xml格式
https://www.toutiao.com/1
2019-11-26
https://www.toutiao.com/2
2019-11-26

3. 提交
完成制作后可以使用提交工具進行提交
1)提交成功
2)提交失敗
若在提交工具使用中發生錯誤,請確認是否為以下原因:
異常原因解釋 異常原因解釋解決方法
爬蟲被封禁
可能是您的網站對的UA或IP進行封禁
建議您根據我們公布的UA和IP進行解封,第二天重新抓取之后會恢復正常
文件數據量過大
可能是您的節點數量超過了1w個
建議您拆分為幾個小的文件
地址非法
可能是您的地址不可訪問或者存在xml和txt混合模式的數據
建議您按照我們的要求提交地址
站點服務不可用
我們請求您的網站3次后發現您的網站仍舊不可訪問會暫時停止抓取,則返回該原因
請您檢查服務器是否可正常運轉,如果正常,等正常調度后正常抓取
地址不存在
可能是您的地址無法訪問,返回404,我們獲取不了任何信息
請您排查地址鏈接,等正常調度后可恢復正常抓取
xml文件數據量過大
可能是您的xml文件大小超過10M,item數目超過5w個
建議您拆分幾個小的xml文件
相關QA
文件支持什么格式提交?
目前頭條搜索支持xml格式提交,不支持單條鏈接提交及txt格式提交。
SEO項目
我提交時填寫的周期是什么含義?
會參考設置周期抓取文件,因此請根據文件內容的更新(比如增加新url)來設置。請注意如果url不變僅是url對應的頁面內容更新(比如UGC回答有新內容),不在此更新范圍內網站快速收錄提交工具,工具不能解決頁面更新問題。
提交后,多久能被頭條搜索處理?
數據提交后,一般在1小時內頭條搜索就會開始處理,但抓取時間會以文件大小決定,如果遇到狀態“等待”時間較長,可以觀察一下。
提交的都會被頭條搜索抓取并收錄嗎?
頭條搜索對網站提交的數據,無法保證一定會抓取且收錄所有網址,數據鏈接能否被收錄與頁面質量相關,可盡量避免低質內容提交。
的url鏈接可以包含中文嗎?
不要有,“中文”無法解碼。
為什么我提交的返回異常?
封禁:如果返回狀態為請求異常,請務必確認是否封禁頭條搜索的出口ip和ua格式有誤:請確認您的是否嚴格按照提交幫助中的格式生成,里面包含的xml也應以.xml結尾解析失敗:解析失敗只存在于xml格式,如果因為解析失敗返回異常,請檢查您的xml是否符合標準格式規范
創建時有哪些注意事項
文件大小不得超過5M,節點數量不超過1w個。如果您的超過了這些限值,請將其拆分為幾個小的。數據量限制有助于確保您的網絡服務器不會因提供大文件而超負荷站點支持提交的文件個數必須少于1w個,多于1w個后會不再處理,并顯示“文件數據量過大”當前支持嵌套網站快速收錄提交工具,第一層上限1w個xml,第二層每個xml最多放5w個url
提示
數據能幫助頭條搜索改進抓取策略,不能承諾收錄,也不能決定收錄量級,不能決定搜索排名。