世紀網絡淺談PDF文檔的搜索引擎優化方法 |
作者:世紀網絡 發布時間:2008-11-19 瀏覽:2082次 |
目前常用的文檔格式有TXT、WORD、PDF等,對這些文檔的搜索引擎優化方法比較簡單,只要在文件標題和文檔首頁前面的一些文字信息中包含關鍵詞即可,與網頁優化的思路一致。這些工作只需要我們在寫作文檔時順便做一下就OK了,在大家對這些問題還都不夠重視的時候,只需稍加注意,就會獲得較好的檢索排名效果。隨著同類文檔的逐漸增加,也許還需要更加復雜的優化手段,但是目前這方面好像還沒有更多有效的方法可以借鑒的。 PDF文檔基于三大搜索引擎的權重是很高,PDF文檔可以在其內容中添加鏈接,并且在GOOGLE的策略中,相比普通的HTML文件,文檔具有先天優勢,GOOGLE賦予原創PDF文件PR=3的高權重,原因主要有三點:1、一般大家會把相對重要的文件、文本做成PDF格式,這樣就導致了搜索引擎對PDF文件的高度認可。2、PDF文件的打開方式是html,網絡客戶端讀取方便。3、PDF文件的易下載,易傳播,而且在傳播過程中不會失真,也不易被修改(相對DOC等而言)。 如何制作pdf文件呢?前面提到PDF文件優化與網頁優化的思路一致,比如:標題和內容中適當包含關鍵詞,提高內容的相關性,對標題使用H1格式,重要內容以粗體或大字號顯示等等。另外,對于PDF文檔,需要進行一些文件屬性方面的優化。做PDF文件,用Acrobat軟件太麻煩,我一般用WORD直接導出生成PDF格式,簡單實用。文件屬性的優化主要包括:文件說明,文件元數據說明文件,文件屬性,說明,標題,作者,主題,描述Description,關鍵詞Keywords,描述作者Description Writer,這些屬性跟html 的屬性基本相同。 可以看一下Adobe Acrobat6.0使用說明,兩組關鍵詞重要性分析,哪種關鍵詞最可能得到搜索引擎的關注呢? 我們知道元數據(metadata)有許多存儲格式,而Adobe采用的是XML格式,用記事本打開PDF文件,可以發現在“文件屬性說明”下的關鍵詞區域中輸入的關鍵詞之間是以逗號分割的,形如:關鍵詞(關鍵詞1,關鍵詞2,關鍵詞3,…),而我們在“文件元數據說明”下的關鍵詞區域中輸入的關鍵詞內容則形如:關鍵詞1關鍵詞2關鍵詞3 按照這種形式看來,搜索引擎更有可能抓取的是“文件屬性說明”下的關鍵詞區域中的信息。所以我們建議在這個區域列出網站最主要的相關關鍵詞。如果PDF文件中要使用圖片的話,最好在每幅的圖片下面附加一行說明,最好包含目標關鍵詞,類似于html中圖片的ALT標簽的作用。 另外再還有一點就是pdf文件對一個網站的內鏈和外鏈有一個很好的補充,這點可以抽時間把自己在網上發表的技術文章整理出來做成pdf文件。 |