iscle [イズクル] - あなたの生活に役立つネタを!

PDFが検索されないようにする設定方法とは?

竹中文人
執筆者:
[最終更新日]2015/06/30
[カテゴリ]Web・IT

PDFが検索されないようにする

GoogleもYahoo!も、検索ができるのはWebサイトの情報だけではありません。PDFファイルだって検索され、検索結果にヒットし表示されます。不特定多数の方に見てもらいたい内容のPDFファイルや、見られても問題のないPDFファイルであれば良いのですが、会社の機密情報・重要情報や個人情報等であれば話は別です。

その大切なPDFファイル、検索結果に表示されていませんか?

社内で共有するためにPDFファイルをサーバーにアップして置いたりすると、知らない間にPDFファイルが検索結果に表示され、様々な人に観覧されている可能性があります。もし見られては困るような内容が入ったPDFファイルであれば、検索されないように設定しておきましょう!

PDFファイルが検索されないようにする方法

検索エンジンは様々なファイルをインデックス(データとして記録)して、それを目的に合った人の検索結果に表示させようとします。PDFファイルもインデックスされることで検索されるのが原因なので、検索されないように検索エンジンに指示してあげれば良いのです。

検索エンジンに「検索しないで!」と指示する方法は3つあります。

  • htaccess
  • robots.txt
  • metaタグ

今回は簡単な『robots.txt』を使う方法をご紹介致します。

『robots.txt』で検索されないようにする

まずはテキストファイルを作成し、名前を「robots.txt」にしてください。
pdf-notsearch-01

作成したらそのテキストファイルを開いて下記のように記入します。

User-Agent: *
Disallow: /pdf/
Disallow: /pdf-sample.pdf
  • 「/pdf/」の部分は、「pdf」というフォルダ内にあるファイルを検索エンジンから拒否するという意味です。
  • 「/pdf-sample.pdf」の部分は、個別にファイル名を指定して検索エンジンから拒否する方法です。

※フォルダ名やファイル名はご自身の環境に合わせて変えてください。

また下記のように記載すれば、PDFファイル全てをGoogleから拒否することができます。

User-agent: Googlebot
Disallow: /*.pdf$

記入ができたら robot.txt をサーバーにアップしましょう!

この方法をしても完全に検索されないという保証はありません。観覧されては困るような重要なPDFファイルは、Googleドライブ等に保存して共有したほうが安全だと思います。