サイトチェックの使い方

指定したURLを起点にサイト構造を自動クロールし、サイト全体を把握する方法を解説します。

サイトチェックとは

サイトチェックは、指定したURLを起点に、サイト内のリンクをBFS(幅優先探索)で自動クロールし、サイト構造を把握する機能です。 クロールされた各ページのタイトルやステータスコードなどの情報を収集し、サイト全体の構造をドキュメント化します。

クロールの開始手順

1

サイトチェックページを開く

サイドバーから「サイトチェック」をクリックして、サイトチェックページに移動します。
2

起点URLを入力

クロール開始ページのURLを入力します。このURLを起点にリンクを辿ってクロールが行われます。
3

クロール設定

以下の項目を設定します。サイトの規模や目的に応じて適切な値を設定してください。
  • サイト名
  • 起点URL
  • 最大ページ数(クロールするページの上限)
  • 階層の深さ(リンクを辿る深さの上限)
  • レンダリングモード(Static / JavaScript)
  • スケジュール(定期実行 / 1日1回)※「曜日を指定」で特定曜日のみの実行も可能
  • ログインオプション(Pro)
4

チェック開始

「チェック開始」ボタンをクリックします。クロールの進捗はリアルタイムで表示されます。

クロール実行中のイメージ

サイトチェック — クロール中
docs.example.com
https://docs.example.com - 24 / 38 ページ
実行中
階層の深さ
3
ページ上限
50
レンダリング
Static
検出ページ
24 / 38
最終チェック
2026/03/16 10:30

レンダリングモードについて

レンダリングモードによって、ページの取得方法とリンクの検出方法が異なります。

モード対応サイトリンク検出
Static通常のWebサイト(HTMLでリンクが記述されているサイト)HTMLの<a href>タグを解析
JavaScriptSPA / CSRサイト(React, Vue.js, Next.js 等)ブラウザでJSを実行後、リンクとナビゲーション要素を検出

JavaScriptモードのSPAナビゲーション検出

JavaScriptモードでは、通常の<a href>リンクの検出に加えて、 SPAフレームワーク(Vue.js, React等)のボタンクリックによるナビゲーションも自動検出します。 これにより、<a>タグを使わずにページ遷移するSPAサイトのリンク構造も把握できます。

ナビゲーション検出のため、ページ内のクリック可能な要素を実際にクリックしますが、 以下の安全対策により意図しない操作を防止しています。

クリック対象から除外される要素

副作用のあるボタンをクリックしないよう、以下の要素はクリック対象から自動的に除外されます。

カテゴリ除外されるキーワード例
ログイン・ログアウトログイン, ログアウト, Sign in, Sign out
削除・退会削除, 退会, Delete, Remove
お気に入り・フォローお気に入り, フォロー, Favorite, Like, Follow
購入・決済・注文購入, 決済, カートに, 注文, 支払, Buy, Checkout, Order, Pay
送信・投稿送信, 投稿, Submit, Post, Comment
編集・保存・更新編集, 保存, 変更, 更新, Edit, Save, Update
承認・公開承認, 却下, 公開, 非公開, 下書き, Approve, Publish, Draft
共有・通知シェア, 共有, 招待, 通知, Share, Tweet, Invite
参加・予約・申込参加, 予約, 申し込, Register, Subscribe, Reserve, Book
ダウンロード・アップロードダウンロード, アップロード, Download, Upload
通報・ブロック通報, ブロック, Report, Block
評価・投票評価, 投票, Rate, Review, Vote, Star
リセット・キャンセルリセット, クリア, キャンセル, 閉じる, Reset, Clear, Cancel
連携・設定変更連携, 解除, 有効, 無効, ミュート, Connect, Enable, Disable
その他コピー, 複製, 移動, エクスポート, インポート, 印刷, 同意, 確定
上記のキーワードフィルタに加えて、ページのメインコンテンツ領域内のボタンはクリック対象外です。 ナビゲーションバーやヘッダー、メニュー内の要素のみを対象とすることで、安全性を高めています。 ただし、テキストを持たないアイコンのみのボタン等、フィルタをすり抜ける可能性がゼロではありません。
クロールは同一オリジン(同じドメイン)のリンクのみを辿ります。外部サイトへのリンクは収集しますがクロールはしません。
robots.txt の設定を尊重します。robots.txtでブロックされているページはクロールしません。