サイトチェックの使い方
指定したURLを起点にサイト構造を自動クロールし、サイト全体を把握する方法を解説します。
サイトチェックとは
サイトチェックは、指定したURLを起点に、サイト内のリンクをBFS(幅優先探索)で自動クロールし、サイト構造を把握する機能です。 クロールされた各ページのタイトルやステータスコードなどの情報を収集し、サイト全体の構造をドキュメント化します。
クロールの開始手順
1
サイトチェックページを開く
サイドバーから「サイトチェック」をクリックして、サイトチェックページに移動します。
2
起点URLを入力
クロール開始ページのURLを入力します。このURLを起点にリンクを辿ってクロールが行われます。
3
クロール設定
以下の項目を設定します。サイトの規模や目的に応じて適切な値を設定してください。
- サイト名
- 起点URL
- 最大ページ数(クロールするページの上限)
- 階層の深さ(リンクを辿る深さの上限)
- レンダリングモード(Static / JavaScript)
- スケジュール(定期実行 / 1日1回)※「曜日を指定」で特定曜日のみの実行も可能
- ログインオプション(Pro)
4
チェック開始
「チェック開始」ボタンをクリックします。クロールの進捗はリアルタイムで表示されます。
クロール実行中のイメージ
サイトチェック — クロール中
docs.example.com
https://docs.example.com - 24 / 38 ページ
実行中
階層の深さ
3
ページ上限
50
レンダリング
Static
検出ページ
24 / 38
最終チェック
2026/03/16 10:30
レンダリングモードについて
レンダリングモードによって、ページの取得方法とリンクの検出方法が異なります。
| モード | 対応サイト | リンク検出 |
|---|---|---|
| Static | 通常のWebサイト(HTMLでリンクが記述されているサイト) | HTMLの<a href>タグを解析 |
| JavaScript | SPA / CSRサイト(React, Vue.js, Next.js 等) | ブラウザでJSを実行後、リンクとナビゲーション要素を検出 |
JavaScriptモードのSPAナビゲーション検出
JavaScriptモードでは、通常の<a href>リンクの検出に加えて、 SPAフレームワーク(Vue.js, React等)のボタンクリックによるナビゲーションも自動検出します。 これにより、<a>タグを使わずにページ遷移するSPAサイトのリンク構造も把握できます。
ナビゲーション検出のため、ページ内のクリック可能な要素を実際にクリックしますが、 以下の安全対策により意図しない操作を防止しています。
クリック対象から除外される要素
副作用のあるボタンをクリックしないよう、以下の要素はクリック対象から自動的に除外されます。
| カテゴリ | 除外されるキーワード例 |
|---|---|
| ログイン・ログアウト | ログイン, ログアウト, Sign in, Sign out |
| 削除・退会 | 削除, 退会, Delete, Remove |
| お気に入り・フォロー | お気に入り, フォロー, Favorite, Like, Follow |
| 購入・決済・注文 | 購入, 決済, カートに, 注文, 支払, Buy, Checkout, Order, Pay |
| 送信・投稿 | 送信, 投稿, Submit, Post, Comment |
| 編集・保存・更新 | 編集, 保存, 変更, 更新, Edit, Save, Update |
| 承認・公開 | 承認, 却下, 公開, 非公開, 下書き, Approve, Publish, Draft |
| 共有・通知 | シェア, 共有, 招待, 通知, Share, Tweet, Invite |
| 参加・予約・申込 | 参加, 予約, 申し込, Register, Subscribe, Reserve, Book |
| ダウンロード・アップロード | ダウンロード, アップロード, Download, Upload |
| 通報・ブロック | 通報, ブロック, Report, Block |
| 評価・投票 | 評価, 投票, Rate, Review, Vote, Star |
| リセット・キャンセル | リセット, クリア, キャンセル, 閉じる, Reset, Clear, Cancel |
| 連携・設定変更 | 連携, 解除, 有効, 無効, ミュート, Connect, Enable, Disable |
| その他 | コピー, 複製, 移動, エクスポート, インポート, 印刷, 同意, 確定 |
上記のキーワードフィルタに加えて、ページのメインコンテンツ領域内のボタンはクリック対象外です。 ナビゲーションバーやヘッダー、メニュー内の要素のみを対象とすることで、安全性を高めています。 ただし、テキストを持たないアイコンのみのボタン等、フィルタをすり抜ける可能性がゼロではありません。
クロールは同一オリジン(同じドメイン)のリンクのみを辿ります。外部サイトへのリンクは収集しますがクロールはしません。
robots.txt の設定を尊重します。robots.txtでブロックされているページはクロールしません。