ブラウザやOSのProxy設定を変更すると、基本的にはすべてのアクセスがProxyを通ることになります。
この場合、VAddyのクロールでシナリオ作成中はGoogle検索など他のサイトへのアクセスができなくなります。
この問題を解決するためには、VAddyでクロールしたいドメイン/FQDNのみVAddyのProxyを通り、それ以外はProxyを通さない設定が必要になります。
それを実現するには、Proxy自動設定用のPACファイルを利用します。
下記ような内容で example.pac というファイル名で保存します。
記述のwww1.example.comは検査対象のサーバのドメイン(FQDN)に変更してご利用ください。FQDNが1つだけの場合は、www2.example.comの1行を消してご利用ください。
PROXY 54.92.84.100:28888という箇所のポート番号28888は実際にVAddyのProxyCrawlingメニューに表示されているポート番号をご指定ください。
function FindProxyForURL(url, host)
{
if(shExpMatch(host,"www1.example.com")
|| shExpMatch(host,"www2.example.com")
)
{
return "PROXY 54.92.84.100:28888";
}
else
return "DIRECT";
}
このファイルをアクセスできる任意のWebサーバに置いてください(FirefoxのみローカルファイルにPACファイルを作成して読み込み可能です)。このファイルのURLを、ブラウザのProxy設定画面の「自動プロキシ設定用URL」の箇所に入れてください。次の画面キャプチャはfirefoxでの入力例です。
この状態で該当のFQDNにアクセスするとVAddy ProxyにアクセスするためVAddyのForbidden画面が出ると思います。それ以外のドメインにアクセスすると正常に画面表示されれば準備完了となります。
この状態で、VAddyのクロール開始URLにアクセスしてクロール作業(シナリオ作成)を行ってください。
ローカルファイルのPACファイルを利用する場合
Firefox限定となりますがローカルPCにPACファイルを作成して読み込む場合は、pacファイルのURL設定の欄に「 file:// 」から始まる形でファイルを指定してください。
例えばwindowsの場合、cドライブのfooディレクトリにproxy.pacというファイルを置き、「 file://c:/foo/proxy.pac 」と指定。
Macの場合は、ホームディレクトリ(ユーザ名はfooとする)にproxy.pacを置き、「 file:///Users/foo/proxy.pac 」と指定。
PACファイルを設置するサーバがない場合
もしPACファイルを設置するWebサーバがない場合は、GitHubが提供しているgistなどのサービスをご検討ください。
例としてこのようにgistにPACファイルの内容を記載して登録します。
https://gist.github.com/ichikaway/87d194cbd7c7b00e3264e6da435b5a27
このURLにアクセスした先で、"RAW"ボタンを押すと
https://gist.githubusercontent.com/ichikaway/87d194cbd7c7b00e3264e6da435b5a27/raw/fcceb472bb2e8ca23937391c2df2518ca909af58/example.pac
のようなURLでアクセスできますので、これがPACファイルのURLになります。
ご自身でgistに登録し、RAWボタンを押したURLをブラウザのProxy設定の自動プロキシ設定スクリプトURL欄にご入力ください。