拝啓 瀬戸弘幸 殿

平成21年10月10日、徐才喜冤罪事件の取材記録が瀬戸家の石倉から出てきたとの喜ばしい報告を下さってから、早いもので8ヶ月が経過しました。

地裁の判決文全文(特に公印は必須)と、新聞が大きく報じたという、徐才喜さんの逮捕の記事の公表はまだでしょうか?

>>全文はコチラ
2008年11月16日日曜日
HPをダウンロードして目次を作ろう(1)

でぶちんさんTomatotic_jerryさんがやっているHPの分析について、出来るだけ無料で、かつ誰でも出来るような方法を何回かに分けて紹介します。
今回は、比較的簡単に出来るHPのダウンロードと目次作りの足掛かりになる部分までです。
HPを巡回したり、フォルダ構造丸ごと保存するソフトは色々出ています。私は普段、wgetをコマンドラインで使っていますが、GUIの方がとっつき易いと思いますので、フリーウェアの「巡集」でやってみます。
ダウンロードしたら、適当な場所に展開して、Junshu.exeを起動して下さい。



今回は面倒なのでデスクトップでそのまま展開しました。細かい設定も特にせず、ダウンロードするURLに、「東村山市民新聞」のURLをコピペして、実行しました。

ダウンロードが終了すると、デスクトップのJunshu171aフォルダの中に「東村山市民新聞」というフォルダが作られ、このHPの情報が一括保存されます。

私のパソコンは、ハードディスクをCドライブとDドライブに分割してあるので、「東村山市民新聞」フォルダをそのままDドライブのルートにコピーしました。

では、ここから目次を作る方法の「さわり」だけ紹介しておきます。コマンドプロンプトからの操作なのでちょっと面倒だと思う人も居ると思いますが、次回以降はもう少し楽する方法を紹介するので、「ああ、こんな事ができるのか」位で読み流して下さってOKです。



コマンドプロンプトで、東村山市民新聞のhtmlファイルが保存されているフォルダまで移動して、「findstr」関数を使います。

今回はフォルダ内の全てのhtmlファイルから、「<TITLE>」を含む行を抽出してみました。こんな感じで全ページのタイトルを抜き出せます。該当行が存在するファイル名と、

「findstr "<TITLE>" *.html >東村山市民新聞.txt」のようにすれば、画面への出力ではなくファイルに結果を保存することも出来ます。



0 コメント | コメントを書く  
Template Design: © 2007 Envy Inc.