FC2BLOGINDEXESログ消失、でもたすかった
ひやっとしました。
今回は毎月ログを貯めているFC2BLOG INDEXES11月分のログを消失してしまったけれど、htmlSQLのおかげで復活した、という話。
FC2BLOG INDEXESのしくみは、ローカルでYahoo!、Googleにクエリを送り、戻ってきた値を読み取り、サーバー番号1から順にログに保存、前月の場合はサーバ122のインデックス数読み取りの時点でデータ読み取りを終了します。
ログはCSV形式で保存。11月分の場合だと、

629000,209000,
909000,88100,
768000,65900,
784000,74800,
といった感じになります。
で、あとはログを元にページを形成するスクリプトで静的なページをつくり出して、ログはローカルに置いたまま、生成したページをサーバにアップロードします。このローカルに置いているログが無くなってしまったのです。
ページを形成するときに前月分のログを読み込み、比較して、前月とのインデックス数の増減をはじきだしています。11月分のログが消失してしまうと、来月12月では前月との比較ができないんです。これは困った。一行一行自力で書いていってもいいですけど、時間がかかる。
と、そのとき思い出したのがhtmlSQL。これはhtmlの要素をSQLライクに取り出すことのできるPHPライブラリです。
ということで、FC2BLOGINDEXESからインデックスデータのみを抽出してみました。
インデックス数を表示している箇所は<td style="text-align:right">数値<br>数値</td>と記述していますから、あとひと処理加えて、以下のような配列が抽出されます。
おそらく他の方法でもっと簡単に抽出することもできるんでしょうけど、以前から一度試してみたいと思っていましたので、タイミングのいい消失でした。
▼HTMLの要素をSQLのように取り出せるPHPのライブラリ『htmlSQL』
▼ニュースサイトを解析…htmlSQLを使ってみる
今回は毎月ログを貯めているFC2BLOG INDEXES11月分のログを消失してしまったけれど、htmlSQLのおかげで復活した、という話。
FC2BLOG INDEXESのしくみは、ローカルでYahoo!、Googleにクエリを送り、戻ってきた値を読み取り、サーバー番号1から順にログに保存、前月の場合はサーバ122のインデックス数読み取りの時点でデータ読み取りを終了します。
ログはCSV形式で保存。11月分の場合だと、

629000,209000,
909000,88100,
768000,65900,
784000,74800,
といった感じになります。
で、あとはログを元にページを形成するスクリプトで静的なページをつくり出して、ログはローカルに置いたまま、生成したページをサーバにアップロードします。このローカルに置いているログが無くなってしまったのです。
ページを形成するときに前月分のログを読み込み、比較して、前月とのインデックス数の増減をはじきだしています。11月分のログが消失してしまうと、来月12月では前月との比較ができないんです。これは困った。一行一行自力で書いていってもいいですけど、時間がかかる。
と、そのとき思い出したのがhtmlSQL。これはhtmlの要素をSQLライクに取り出すことのできるPHPライブラリです。
ということで、FC2BLOGINDEXESからインデックスデータのみを抽出してみました。
SELECT text FROM td WHERE $style == "text-align:right"
インデックス数を表示している箇所は<td style="text-align:right">数値<br>数値</td>と記述していますから、あとひと処理加えて、以下のような配列が抽出されます。
あとはループ処理中にCSV形式で保存するだけ。救われました。
Array
(
[0] => 629,000
[1] => 209,000
)
Array
(
[0] => 909,000
[1] => 88,100
)
Array
(
[0] => 768,000
[1] => 65,900
)
おそらく他の方法でもっと簡単に抽出することもできるんでしょうけど、以前から一度試してみたいと思っていましたので、タイミングのいい消失でした。
関連
▼htmlSQL▼HTMLの要素をSQLのように取り出せるPHPのライブラリ『htmlSQL』
▼ニュースサイトを解析…htmlSQLを使ってみる
前後の記事
最近の記事
▼PIYO APIコンテストで準グランプリに選ばれた
▼FC2用語辞典、FC2スパイダーを更新
▼文字サイズチェッカ
▼APIコンテスト応募予定?作品完成
▼FC2ミニブログPIYO APIの解説とサンプル
▼PIYO APIコンテスト延期
▼FC2BLOG INDEXES:データ更新 2007年12月
▼ソースコードを飾る::syntaxhighlighter FC2ブログでの導入メモ
▼FC2BLOGINDEXESログ消失、でもたすかった
▼FC2PIYO APIコンテスト開催!
▼FC2用語辞典、FC2スパイダーを更新
▼文字サイズチェッカ
▼APIコンテスト応募予定?作品完成
▼FC2ミニブログPIYO APIの解説とサンプル
▼PIYO APIコンテスト延期
▼FC2BLOG INDEXES:データ更新 2007年12月
▼ソースコードを飾る::syntaxhighlighter FC2ブログでの導入メモ
▼FC2BLOGINDEXESログ消失、でもたすかった
▼FC2PIYO APIコンテスト開催!
トラックバック
この記事へのトラックバックURL:
http://fc2blogshop.blog13.fc2.com/tb.php/895-3f64aeb1
コメント
Search
FC2blogビギナーズガイド
コラム
作成したツール
月別アーカイブ
- 2008年 03月(1)
- 2008年 02月(1)
- 2008年 01月(3)
- 2007年 12月(2)
- 2007年 11月(5)
- 2007年 10月(7)
- 2007年 09月(7)
- 2007年 08月(6)
- 2007年 06月(1)
- 2007年 05月(1)
- 2007年 04月(12)
- 2007年 03月(2)
- 2006年 12月(2)
- 2006年 11月(12)
- 2006年 10月(6)
- 2006年 09月(1)
- 2006年 08月(3)
- 2006年 07月(3)
- 2006年 06月(4)
- 2006年 05月(16)
- 2006年 04月(13)
- 2006年 03月(16)
- 2006年 02月(12)
- 2006年 01月(8)
- 2005年 12月(13)
- 2005年 11月(24)
- 2005年 10月(19)
- 2005年 09月(27)
- 2005年 08月(38)
- 2005年 07月(51)
- 2005年 06月(40)
- 2005年 05月(111)
- 2005年 04月(153)
- 2005年 03月(57)
- 2005年 02月(79)

