2011年2月22日火曜日

ブログスクレイプ

Windowsアプリです。
ブログを電子書籍化するために、ブログ本文を抜き出すためのツールです。

電子書籍エディター「Sigil」に渡すように、XHTML形式でファイル出力します。

対応ブログ:FC2ブログ、Blogger、AMEBLO、livedoorブログ、gooブログ、ココログ、yaplog

問題点
・対応ブログが少ない
・動作確認ブログが少ない
・抜き出したHTMLがセンタリングされていることがある
・抜き出したHTMLがCSSに対応できていないことがある
・マルチ言語対応


履歴

2011/02/03 ブログページ作成

2011/02/03 以下の作業を完了
・ブログ本文の抜き出し(FC2BLOGのみ)
・抜き出したファイル出力

2011/02/04 以下の作業を完了
・ブログの文字化け問題を解決
・メモリリーク対応

2011/02/06 以下の作業を完了
・エラー対応が入っていない(Exception)

2011/02/06 バージョン1.0.0リリース
prueba-WEB

2011/02/10 Vectorに登録しました
http://www.vector.co.jp/soft/winnt/net/se489005.html

2011/02/22 バージョン1.1.0リリース

・対応ブログを追加
・アイコンを追加
・ステータスバーにステータスを追加

2011年2月12日土曜日

ブログスクレイプの使いかた

ブログ本文抽出ツールを作成しました。

使い方を説明します。

手順1.ダウンロードしたファイルを解凍します。

手順2.解凍したフォルダの中から、
        "WebScraping.exe"をダブルクリックし、起動します。

手順3."WebScraping.exe"が起動します。

手順4.ブログURLに取得したいURLを貼り付けます。

手順5.抽出ボタンをクリックします。

手順6.しばらくすると、保存ダイアログが表示されます。

手順7.ファイル名、フォルダ名を選択して、保存ボタンをクリックします

おしまい。


エラー画面が出た場合の対処方法。
・ブログURLが間違っていませんか?

その他
・対応していないブログの場合、抽出がうまくできません。
現状では、FC2ブログ、Blogger、AmebaBlogに対応。
→今後も追加予定ですが、
対応して欲しいブログがあれば、ご連絡くださいm(__)m