Title: html2txt[C++]
html2txt[C++]
HTML文章からテキスト部分のみを抜き出すプログラム例です。用意したファイルは、コンパイルして実行ファイルとして利用が可能な他、宣言されているクラス(CHtml2Txt)を用いて他のソフトにも組み込むことが可能です。
・ソースのダウンロード
・CHtml2Txt クラスの利用例
Comment:
-------------------------------------------------------------
ダウンロード
・html2txtメイン [html2txt.c]
・html2txtヘッダ [html2txt.h]
・一般関数 [common.cpp]
・一般関数用ヘッダ [common.h]
・一括ダウンロード[html2txt.lzh]
実行時の引数は以下のようになります。
Gami[62]% html2txt
USAGE: html2txt htmlfile [-disp] [-link] [-out textfile] [-url baseurl]
option:
-disp output to display (default .txt file).
-link output link[ref url and image]
-out htmlfile output filename
-url set base URL
Gami[63]%
Comment:
-------------------------------------------------------------
CHtml2Txt クラスの利用例
コンパイル:
Gami[488]% g++ -o exp1 html2txt.cpp common.cpp exp1.cpp
例題(exp1.cpp)
01: #include
02: #include "html2txt.h"
03:
04: int main(int argc,char* argv[])
05: {
06: CHtml2Txt h2t(argc,argv);
07: if(h2t.ReadCode()) {
08: if(h2t.Convert())
09: h2t.WriteCode();
10: }
11: return 0;
12: }
Comment:
Comment: