HSPポータル
サイトマップ お問い合わせ


HSPTV!掲示板


未解決 解決 停止 削除要請

2012
0306
LaLaLaLovePHPを利用したサイトからのHTML取得について3解決


LaLaLaLove

リンク

2012/3/6(Tue) 13:20:29|NO.45244

以下のようなことをするプログラムを組もうと思っています。

■処理内容
特定のサイトへ接続(PHPを利用している)

HTMLファイル取得

特定のタグの間から文字列を取得

テキストファイルに保存

(※後々は、この処理内容を繰り返そうと思っております。例えば一定期間・時間起きにこの処理を行うなど)

そこでまずhtmlファイルをサイトから取得するためにサンプルから

#include "hspinet.as"

;
; 単純なファイルのダウンロード
;    ※サイトURLとファイル名は実際のものを記入
; ex) サイトURL http://example.com
; ファイル名 index.html

netinit
if stat : dialog "ネット接続できません。" : end

neturl "サイトURL"

mes "DOWNLOAD 開始"

netload "ファイル名"

mes "DOWNLOAD 完了"
mes "index.htmlを保存しました。"

stop


を実行してみるとサイト側のエラー画面が保存されます。IEやChromeなどから「名前をつけて保存」などをして、
ダウンロードしたファイルを開くとちゃんとしたページが表示されます。
ブラウザ側で見えるページ(エラー画面でないページ)をhtmlで保存したいのですが、
他に方法はありますでしょうか?

次にタグの間からの文字列の取得は
kurage_mod( http://tohazugatari.com/kurage_mod )を利用し、
取得した文字列をnotesel命令でテキストファイルに保存しようと思います。

大変初歩的な質問で申し訳ないのですが、どうかご回答お願い致します。



この記事に返信する


Cookies

リンク

2012/3/6(Tue) 15:48:55|NO.45246

エラー画面が保存されるのは、PHP(もしくはサーバ)がエラーを返しているから。
IEだって、HSPがやっていることを再現してアクセスすればもちろんエラーを返してくる。

> ex) サイトURL http://example.com
>; ファイル名 index.html
neturlの説明に
>「http://www.onionsoft.net/hsp/index.html」の場合は、「http://www.onionsoft.net/hsp/」までを設定してください。
とある。
http://www.onionsoft.net/hsp/」がよくて
http://example.com」が悪いのはなぜだかわかるだろうか。



LaLaLaLove

リンク

2012/3/6(Tue) 18:28:16|NO.45247

早速ご回答ありがとうございます。
私の説明が少し足りないところがありましたので、追加します。
ご指摘頂いた、http://example.comの部分ですが、

http://example.com/index.php/shouhin?id=1234567890

と読み替えて下さい。
(他のサイトでもhttp://example.com/の形式で書いたところ
やはりphpを利用しているサイトでは失敗してしまいます。)
また、IEコンポーネント上で表示されたページをそのままHTMLとして
保存したりすることは可能でしょうか?
以下のようなソースコードを見つけたのですが、ここに上記の訂正したURLを入力したところ
綺麗に表示されました。

//=========================ソースコード================================
// IEコンポーネントの設置 (by Kpan)

sdim url, 512
input url, ginfo(12), 22
button gosub "移動", *navigate

; IEコンポーネントの設置
axobj IE, "Shell.Explorer.2", ginfo(12), 300

stop

*navigate
if url = "" : return

; ページ移動
IE->"Navigate" url
return

//======================================================================
//表示されたウィンドウのインプットボックス内に
//http://example.com/index.php/shouhin?id=1234567890の形式で入力しました。



LaLaLaLove

リンク

2012/3/9(Fri) 23:06:41|NO.45319

  



ONION software Copyright 1997-2023(c) All rights reserved.