HSPTV!掲示板

スレッド一覧 | 新規書き込み | 新着一覧 | 使い方 | 過去ログ

未解決

解決

停止

削除要請


	2010 0103	orihagan	sdim,bload命令について	15

orihagan

2010/1/3(Sun) 20:17:46|NO.29717

以前以下にてHSPのバイナリファイルにおける文字列検索を教えていただきました
書き込んで頂いた、または、閲覧して下さった方、ありがとうございました
http://hsp.tv/play/pforum.php?mode=all&num=29432

本題ですが
noteselとnoteloadから
sdimとbload
に変更して何回も試したのですが
未だに解決することができません
スクリプトはwoodfieldsさんが最終的に投稿したものをベースに
ところどころ変更しました
以下がスクリプトです



/*** 時間測定用のおまけ st, gt (スタートとゴール の差の時間mSec)***/
#uselib "kernel32"
#func QPFreq "QueryPerformanceFrequency" var
#func QPCount "QueryPerformanceCounter" var
#define st _t=0.:QPFreq _t : QPCount _t.1
#define gt QPCount _t.2 :title strf("%%.3fmSec",(_t.2-_t.1)*1000/_t)
/******************************************************************/

#uselib "kernel32.dll"		// マシン語実行用メモリ確保
#func global VirtualProtect	"VirtualProtect"	var, int, int, var
#define global mdim(%1,%2)dim %1,%2 :VirtualProtect %1,(%2)*4,$40,AZSD

#module
; bsearch 2006/03/29	Ver 0.9
// バイナリサーチ(BM法) : 開始index, bufポインタ, サイズ , 検索キー,検索キーの長さ
// statに開始indexからのバイト数が返ります。見つからない場合は-1
#defcfunc bsearch int i, int pbuf,int size, var key,int lkey
	if bm=0{ mdim bm,49 : pbm=varptr.bm
	bm. 0= $81EC8B55,$000400EC,$10558B00,$758B5653,$01FE8314,$324CB60F,$227557FF
	bm. 7= $4539C033,$928E0F0C,$8B000000,$B60F0855,$D13B1014,$0086840F,$3B400000
	bm.14= $EB7C0C45,$C68B7BEB,$000100B9,$00BD8D00,$F3FFFFFC,$FF468DAB,$C085C933
	bm.21= $F88B5E7E,$111CB60F,$9DBC8941,$FFFFFC00,$7CC83B4F,$8B49EBEF,$B60F0845
	bm.28= $B60F0104,$3BFF327C,$8A2B75C7,$8BFE165C,$418D087D,$381C3AFF,$F88B1C75
	bm.35= $7C8DF92B,$FF85FF37,$5D8B2674,$8A4F4808,$143A1714,$10558B18,$458BEC74
	bm.42= $04B60F08,$858C0301,$FFFFFC00,$7C0C4D3B,$FFC883B2,$C95B5E5F,$000000C3}
	prm=pbuf+i, size-i,varptr.key,lkey : return callfunc(prm, pbm, 4)
#global
/*************** サンプル *******************************/
dialog "",16
	fn=refstr		; 調べるバイナリファイル
	key= "aaaa"	: lkey=strlen.key ; 検索文字、長さ
	;key=$020102		: lkey=3		; 数値の場合
	exist fn ;ファイル確認
	size=strsize
	sdim buf,size
	bload fn,buf
	
	pbuf=varptr.buf				; 調べる先頭のポインタ
	des=dirinfo($10000)

st // 時間測定開始
	i=0 : n=0
	repeat
		if bsearch(i, pbuf, size, key, lkey)= -1 : break	// バイナリサーチ
		i+=stat : n++

		if n == 1 {
			; 最初のkeyまでのブロックのファイル保存
			sdim buf_block, i
			memcpy buf_block, buf, i, 0, 0
		}else{
			; keyとkeyにはさまれたブロックのファイル保存
			sdim buf_block, (i-o_i)
			memcpy buf_block, buf, (i-o_i), 0, o_i+lkey-4
			bsave dir_exe+"\\"+(n-1)+".BIN", buf_block, (i-o_i)
		}
		o_i=i

		i++
	loop

	if n != 0 {
		; 最後のaaaa以降のブロックのファイル保存
		sdim buf_block, (size-i+1)
		memcpy buf_block, buf, (size-i+1), 0, i+lkey-5
		bsave dir_exe+"\\"+n+".BIN", buf_block, (size-i+1)
	}
	dialog "終了"
	end

http://fs-cgi-basic01.freespace.jp/~hsp/ver3/hsp3.cgi?print+200601/06030052.txt
にてぷまさんのBM法を使用させていただいております

所々変更したのでおかしなところがあると思いますので、
ご指摘していただけるようでしたらお願いします
エラー内容が知りたいためonerrorはつかっておりません
またエラーが起きる場所はsdimのところのようで
error1
システムエラーが起きました
とのことです
以前と同様容量が低いものは動作するものの
容量が大きいものはこのようにエラーが起きます
自分が試した結果500MB位から怪しくなり600MB以上ですと完全に
エラーが起きます
ご指摘のほうよろしくお願いします

この記事に返信する

ANTARES

2010/1/4(Mon) 12:25:48|NO.29732

　システムエラーについては、よくわかりませんが、
下記のスクリプトでも発生するので、
HSPのバグあるいは何らかの制限に引っかかっているのかもしれません。



	i=680000000
	sdim buf , i
	sdim buf2,i
end

　ただ、最初の"aaaa"までは保存不要というorihaganさんの仕様から
すると、「if n=1 { …… }」の「……」部分は不要で、ここを
削除して他の部分のバグをとるとエラーは出ません。

inovia

2010/1/4(Mon) 13:41:07|NO.29740

ANTARES さんのスクリプトでは

OS : Windows Vista
物理メモリ : 2048MB
ページファイル : 4312MB

環境ではエラー発生しませんでしたが、

OS : Windows XP
物理メモリ : 512MB
ページファイル : 1039MB

ではシステムエラーになりました。

メモリ確保ができないとシステムエラーになってしまうのでは？
と思って



i=2147483647

に変更してVistaマシンで実行してみたところシステムエラーになりました。

orihagan

2010/1/4(Mon) 16:28:01|NO.29746

すいません返信が遅くなりました
返答ありがとうございます
PCの環境によって上手く動作するかしないか決まるわけですよね？
以上の解釈であっていますか？
ちなみに作成して実行した環境は
XPでメモリは1GBです
ノートPCなのでパワー不足なのかな・・・

A.C

2010/1/4(Mon) 20:03:26|NO.29750

こんにちは。

パワー不足というよりも、確保しすぎなだけだと思います。
順番にソースを読んでいくと、
例えば600MBのファイルを読み込む場合



sdim buf,size

この時点で600MBのメモリを食っていることになります。
次に、検索文字 "aaaa" が500MBの場所でヒットした場合、



sdim buf_block, i

この時点で500MB確保、つまり、計1.1GBのメモリを消費しています。
そして検索終了時にとどめとばかりに



sdim buf_block, (size-i+1)

で残り100MBを確保しているので
結果的にファイルのサイズx2（今回の場合は1.2GB）の
メモリを消費していることになります。
ガジェットのメモリ残量見てたらとんでもないことになってました＾＾；

100MBずつ読み込む（もっと少ないほうが良いかも？）など
とにかく確保量を減らしたほうが良いですねー。

orihagan

2010/1/4(Mon) 21:19:35|NO.29755

A.Cさん返答ありがとうございます
確保しすぎてしまうからエラーが起こると・・・
つまり実行ファイルにて処理を分割すればいいってことですかね？
例えば
600MBを読み込むとして
100MBずつを読み込むのを6回繰り返す・・・

連続で確保するから確保しすぎてしまうので
一回処理を中断することによって
確保したものを初期化？することは可能・・・
なのですかね・・・？

A.C

2010/1/4(Mon) 21:47:11|NO.29756

>600MBを読み込むとして
>100MBずつを読み込むのを6回繰り返す・・・
まー、そういうことになるんですけど、
解放しなかったら結局同じなので注意です。

>確保したものを初期化？することは
同じ変数をもう一度sdimするとOKです。



sdim buf,100000000 //100MB確保
mes "確保　残量"+sysinfo(35)+"byte"
wait 300
sdim buf,1 //解放
mes "解放　残量"+sysinfo(35)+"byte"

完全に解放はできませんけど（多分64バイト確保したままになるかと）
そこは目を瞑るということで。

つまり、流れとして



ファイルサイズを取得
↓
処理回数=ファイルサイズ/確保サイズ+1回
↓
sdimで100MB確保（ぶっちゃけ100MBでも確保しすぎなような）
↓
検索、ヒットしなければsdimでさっき確保した100MBを初期化、次の100MBを読み込む
↓
ただし、分割した部分をまたいで検索文字がヒットしては困るので
2回目以降は検索文字数前から読み込む。
例えば検索文字が "aaaa" の4バイト場合、
0～100,000,000 → 99,999,996～199,999,996 → 199,999,992～299,999,992 → ･･･
と4バイト前から検索するようにすれば取りこぼしがなくなると思います。
↓
検索が終わったらsdim 変数名,1で解放

こんな感じになると思います。

A.C

2010/1/4(Mon) 21:52:53|NO.29757

ちょっと訂正

0～100,000,000 → 99,999,996～199,999,996 → 199,999,992～299,999,992 → ･･･

こうじゃなくて
sdimで100000004バイト確保して

0～100,000,000 → 99,999,996～200,000,000 → 199,999,996～300,000,000 → ･･･

こうした方が計算しやすく、処理回数も合うんで良いと思います。

orihagan

2010/1/4(Mon) 23:30:42|NO.29761

返答ありがとうございます
今まで試していたので遅くなってしまいました
strsize/100000000+1(100MBを確保する場合のリピート回数)
というのは納得し
流れも把握しました
また、>>分割した部分をまたいで検索文字がヒットしては困るので
について悩んでいましたがこういう解決策があったんですね・・・
プラスになりました＾＾

しかし
いまいちスクリプトの書き方で悩んでいます・・・
一回NO.29717のスクリプトから離れて
考えたほうが良いんでしょうか？
ご指摘の方よろしくお願いします

A.C

2010/1/5(Tue) 00:36:57|NO.29763

いやいや、普通にループ処理をして、
1ループ目、最終回、その他で
sdimの確保量とbloadの読み取り量を変更するよう設定すればOKかと。
例えばNO.29717をいじるとすると、



	size=strsize
	sdim buf,size
	bload fn,buf

この部分を



	fullsize=strsize
	buf_size=100000000	;バッファサイズ
	repeat fullsize/buf_size+1
	title ""+cnt+"/"+(fullsize/buf_size)	;デバック
	wait 1
	//最初、最後、その他で分岐
	if cnt=0{	//最初
		size=buf_size
		sdim buf,size+1	//念のため1バイト多めに確保
		bload fn,buf,size,0
	}else:if cnt=fullsize/buf_size{	//最後
		size=(fullsize\buf_size)+lkey
		sdim buf,size+1
		bload fn,buf,size,cnt*buf_size-lkey
	}else{	//その他
		size=buf_size+lkey
		sdim buf,size+1
		bload fn,buf,size,cnt*buf_size-lkey
	}

こう書き換え、最後の辺りの

dialog "終了"

の上に loop を入れるだけですね。今回、バッファサイズを100MBにしていますが、10MB辺りにするとプログラムが長時間応答しなくなることもなくなりますのでオススメです。消費メモリも少なくて一石二鳥ですね＾＾あ、最後に sdim buf,1 もお忘れなくー

orihagan

2010/1/5(Tue) 02:21:58|NO.29766

返答ありがとうございます
ご指導の下動作することに成功しました
しかし
保存する際に
ファイルのよって様々なのですが(容量ごとに)
10MB,100MBでは保存される個数も違く(生成される個数)
うまく保存もされません(保存されない箇所もある)　
前に作ったもの(このページのトップにあるスクリプト)は
安定しているので(保存されるという面で、大容量は不可能だが)
それでできるファイルと比較してみた結果です

何が原因なんでしょうか・・・
質問ばかりですいません・・・

ANTARES

2010/1/5(Tue) 05:47:09|NO.29770

>何が原因なんでしょうか・・・
　スクリプトのバグである可能性が高いと思います。
分割読み込みの場合、検索文字列が分割される可能性を考慮しなければ
ならないため、非常に複雑なスクリプトになります。

>「if n=1 { …… }」の「……」部分は不要で、ここを
>削除して他の部分のバグをとるとエラーは出ません。
　最初の"aaaa"以降のサイズがあまり大きくないことが前提になります。

ANTARES

2010/1/5(Tue) 06:09:39|NO.29771

　読み込みを分割するより、出力サイズが大きかったら出力を分割する
という方が簡単でしょう。
　いずれにせよ、まずNO.29717のバグをとらないことにはどうにも
ならないと思います。

A.C

2010/1/5(Tue) 12:24:36|NO.29775

ああ、そうか
出力する方も分割されてることすっかり忘れてました＾＾；

元のソースを使って対策するなら、
最初の100MB検索でヒットした場合、
次の100MBの検索で最初にヒットした部分までを
bloadのオフセットを使って追加書き込み
（ヒットしない場合はその100MB全部を追加書き込み）
といった感じですかねー。
ただ、検索文字数分（今回は4バイト）ダブっているため
これも考慮しないといけなくなるんで…
うーん、結構大変な作業になりそうです。

skyblue

2010/1/5(Tue) 14:32:57|NO.29783

読み込みといえば
1024Bか1024KBつまり1Kか1MBのどちらかで読み込むのが普通だった気がします。
それと保存した後なら初期化には""を代入するのが手っ取り早い気がします。

システムエラーが出るのは仮想メモリの確保サイズと物理メモリのサイズを
超えるているからだと思います。つまりバッファオーバーフローが起きたから
エラーが出ているのだと思います。仮想メモリには現在使われていないプログラムなどが
入っており、物理メモリには現在使っているデータなどが入っており
A.Cさんの言ってたとおり、物理メモリの限界を超えているのに仮想メモリにデータなどを
移すことができないためにシステムエラーが出たのだと推測します。

orihagan

2010/1/5(Tue) 16:17:25|NO.29784

ANTARESさん
A.Cさん
skyblueさん
返答ありがとうございます

今までいろいろと保存するために書き換えていたのですが
保存されたものが読み込んだものより大きくなったり
保存される数が少なかったり多かったり・・・
やっぱり難しいです・・・