hspinetで取得して、utf8n2sjisでANSIにしたやつが変数に入っています。
この変数から<title>と<link>に挟まれた文字を取り出したく、試しに以下のコードを作りました。
notesel Nbuf//ここにhspinetでゲットしたデータが入っている repeat notemax//保存するとWindowsDefenderがうるさいので、note系で処理 noteget tmp,cnt//一行ずつ取る(<hoge>あああ</hoge>みたいに) tmp=strtrim(tmp, 3, '\t')//TABをなくす tmp=strtrim(tmp, 3)//空白をなくす if instr(tmp, 0, "<title>")!=-1{//もしも先頭が<title>なら split tmp, "<title>", tmp//(あああ</hoge>的な) tmp=tmp(1)//<title>でsplitして後をとる split tmp, "</title>", tmp//(あああ的な) tmp=tmp(0)//</title>でsplitして前をとる dialog "ゲット "+tmp } loop
さて、問題が二つあります
・改行コードがCRLFでない場合、notegetがうまくいかない
https://gigazine.net/news/rss_2.0/
みたいなページだと一気にたくさん釣れてしまう。
(<title>あ</title><hoge>a</hoge><title>い</title> →あ</title><hoge>a</hoge> → '')
・改行がそもそもない場合、うまくいかない
www.google.com
のhtmlみたいに、敷き詰められてる場合。
本当はXML専用の解釈装置があればいいのですが...
ActiveXやVBSは非推奨な今、
newcom oDom,"Microsoft.XMLDOM"
もできませんから...