ページ

2018年12月12日水曜日

いそいそとパチスロのデータ取りをしてる

段々と寒さが増してきましたがいかがお過ごしでしょうか。ぼくは懐も寒い!どうも、kawatiです。


パチスロ、マイナス域に突入。


以前ビッグフィーバービギナーズラックで1000円でBIGを引きウヒョヒョw楽勝でござるなwと思って1000円だけ…1000円だけ…最後に3000円だけ…と回数を重ねていった結果勝った部分は見事に消えてなくなりました。

コレが先月の話。

大事なのはここからです、今月はついに-3000円です。馬鹿ですね。

ある日がイベント日と噂されている店舗が帰り道に2つあったんですね、学校からの。授業中必死にデータサイトを見ながらコレよくね?と思われるジャグラーをリストアップしていざ入店と言ったのですが狙い台はやはり空いているわけがなく1店舗目はそのまま出たわけです。
2店舗目はそれなりによくね?って思いリストアップしていたハッピージャグラーが空いていたのでそれに座りました。合成1/140。RB先行の2000ゲーム。ハマりは102とコレ打てるんちゃうか?と座ったわけです。3000円が秒で消えました。使うお金は3000円までと決めていたので泣きながら帰りました。となりのタバコを吸ってるお姉さんはあのボーナス音楽を2回ほど鳴らしておりました。顔は見えなかったですがきっと彼女は可愛かったことでしょう


そんなわけでもう泣きたくなるわけなのですが、この店舗2つはデータをスクレイピングしていなかったわけです。

なぜならこの2つのデータサイトはJavascriptが走っておるわけですね。つまりはHTMLゲットしても数値が入ってこないわけです。最初コレも集めるかと思って以前描いたやつをURLのみ変えてやったら見事に出てこない。

なので、わざわざseleniumを使うことにしました。以前のRedditエロ画像記事以来の登場。彼を使うことでなんとJavascript搭載のサイトからでも数値をとってこれるとのこと。

やってみたけど取れてきたのは良いが肝心の欲しいデータ、BBやらRBやら総回転数が見当たらない。よくHTML文をみたらそのデータが入ってるところテーブルになってたんですね

とりあえずググるとpandasを使えば簡単ということらしいのでそれをつかってやってやりましたらきれいな行列が帰ってきて僕は感動した。コレが文明の利器。


まあ、あとは簡単です。この行列の位置を指定して目的のデータをゲット。

こうして目的のデータを手に入れてCSVファイルにすることができましたとさおわり



ただなぜかあれなんですよね、全台データ取ろうとしたらsingle-out-of-boundsみたいなのがでてくるわけです。おかしいなと思い数を減らすとできる。しかしたまにでる。
未だにこの理由がわからなくて全台データを取ってくることができず、ジャグラーのみのデータしか拾えない。

自分の考え的には多分値を取得する前にデータを拾おうとしてるんじゃねえかと思ってスリープを何秒か入れるかしてみたんですけどよくわからず。

Seleniumのほうに取得するまで待ってから処理するやつがあるらしいのでそれをやってみるのもありですがどなたかわかりませんか。


さて、もう一つのサイトもまた上のような感じのサイトである。というかテンプレがほぼ同じだ。しかし一番違うのがPCブラウザからアクセスすると、503エラーが帰ってくる。厳密には503を装ったページがでてくる。つまりPCから見れないというわけですね

Chromeのデベロッパーツールからスマホエミュみたいなのを開いてやると出てくる。ははーん。なるほどねと・

とりあえずググる。やっぱSeleniumでモバイルエミュ使えるやんさすがすぎやんとなる

適当にSeleniumのドキュメント見ると優しすぎることにPythonでのエミュ例文まであった。それをコピペして動かしたら出てきたので私のかちですおわり


あとはまあデータを集めるだけですね。噂を聞くと12月と1月は回収に入るホールが多いとのことなので見に徹します。おかねもないことですしね。

0 件のコメント:

コメントを投稿