MySQLにサザエさんじゃんけん研究所のデータを突っ込む

概要

ネットサーフィンしていたらサザエさんじゃんけん研究所というのを知って、おもしろそうだったので、個人的な解析用に過去のじゃんけん結果を拝借して、とりあえずローカルのDBに入れました。

コード

# coding: UTF-8

import MySQLdb
import requests
import re
import datetime

d = MySQLdb.connect(host='localhost', user='foo', passwd='bar')
c = d.cursor()
c.execute('SET AUTOCOMMIT = 1')
c.execute('CREATE DATABASE IF NOT EXISTS sazae')
c.execute('USE sazae')
c.execute('CREATE TABLE IF NOT EXISTS rps ( '
              'id INT NOT NULL, '
              'on_air DATE NOT NULL, '
              'result TINYINT NOT NULL, '
              'PRIMARY KEY (id) '
          ') ENGINE = InnoDB')

for y in xrange(1991, 2015):
    s = requests.get('http://park11.wakwak.com/~hkn/data%s.htm' % y).content
    s = s.decode('shift_jis').encode('utf-8')
    for r in re.findall(r'第(\d+)回 (\d+)年(\d+)月(\d+)日.*? (.*)?\n', s):
        id = int(r[0])
        # 第253回が第233回になってるので直す
        if (233, 1996, 10, 13) == (id, int(r[1]), int(r[2]), int(r[3])):
            id = 253
        # 第416回が「チョキ(カツオ)」になってるので先頭2文字で判断する
        c.execute('INSERT INTO rps (id, on_air, result) VALUE (%s, %s, %s) '
                  'ON DUPLICATE KEY UPDATE on_air = VALUES(on_air), result = VALUES(result)',
                  (id, datetime.date(int(r[1]), int(r[2]), int(r[3])),
                   (u'グー', u'チョ', u'パー').index(r[4].decode('utf-8')[:2])))

まとめ

こんなテーブルができます。

mysql> SELECT * FROM rps LIMIT 5;
+----+------------+--------+
| id | on_air     | result |
+----+------------+--------+
|  1 | 1991-11-10 |      1 |
|  2 | 1991-11-17 |      0 |
|  3 | 1991-11-24 |      0 |
|  4 | 1991-12-01 |      2 |
|  5 | 1991-12-08 |      1 |
+----+------------+--------+
5 rows in set (0.00 sec)

グー(0)、チョキ(1)、パー(2)の回数は出せました。

mysql> SELECT result, COUNT(result) FROM rps GROUP BY result;
+--------+---------------+
| result | COUNT(result) |
+--------+---------------+
|      0 |           370 |
|      1 |           398 |
|      2 |           381 |
+--------+---------------+
3 rows in set (0.00 sec)

あとは何かおもしろそうな傾向がないか見てみたいです。

追記 (2014-08-17)

第1113回と第1114回のデータが取れていませんでしたので、取れるようにコードを修正しました。それに伴い、グーチョキパーの回数の結果の表も修正しました。

ネットワークエンジニアが特に読まなくてもよい本

はじめに

私は仕事柄、コンピュータネットワークについて知っておく必要があるので、 本を買って勉強することがあります。

そんな立場から、特に読まなくてもよいと思った本を紹介します。

ソーシャルでどうやって利益を上げるだとかそんな雑誌かと思ったら全然違って、 アムウェイがどうとかそんな内容です。

テクノロジー犯罪で遠隔技術ということで、トロイの木馬の被害報告みたいな本かと思ったら全然違って、 「私は電磁波で操作されている…」とか「集団ストーカーが…」といった報告集です。

このシリーズ好きなんですが(特に霊をおろすところ)、特に読まなくてよいと思います。

猿にいったい何解ると言うのか

はじめに

私は常々、猫にC言語はわからないのではないかと思っているのですが、 どうも最近猫だけでなく猿にもその傾向がみられるようなので、確かめました。

猿でもわかるもの

考察

猿、すごいですね(適当)。

ところで、この「サルでもわかる」って表現の出所を気になって調べたところ、 はてなキーワード

原型は「サルでも描けるまんが教室」(相原コージ・竹熊健太郎/小学館)であると思われる。

との記述を見つけました。 信憑性があやしいとは思いつつも、今度は「サルでも描けるまんが教室」について Wikipedia で調べてみたところ、

タイトルの「サルでもかける」は「猿の○○○」から来ている。

との、ちょっとショッキングな記述を見つけました(○は自主規制)。「猿がバンパーのところで」の奴です。

どうでもいいことを調べた果てに、下ネタにたどりつくという大変残念な結果に終わりましたが、 サルでもわかる系の記事を読んでもわからなかったときに、表現の出所がこれだと思えば多少気も晴れるんじゃないでしょうか。

将棋の棋譜中継のコメント欄を拡大する

はじめに

将棋の棋譜中継をよく見るんですが、たまにコメントが長くて スクロールさせないと下のほうのコメントを見れないときがあります。

前からちょっと面倒だなと思っていて、設定で何とかできないものかと いろいろやってみてたんですが、なかなかうまくいきませんでした。 が、最近 UserScript なるテクノロジーを知ったので、今回はそれを試してみました。

方法

棋譜中継は、柿木さんの「Kifu for Flash」の「将棋連盟版」というものを使用してるみたいで、 フリーで配布されてるのよりリッチになってるみたいです。 Flash のパラメータに「comment_line」というのがあって、例えば「10」などという値が 渡されてたりするんですが、これを UserScript を使って、無理やり「20」に変えてみます。

UserScript

KifuForFlash.user.js

// ==UserScript==
// @name        Customize "Kifu for Flash"
// @namespace   http://inaniwa3.hatenablog.com/
// @description This script can customize "Kifu for Flash" parameters.
// @include     http://live.shogi.or.jp/*
// @version     1
// ==/UserScript==

(function(){
    var ss = document.evaluate('/html/body/div/div/script',document, null, XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE, null);
    if(ss.snapshotLength == 1){
        eval(ss.snapshotItem(0).textContent.replace(/"comment_line", "\d+"/, '"comment_line", "20"'));
    }
})();

使い方

上のコードを「(適当な名前).user.js」というファイル名で保存します。 あとはブラウザに応じて、以下のページを参考に設定してみてください。

UserScript - DoldoWorkz

動作を確認したのは、 FirefoxGreasemonkeyアドオンと、 Opera です。 Chrome拡張機能では動きませんでした。原因はまだよくわかってませんが、 たぶんコードがまずいはずです。

結果

コメント欄が拡大できました。

最初の設定は面倒くさいですが、一度設定してしまえば あとは live.shogi.or.jp で中継される棋譜に関しては コメント欄の拡大が適用されるようになってるので、なかなか便利と思います。

というか、中継担当の方、 comment_line の値大きくしてください。

吉幾三の村に無いものにマッチする正規表現

はじめに

正規表現をうまく書けないので練習していたのですが、郵便番号にマッチさせたり、HTMLタグにマッチさせたりするのにも飽きてきたので、なにか飽きない練習法はないものかと考えました。

その結果、好きな曲の歌詞を使えばいいんじゃないかと思いつきました。歌詞は繰り返しもあるし、なんなら韻を踏んだりするので都合がよさそうな気がします。

今回はその一例、吉幾三の村に無いものにマッチする正規表現です。

SAMPLE INPUT

テレビも無エ ラジオも無エ
自動車もそれほど走って無エ
ピアノも無エ バーも無エ
巡査毎日ぐーるぐる
朝起きて牛連れで
二時間ちょっとの散歩道
電話も無エ 瓦斯も無エ
バスは一日一度来る

俺らこんな村いやだ 俺らこんな村いやだ
東京へ出るだ
東京へ出だなら 銭コア貯めで
東京で牛飼うだ

ギターも無エ ステレオ無エ
生まれてこのかた見だごとア無エ
喫茶も無エ 集いも無エ
まったぐ若者ア俺一人
婆さんと爺さんと数珠を握って空拝む
薬屋無エ 映画も無エ たまに来るのは紙芝居

俺らこんな村いやだ 俺らこんな村いやだ
東京へ出るだ
東京へ出だなら 銭コア貯めで
東京で馬車引くだ

ディスコも無エ のぞきも無エ
レーザー・ディスクは何者だ?
カラオケはあるけれど
かける機械を見だごとア無エ
新聞無エ 雑誌も無エ たまに来るのは回覧板
信号無エ ある訳無エ 俺らの村には電気が無エ

以下略

吉幾三俺ら東京さ行ぐだ」から引用

RESULT

$ ruby -e 'puts $<.read.scan(/(\S*?)も無エ/)' < tokyo.txt
テレビ
ラジオ
ピアノ
バー
電話
瓦斯
ギター
喫茶
集い
映画
ディスコ
のぞき
雑誌

考察

吉幾三の村に無いものがわかりました。ただ、よく見ればわかるとおり、「ステレオ」や「薬屋」「電気」などが抜けています。この正規表現では吉幾三の主張の一部が無視されてしまっており、課題が残りました。

まとめ

ちょっと頭を使うので、練習として自分にはちょうどよい感じでした。

他のお題として、「あなたが私にくれたものにマッチする正規表現」とか、「爆風スランプが無理だと言ってるものにマッチする正規表現」とかどうでしょうか。

地下トキワ荘の4コマ漫画を集める

概要

週刊誌 SPA! の投稿コーナーに掲載されている4コマ漫画が Web でも公開されています。 それらをまとめてダウンロードするという需要のないコードを書きました。

コード

#!/usr/bin/python
# coding: UTF-8

import re
import requests

for p in xrange(1, 19):
    c1 = requests.get('http://nikkan-spa.jp/bakasai_tokiwa/page/' + str(p)).content
    for node in set(re.findall(r'http://nikkan-spa.jp/bakasai_tokiwa/[0-9]+?"', c1)):
        print node[:-1],
        try:
            c2 = requests.get(node[:-1]).content
            r2 = re.search(r'<div class="sectionImgB"><img src="/wp-content/uploads/(.*?)" width="300"></div>\n(.*?)\n', c2)
            r3 = re.search('.*/(.*)', '/' + r2.group(1))
            with open('./out/' + r3.group(1), 'wb') as f:
                raw = requests.get('http://nikkan-spa.jp/wp-content/uploads/' + r2.group(1)).content
                f.write(raw)
            print 'OK'
        except:
            print 'NG'
            pass

カワイイをつくる

はじめに

「カワイイはつくれる」で思い出したんですが、昔「美人フィルタ」ってのがあったなーと。 で、作りたくなったので、作りました(フィルタを)。

アルゴリズムは こちら を参考にしました。

使ったもの

GNU Octave, version 3.6.2

しずちゃん(カワイイはつくれるのCMに出ていました)の画像

コード

function conv(fileIn, fileOut, coef)

imgIn = imread(fileIn);
imgIn = double(imgIn);
imgOut = imgIn;
imgOut(2:end-1, 2:end-1, :) \
    = imgIn(2:end-1, 2:end-1, :) + coef * ( \
      abs(imgIn(1:end-2, 2:end-1, :) - imgIn(3:end, 2:end-1, :)) \
    + abs(imgIn(2:end-1, 1:end-2, :) - imgIn(2:end-1, 3:end, :)) );
imwrite(uint8(imgOut), fileOut);

結果

> conv('shizuyo_before.bmp', 'shizuyo_after.bmp', -0.3)

 → 

まとめ

どうでしょうか。つくれたんじゃないでしょうか。

なお、係数を正にすると、逆のフィルタになります。

> conv('kawai_before.bmp', 'kawai_after.bmp', 0.4)

 →