Tag Archives

15 Articles

名古屋の交通事故が多い原因

交通事故による死亡する人が愛知県がトップです。
私が自動車学校を卒業するときも、交通事故を起こさないように作文を書かされました。
なんで、交通事故が多いのか、県別のデータがいろいろあったので調査してみました。

まず、データを集めます。
事故に関係がありそうなデータに狙いを決めて集めます。
重要なのは県別、最新データであるということです。
中々県別というのは見つかりませんが探しましょう。
人口、車の台数、道路の総延長、面積、高齢者の人数など集められました。
電車の運賃が高い※と、車乗る人が多いと思ったのですが、電車の運賃に関するデータはありませんでした。
※名古屋は地下鉄の初乗りが200円と高い

とりあえず集めたデータは、次元が異なる(人数と面積を比べられない)ので標準化が必要です。
標準化とは分散が1、平均を0にすることです。
サンプル(PDF)

次に、正規化したデータを使用して、死亡順のに降順ソートします。
降順ソート(PDF)
これをみることで、交通事故死亡者数が多い県は、どの項目が大きくなっているか分かります。

より正確に、関係性を調べるため正規化したデータから共分散行列を作成します。
相関係数を作ることで、より統計学的に調べられます。
相関行列(PDF)
これを見ると、相関係数が0.94と最も高いのが乗用車数の数ということが分かります。
つまりこのデータからは、乗用車数が多い県=交通事故の死亡者数が多いと言えます。

改めて、死亡者数の降順ソートを見ると、たしかに乗用車数が関係があることが分かると思います。
ただ、福岡県は乗用車数が少ないのに比べて事故が多いようです。
他の原因があると思います。恐らく人口が多いのが2番目の原因だからでしょう。

もっとたくさんの県別のデータがあればより色々とわかると思います。
重回帰分析を行う場合は、それぞれのデータ同士の相関が大きいため、正確な情報を引き出せないと思います。
一度、主成分分析で調査しKL変換で次元数を減らしたうえで調べる必要があります。

また、実際は相関係数などを調べた場合、その値が妥当かどうか調べる必要があります。
例えば、サンプルの数が少なければ、正当性が小さくなります。
調べた値にあった統計手法を利用して、検定をしましょう。

今回使用したデータを他の人でも調べられるように公開することも必要です。
調査にしたデータ(XLSX)

乗用車を持っている人が多いのは、土地が広いのと
市街は電車が発達してないのが原因だと思います。

愛知県が交通事故数のトップではなくなる方法は、愛知県内の車の所用率を下げることですが、
・土地が広いので小さくし、電車でどこにでもいけるようにする
・工業都市をやめて娯楽産業を増やし、電車でいける範囲に楽しめる町をふやす
……というのは、現実的ではないので
てっとりばやく考えるなら
「そもそも車の所用率を考慮するようなランキングを考える」
でしょう。

なめるとは

電車の中で、知らない人物の会話を耳にすると
「すぐに謝ると、なめられる」
と主張していた。

また、「なめてんじゃねーぞ」
というセリフを耳にしたことがあるが、
どういう意味か深く考えていたことはなかった。

改めてこの機会に考えてみようと思う。

まずよく耳にするのは
「テストなめてたー」
みたいな物や概念に使う場合である。
この場合は、「油断していた」
「簡単だと思っていたが難しかった」
という意味で使っているのだろう。

「仕事なめてたー」
なら「仕事が思ったより大変だった」
とかそういう意味だろう。

「テストをなめる」
この場合は、A. 「テストなんて余裕余裕」
他の場合に、B. 「態度が悪い感じうける」
2つの意味があると思われる。

「仕事をなめる」
この場合も、A. 「仕事なんて余裕余裕」
他に、B. 「態度が悪い感じで仕事をする」

ここで、B. の「態度が悪い」というのは
「なめた態度」とも呼ばれている。

従って、B. の意味で使う場合は、
「テストをなめた態度でうける」
「仕事をなめた態度でうける」
上記のような文章を省略しているものと考えられる。

さて、ここで最初に戻ろう。
「人物をなめてた」
と「物」ではなく「人」の場合はどうなのだろうか。

この場合は、
「人物が思ってた以上に優っていた」

そういうことだろう。
この「勝る」というのは、人によって例えば、
「勉強ができる人だった」
「サッカーがうまい人だった」
とまちまちである。

では、
「すぐに謝ると、なめられる」
とはどういう意味でのなめられるだろうか
これは先ほどの「なめた態度をとられる」
と同じだと思われる。

つまり、「すぐに謝ると、態度が悪く扱われる」
ということを、その電車の乗客の人は主張していていたのだろう。

ところで、「態度が悪く扱われる」とはどういうことなのだろうか。
これは、次のようなことを指すと仮定する
・「尊敬語」「謙譲語」「丁寧語」を意識しない。
・「ちっ」って言う。
・怒った表情をする(眉をひそめる)
・怒ったしゃべり方をする(大きな声で、高い声を出す)
・大げさな動作をする

もし、上記のことを「態度が悪い」と考えると。
「すぐに謝ると、態度が悪く扱われる」というのは、
私は間違っていると思います。

次に、
「なめてんじゃねーぞ」
とはどういう意味だろうか。
これも、上記のように
「態度を悪くしてるんじゃねーぞ」
という意味でとらえるのだろうか。
しかし、一般的に、態度を悪くしていないのに
「なめてんじゃねーぞ」
と言っている場面とか、想像つく。

となると、
「なめてんじゃねーぞ」
は、どういう意味なのだろうか。
これは使用されている場面から言えば、
「私はあなたが嫌いだ」という意味だろう。

つまり、
「なめてんじゃねーぞ」
の返し文句として
「なめてません」
というのではなく、
「すみません」
と謝るのが正解なのである。

でも、
「すぐに謝ると、なめられる」
っていう考え方の人に
「なめてんじゃねーぞ」といった場合、
上記のように謝ると、逆に「なめられて」しまう。
しかし、謝らないと自分が「なめて」しまう側になるという
不思議なことが起きる。

これは一体どういうことなのだろうか。
詳細は、追って報告したい。

プログラミングのアイデア1

適当に思いついたプログラミングアイデアのメモ。

・オートフォーカス
オートフォーカスとはカメラのピントを自動で合わせるもの。
ピントがあっているということは、画像がクッキリしているということ。
クッキリしているということは、高域の周波数成分が大きいということ。
ということで、ピントを段々いろいろと試していって、
もっとも高域の周波数成分が大きくなるところを探す。
そこがピントが合っている部分と考えられる。

・文章をスキャナで取り込んだ画像の傾きの自動補正
画像を大津の判別分析法とかで2値化する。
2値化した画像に対して、毎行(x軸方向)ごとの黒色の値をカウントする。
このx軸方向にカウントした値の列をベクトルとみなす。
ここで、画像が傾いている場合は、このベクトルの各値が滑らかなにつながっていると予想される。
従って、あらゆる傾きに対して、上記のベクトルを調べる。
このベクトルの中で、もっとも高周波数成分が含まれる傾きが、
画像が水平になっていると思われる。

・文字列のあいまい検索
検索したい文字列を X
Xを用いて検索する文章を Y
まずXに含まれるワードを保存しておく。
(漢字とか、カタカナとかでワード判定。あるいは辞書を使う。)
Yに対して、文章を句読点で区切りを分ける。
各文章ごとに、上記のワードを調べる。
全てのワードが含まれていれば、その文章に検索したい情報が含まれると考えられる。
あるいは、Y全体に対して上記のワードがどこに含まれるか調べる。
ワードが集中している箇所が、Xのことが書いてあると考えられる。

第1回涙目ニュース速報スレッド調査

前々から一度やってみたかったニュース速報の第1回スレッド調査をします。
この調査は、個人的にやっており正式なものではありません。


方法

2ちゃんねるの『涙目ニュース速報@2ch掲示板 2ちゃんねる壊滅、元に戻るのは・・・二年かかる』板の
スレッドを取得して、上位100スレッドに対して下記の項目に当てはまるか調べます。
それぞれの項目が当てはまったので悪いとかそういうのが目的ではありません。
知らない人は少ないと思いますが、2ちゃんねるとは日本最大規模の掲示板です。
ほとんどの板で、匿名希望で書き込みされており、匿名が暗に推奨されている特徴を持っています。


項目リスト

タイトル不一致
ソースと全く関係ない内容のタイトル
タイトル嘘
ソースに書かれていない内容
タイトル煽り
タイトルに煽りを入れている
韓国
韓国関係のニュース
中国
中国関係のニュース
日本社会
日本のニュース
コンピュータ
コンピュータ関係のニュース
ゲーム
ゲーム関係のニュース
事故
事故関係のニュース
犯罪
犯罪関係のニュース
アンケート
意見を求めることが目的であることが
あからさまにスレッドタイトルに現れている
ポジティブ
主観的になんか明るくなるニュース
カウント中によく分からなくなった
ネガティブ
主観的に暗いニュース
カウント中によく分からなくなった

.

正直一回目ということで色々項目を考えましたが、
調べていくうちに、これかぶってね?
みたいな項目があったので、それほどまで厳重に調査していません。

例えばアンケートスレッドは、意見を求めることが目的ですが、
「タイトル煽り」も意見を求めることが目的なのでかぶっているといえばかぶっています。

また、実際のソースに「ポジティブ」などの話があったとしても「タイトル不一致」の場合
タイトルはスレッドのお題なので、「ポジティブ」にカウントしてません。
タイトルがポジティブならカウントしますが。

あと、カウント中、「タイトル不一致」と「タイトル嘘」の線引きがよくわからなくなった。
ソースに全く書いていなくて、ソースと関連なくてニュースとも関連ない場合とかは
両方チェックがある場合があります。まあここは主観なので、
今度やるなら、もうちょっと定義をしっかりしたいです。


結果

エクセルデータ(*.tsv)

ゲーム関連が少なかったのが意外でした。
調査時期にもよると思いますが。
以前はよくゲームのハードのスレッドが立っていた記憶があります。

タイトルに煽りをいれるのはやはり多かったです。
週刊誌のタイトルも煽りを入れないと売れないように、
煽りを入れないとスレッドが盛り上がらないのでしょうがないとも言えます。

スレッド伸び率と、上の項目との相関係数とかも面白そうですね。
ただ伸び率といっても、時間帯によって変わってくるし現実は難しそうです。

タイトルに嘘や不一致は5スレッドに2つぐらいは含まれているようです。
タイトルは、スレッドの主題を決めるものなので、ここは注意したいところです。

項目によっては主観的に決めるのも多かったので、
どのように決めたか気になる方もいると思います。
用意したタブ区切りのデータで自由に検証して下さい。

同族嫌悪とは何か part2

以前、「同族嫌悪とは」という記事を書きましたが、
もう一度改めて考察してみた。
ちょっと書き方が変かも( 一一)


例えばお米の中に虫が湧いたとする。
もし虫を除去できても、他のお米も心配になるだろう。

若者の凶悪な事件が起きたとする。
すると、最近の若者なら事件の犯人ではなくても怖い印象を持つだろう。
この人も事件を起こさないのだろうか、と。

これらの例は、誰しも考えることだろう。
あるグループがあり、その中の一つでも悪い物が見つかれば、グループ全体を軽蔑してしまう。

なぜなのだろうか。
母数などを決めて確率を実際に計算したわけではない。
検定など勿論行なっていない。
でもこのようなニュースを聞くだけで、対象が属しているグループ全体が
対象と同じような特徴を持つと錯覚してしまうのだ。

実際は自分が認識しているようなことが、案外間違っていることも多いのかもしれない。

こんな話を続けてきたが、認識してしまう側には今回は着目しない。
今回焦点を当てたいのは、グループの中にいる人たちである。

グループに属する物たちは、自分以外の人が不祥事を起こすのを
出来れば避けたいと考えているだろう。
なぜなら、1人でも不祥事が出れば自分もそのグループに属しているので、
同じような不祥事を起こす仲間だと思われてしまう。

自分は何もしていないのに、ある一人だけが不祥事を起こして、
自分も非難の対象となったとしたら、その不祥事をした人を攻めるだろう。
その不祥事をした人のせいで、世間の目が冷たくなった。どうしてくれるんだ。と。

そういう時にネット上で、「不祥事をした人を攻める人」に向かって発言する単語がある。
それが「同族嫌悪」というネットの俗語なのではないかと思う。

「不祥事をした人を攻める人」も同じグループに属しているんだ。
客観的な根拠はないけど、こいつも同じような人物だろう。
そういう人に責める言葉として、「同族嫌悪」があるのだ。

同族が、自分が属しているグループの中で不祥事を起こした人を差している。
同族嫌悪とは人間にとって、誰しもが持っているごく普通の感情だと言えるのではないだろうか。

%d人のブロガーが「いいね」をつけました。