何気ない記録

なんとなく自分の意見を書き記すときにつかいます。つまり不定期更新です。

Exploratoryの記事は根本的に間違っていて言葉もでない

 

Appleの汚い移動データを加工したらわかった東京の厳しい現実 - Qiita

データの加工もましてや分析や解析もしていないのでは?移動距離や時間と感染リスクの高い行動とは必ずしも同一ではない。また、そもそもリスクの高い行動は一部の人間が起こすもので人口密度が高い方が平準化される

 

こういった誤った情報分析をサラッと出すのはまずいと思うんだけど。

 

まず、データの認識から間違っている。

このデータはAppleのサイトにも掲載されているが、あくまでも2020年1月の基準日と比較した場合の、Appleのマップに対する経路探索に関する移動量(恐らく経路探索での起点と終点の距離の事)についての、都市毎の増減を示すもの。

 

データ自体の認識として注意すべき点としては、基本的な話として、まず相対量であり絶対量ではないという事、次に、注釈にも書かれているが人口密度等の考慮はない(都市毎の相対的な差異を示すだけ)という点、そして、それは実際の移動量ではないという事、これらについて最低限認識する必要がある。

で、この時点で認識すれば、このデータ単体で何かの結論を出す事は基本的に不可能である事が、一般的にデータ解析を行う人間であればほぼ断定できる。

 

そもそも特定の集団のある基準に対する相対量でしかなく、且つ、その相対量ですら、人口密度も実際の移動距離との相関すら配慮されていない。

唯一Appleが関係性で認めているのは、その相対量とAppleマップの季節ごとの使用量との関係でえいば傾向として一致しているとの事に過ぎない。

 

そういった事実を把握すれば、精々以下の事しか言えない。

 

・2020年1月13日頃を基準として日頃からAppleマップを使っている東京都や大阪府のユーザーについては、その後の傾向として他の日本の都市の同条件のユーザーと比較すると検索結果の移動量は少ない傾向にある。

 

つまりはその程度でしかない。

 

普通に考えて、Appleマップの利用者とGoogleマップの利用者の比率はどの程度なのだろうか、とか、そもそもこのデータはスマートフォンのみなのか、それともそれ以外も含むのかとか、移動量の相対的な量というは同一個人における重複利用については配慮された結果なのか、とか、考えればきりがない課題が見つかる。

 

単純に言えば、利用者が特異な状況下ではそもそもデータがあてにならないし、母数に地域毎の偏りがあれば、それでも役に立たない。

その上、そもそもこの相対的な移動量自体が実際の移動量の傾向と一致しているのかという事自体が確認されていない(Appleは季節毎のAppleマップの利用量の傾向と一致しているとしかいっていない)為、そういったデータの確からしさすら何もわからない。

 

その為、わかる事は絶対的な事ではなく、結局は特定条件下での相対的な関係性のみに過ぎない。

 

その事を分析や解析に関わる人間が、理解していないのであれば、かなり厳しいと言わざるを得ない。

 

また、仮にそういった基本的な思考が欠落したとしても、結論のまとめには、普通はならない。

データに基本的な情報が欠落していたとしても、当然そこから導き出せるいくつかの可能性や傾向というものは確かにある。が、それは前述した精々「ある条件下での相対的な関係性」というものに過ぎない。

 

にも関わらず「東京の厳しい現実」のような謎な(いや、事実の方だけをみれば、確かに残念ではあるが、その話と分析や解析のまとめ方とは別の話)まとめをするのは、凡そ、本人にデータを見る能力が根本的にない(ソフトは使えるが、そういった事をやるのが初めて等)か、または、自分の中で既に一つの仮説があった/見聞きしていた為、結果的にその思い込みという間違った認識でデータを眺めてしまい、思い込みのまま、データに対するまとめとして言葉をつづったかの何れかかと。

 

正直厳しい。

 

これは社内で一度確認をだれかしなかったのか。

データ分析や解析をする人間が見れば「これはちょっと認識/結論がおかしい」とか「前提条件の認識がズレている」とか、一目でわかる程度のものなので、ちょっと手を抜きすぎだと私は思う。

 

そもそも勝手なまとめは不要だったと思う。

自分でも冒頭で「Appleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法」と述べていて、単純にそこまでの操作に関する説明であれば、別になにも間違いはなかった。

が、その先が完全に間違っていて、結果として、分析や解析には使えないのか、それともそのような知識が組織として欠落しているのか、という話になってしまっている。

 

完全に記事の目的が執筆者の手によって書き換わってしまっており、これでは無意味どころか、マイナスでしかないと私は思うのだが。

これは企業が製品の紹介として執筆した記事なので、単純に個人ではなく組織としてそういった事ができないという事を露呈してしまったという結果であり、非常に残念なマーケティングの実例だと思う。

 

最後になるが、仮にこのデータが相対的なものでもなく、且つ、より各地域の特徴をとらえたデータであったとしても、断定的な事は言えない。

 

というのも、リスクと行動の相関についての配慮や、そもそも集団内のリスク行動者の割合であったり、そういったものが明らかでないと断定はできない。

 

リスク行動とは集団の全体が行う事はなく、基本的に一部の構成員が行う事が一般的であり、そういった点でも、単純に行動自体等価のものとして並べても意味はない。

仮に移動量であれば、地域や手段といった2次的な情報も含め整備が必要で、その上で、そのリスク行動とそれ以外の行動の割合やその結果というものも重要となる。

 

「自粛をした」という事が、「リスクの低い行動を行った」と定義するのか、それとも「移動量が少ない事」と定義するのかにもよる。

前者であれば明らかにデータからは読み解く事はできないし、現実的にそれを補完できるようなデータも私には存在すらわからない。

唯一の可能性は保健所や国が持っている、実際に感染した人物の行動履歴との関係によるものであれば可能性はあるが、それはそれほど細かいデータが全ての都市においてだされているわけではない。

後者についてでいえば、読み解く可能性がゼロとは言えないが、それですらいくつかのハードルはある。

 

結局、このデータから「自粛をした」と断言するのは不可能で、やはり冒頭の「2020年1月13日頃を基準として日頃からAppleマップを使っている東京都や大阪府のユーザーについては、その後の傾向として他の日本の都市の同条件のユーザーと比較すると検索結果の移動量は少ない傾向にある」としか言えず、特段それが自粛行動と呼べるものなのか、単純に利用者の特性によるものなのか等他の情報がないと何も言えない。

 

結局はその程度の話でしかなく、それ以上でも、それ以下でも、何でもない。