0%

全国一二线城市中你最不喜欢哪个城市?

作为已在成都定居的非知名蓉吹 ,初见此问题我的内心深处是拒绝的。我一定要为成都翻身!

然而…..

该问题下的统计结果

该问题下的统计结果
成都面前,所有的城市都均沦为了长尾 。

不对! 一定不是这样的,一定是因为成都人多,因为成都知名度高,由于幸存者偏差导致的成都的票最多,说不定隔壁问题投票最多的也是成都呢?

全国一二线中你最喜欢哪个城市?

镜像问题下的统计结果

镜像问题下的统计结果
果然,最喜欢的城市也是成都。那有没有一种方法能避免幸存者偏差呢?我们同时统计两个问题的回答,并用投票率来统计对城市的投票。比如喜欢城市的问题下共有100个回答其中有10个喜欢某城市,其对某城市的投票率为10%不喜欢城市的问题下共有1000个回答其中有100个回答不喜欢该城市,那么该城市的投票率为-10%。两者相加即为该城市的总投票率。

字符的大小为投票率,红色为正值即喜欢该城市,黑色为负值即不喜欢该城市

得~ 还是成都荣登最不喜欢城市榜首。

GitHub - sz-p/zhihu-question-485404380: 知乎【全国一二线城市中你最不喜欢哪个城市?】

该程序可统计该问题下所有回答中所出现的城市名称,并生成词云。

注:该模型非常粗糙,其自然语言处理部分仅为统计城市名称出现的次数,最不喜欢城市回答中普遍会出现多个城市名称用于比较,所以会导致投票率相较于一般仅出现单个城市名称的最喜欢某城市的回答较高。所以统计结果更偏向于负面。