我发现有趣的事情之一是,尽管数据集之间存在一些相关性,但它们之间仍然存在差异。这表明人们们所听到的或周围的事物决定。 这让我有兴趣探索人们如何在社交媒体上谈论死亡——人类对话中是否存在这些差异?或者,当我们在网上公开发布信息时,我们是否更表面上关注事实和数据? 数据 本报告包含四个数据源,其中三个(CDC 死亡率、谷歌趋势和新闻报道)取自 Owen Shen 的Github(Owen 是 UCSD 的学生之一)。
与此同时,我通过Brandwatch Analytics检索了社交媒体数据。按照与上述数据集中相同的关键字细分创建查询(在线对话的搜索),以使数据具有可比性。我再次使用了六年的日 芬兰电话号码数据 期范围( - ),以使数据具有可比性。由于提及量较大,因此使用了 的提及样本。 下图列出了十大死亡原因(根据疾病预防控制中心的 WONDER公共卫生数据数据库)以及凶杀、恐怖主义和吸毒过量,这些原因是由于媒体对每一个原因的高度关注而选择的。
致命数据 死亡原因,按实际死亡百分比排名 死亡原因 平均死亡百分比 心脏病 癌症 下呼吸道疾病 车祸 中风 阿尔茨海默氏病 糖尿病 肺炎和流感 肾脏疾病 过量 自杀 杀人 恐怖主义 < 数据来自 CDC, - 年测量。 代表死亡原因数量的份额 正如我们所看到的,心脏病和癌症是最大的杀手,年至年间平均占所有死亡人数的一半以上。
|