设为首页|收藏本站|
开启左侧

[闲聊] 【数据分享】疫情数据

[复制链接]
98971 1
lover99918 发表于 2022-6-12 11:12:49 | 只看该作者 打印 上一主题 下一主题
 

  新冠疫情自爆发以来,在全世界已经累计确诊了1000多万人,何时能得到有效遏制依然难以预估。
作为全球最重要的公共卫生事件,新冠疫情对全世界的经济产业、城市运行等都将产生深远影响。对于新冠疫情本身发展及其对各行各业影响的研究也是各个学科的重要议题,而这些研究都基于准确的疫情数据。
疫情爆发以来,各国政府及组织通过多种渠道发布了形式各样的疫情数据,但是大多数据并不能直接用于科研,主要表现在:
①多为零散数据
②数据颗粒度较粗
③缺少历史维度的数据
④形式多为图文,缺少结构化数据
数据下载链接:百度云下载链接

今天我们整理了一些比较优质的数据来源分享给大家,包括:
一. 政府数据开放平台公布的疫情数据
二. GitHub上分享的疫情数据
三. 其它来源的疫情数据

另外,我们也收集了疫情数据相关论文供大家参考。

一:政府数据开放平台公布的疫情数据

随着政府对数据开放的重视,越来越多的各级政府建立了数据开放平台,我们对国内发布有疫情数据的政府数据开发平台进行了整理。
本文主要以山东省和北京市政府数据开放平台上发布的疫情数据为例进行介绍。其它可以查到的包括四川、广东、深圳、济南、青岛和贵阳政府的数据开放平台放在了链接里,大家可以自己去研究:
https://share.mubu.com/doc/AsXBCDXCqG
1.山东公共数据开放网
山东公共数据开放网(http://data.sd.gov.cn/)上公布了由省卫健委、济南市、淄博市、青岛市卫健委等发布的九个疫情数据集。
对于每一个开放数据集,平台都提供了基本信息、数据项、数据预览、数据分析、关联信息、文件下载、API服务等信息内容和服务功能。
数据集名称及数据项:


【数据分享】疫情数据 第1张图片

数据预览:
我们以“山东省新型冠状病毒感染的肺炎疫情情况“数据集为例来预览下数据。


【数据分享】疫情数据 第2张图片

注:
该平台还提供数据分析功能,可根据自己的需要筛选条件直接查看可视化图表。其中,山东省新型冠状病毒感染的肺炎疫情情况”将省内各地级市每天发布的数据都整合在了同一个数据集中。
2.北京市政务数据资源网
北京市政务数据资源网(https://data.beijing.gov.cn/)公布了北京市卫健委提供的“某日北京市新型冠状病毒感染的肺炎信息文件”、“北京某日新冠肺炎新发病例活动过的小区或场所”两个数据集。
平台提供了两个数据集的文件下载、API接口信息,并提供了新发病例活动过的小区或场所的可视化地图和累计按区分布图。
数据集名称及数据项:


【数据分享】疫情数据 第3张图片


数据预览:
我们以“某一天北京市新型冠状病毒感染的肺炎信息文件“数据集为例来预览下数据。


【数据分享】疫情数据 第4张图片

注:
点开“下载”后,可获得一个数据包,北京市每天发布的病例信息都整合罗列在一起,并每日更新。点开其中的一个数据集就能得到一个EXCEL的表格,该数据集包括了年龄、性别、发病时间和初次就诊时间等数据项。
还有些省市自治区可能没有数据平台或平台里没有疫情数据,那么就需要小伙伴们自行去各级卫健委的通告里去寻找了,或用下面的第三方收集卫健委数据整理的数据集。
这里也附上部分省市、自治区卫健委的网址:
https://share.mubu.com/doc/2ssFAvG1e-G

二:GitHub上分享的疫情数据

GitHub作为一个开源的托管平台,上面也分享有一些比较好的疫情数据集,下面将提供三个国内团队(或个人)分享的数据集和国外公认比较好的由霍普斯金大学提供的全球疫情数据集。
其中,国内团队提供的数据集,相比霍普斯金大学提供的数据集来说,国内数据的整理更为精细。
1.国内团队(或个人)分享在GitHub上的疫情数据
【1】Wuhan-2019-nCoV(2019-nCoV全量每日统计数据)
数据网址:
https://github.com/canghAIlan/Wuhan-2019-nCoV
数据来源:
世界卫生组织、中国国家卫健委级部分下属卫健委、Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China、Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia
数据说明:
本项目记录了2019-12-01日至今,每日精确到国家、省、市的确诊、疑似、治愈、死亡人数。也包含全球数据。
2019-12-01至2020-01-02数据来自asycns提供的实验室确诊数据(实验室论文原文)。
2020-01-02至2020-01-10数据无变化。
2020-01-10至2020-02-06数据来自国家、各省、武汉市卫健委疫情通告。
2020-02-07后数据从今日头条接口采集,每小时57分自动更新。国家、省级历史数据会根据卫健委数据更新,市级历史数据与卫健委数据有差异(略小于)。
数据各字段已标准化,国家、国家代码遵循ISO-3166标准,省、市遵循中华人民共和国民政部2019年中华人民共和国行政区划代码。

【数据分享】疫情数据 第5张图片

数据格式:
csv、json、xslx
注:
提供俩个API数据接口,并提供省市区、国家代码,数据仍在更新。

【2】DXY-COVID-19-Data(2019新型冠状病毒疫情时间序列数据仓库)
数据网址:
https://github.com/BlankerL/DXY-COVID-19-Data

【3】COVID-19-Epidemic-Dataset
数据网址:
https://github.com/Estelle0217/COVID-19-Epidemic-Dataset
这俩个数据集的数据详情也详细写在了这个链接的文档里,我们就不详细介绍了,需要的小伙伴可以点开查看或者直接点击相应的GitHub网页查看:
https://share.mubu.com/doc/3x70-dR1mqG

2.COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
(约翰·霍普金斯大学系统科学与工程中心(CSSE)新冠肺炎数据仓库)
数据网址:
https://github.com/CSSEGISandData/COVID-19
数据来源:
见GitHub页面
数据说明:
自1月23日发布COVID-19 全球仪表板以来,此项目已成为全球范围最为公认的疫情可视化平台。这个数据集是2019年由约翰·霍普金斯大学系统科学和工程中心(JHU CSSE)运营的新型冠状病毒视觉仪表板的数据存储库。此外,由ESRI生活地图集小组和约翰霍普金斯大学应用物理实验室(JHU APL)提供支持。


【数据分享】疫情数据 第6张图片

数据格式:
csv
注:
全球范围最为公认的数据,且仍在更新。

三.其它来源数据

除了国内官方和GitHub上提供的数据,想继续寻找其它数据集的小伙伴们可以点开这个链接查看:
https://share.mubu.com/doc/3gZeLzTgoaG

四:疫情数据研究参考

通过上述方式获得疫情数据之后,我们又可以做哪些研究呢?
下面是我们搜集的一些利用疫情数据或以疫情数据辅助其它数据进行数据分析与回顾的研究论文,希望可以为你提供一些新的思路:
疫情参考论文索引:
https://share.mubu.com/doc/1oOkl2PQViG

​另附上获取地理数据的获取来源:
1.地理科学生态网

网站地址www.csdn.store
最近更新了全国30m分辨率数据1980-2020年连续年份土地利用数据,分类为一级分类(耕地林地草地水体建设用地未利用地等);据同学下载实验,和landsat数据进行了对比,发现精度还是不错的。

【数据分享】疫情数据 第7张图片
并且有各种地理科学数据,竟然发现了很多宝藏数据。比如道路网数据、NPP数据、土地利用数据(二级分类)、乡镇边界、NDVI数据、地铁站点、气象数据(降雨量、气温、蒸散量、辐射、湿度、日照时数、风速)、径流量数据、30米土地利用二级分类数据、12.5米高精度DEM高程、2020年行政区划、10、30米NDVI数据、30m精度NPP净初级生产力、夜间灯光数据、统计年鉴、道路网、水系、景区医院等poi、三级流域矢量边界、地质灾害分布数据、30m土壤理化性质数据集、30mGDP柵格数据、30m人口柵格数据、30m精度植被类型数据、30m精度连续年份土地利用数据、GPP初级生产力数据、农田作物类型分布数据、自然保护区分布数据、高精度遥感影像数据、1:10万沙漠沙地分布矢量数据、蒸散发数据、降雨量气温蒸发数据、地表径流量、水汽压、土壤侵蚀数据等等!
2.地理空间数据云

(1)2000年全球土地覆盖计划(GLC2000)
(2)欧空局全球陆地覆盖数据(ESA GlobCover)
3.地理遥感生态网

网站地址www.gisrs.cn,该网站同样更新了很多有关地理的数据,30米土地利用二级分类数据、12.5米高精度DEM高程、2020年行政区划珍贵的乡镇边界、村边界、气象数据、径流量数据等。
4.马里兰大学数据集

UMd基于AVHRR数据的5个波段及NDVI数据经过又一次组合建议数据矩阵,用分类树的方法进行了全球土地覆盖分类工作。其目的是希望建立一个比过去数据更高精度的数据集。

【数据分享】疫情数据 第8张图片




上一篇:疫情没完没了,这是我们必须知道的真相…
下一篇:国家版权证书寻找授权方
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 

精彩评论1

正序浏览
跳转到指定楼层
沙发
@Xizi_awpYw2Vj 发表于 2022-6-12 11:13:34 | 只看该作者
 
你好,请问山东省的疫情数据是怎么下载,可以说一下方法吗
回复 支持 反对

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-4-27 18:14