If you are a reviewer, please login to review

Please read first

Please review this submission carefully as we have updated the guidance around what each dataset refers to and the data availability question explanations.

1. Official data sources

Please answer regarding official (government or government associated) sources of data. Often data is available from various sources both official and unofficial but we only want answers on the basis of official sources.

To illustrate: suppose election results data is available both from government sources and from a third party website and that the government data is in PDF (so not machine readable) but that the unofficial source has the data in spreadsheets (machine-readable). Then the answer to the machine readable question would be 'No' as the official source is not machine readable (but please do list the unofficial source in the details and comments section).

2. Provide evidence

Please try to provide relevant evidence to back up responses. For example, if data is public and online the URL field should not be empty, or, if the data is openly licensed there should be information (e.g. link) for relevant license of terms-of-use in the details.

3. Assessment Point

Questions should be answered on the basis of the situation as of today. Do not answer based on what may happen in the future (or the situation previously). So, for example, if data will be online soon but is not online now the answer to the 'online' question should be 'No' (though please mention that it will be available in the details and comments section).

Question
Yes
No
Unsure
Current
Information
是否开放授权?
No entry

这个问题考察该数据集是否按照 https://opendefinition.org/od/simplified-chinese/ 的相应规定采用了开放授权协议。所谓开放授权意味着数据集可以被任何人用作任何用途,这也包括了商业用途。任何人在这一授权下都能够自由、免费地使用数据,或将数据与其他数据聚合再发布。授权协议至多规定必须署名或按相同方式授权来限制使用。

数据是否免费?
Yes

这里关心的是这个数据是否免费,如果收费请在后面的注释部分说明

是否机器可读?
Yes

数据机器可读指的是数据所用的文件格式是容易被计算机处理的。要注意即使数据是电子介质存储的但不一定机器可读,比如PDF格式是电子的,但其很难通过计算机来处理数据。这是因为对于计算机而言,很难理解PDF文档中数据的格式信息,而无法自动提取出其中的数据(即使你人是能读懂的)。如果相同的数据被放在一个CSV或者其他电子表格文档里,那么计算机就可以轻易处理了。请注意:对于不同的数据,会有不同的合适的机器可读格式。比如对于地理位置信息,shape格式等就较为合适。但一般而言, HTML(即普通网页)和PDF都不被认为机器可读。

数据是否按时更新且目前是最新版本?
No entry

该问题考察数据集是否在发布后定期更新。比如,对于建筑许可证数据,是否及时更新而包括了最新工程。如果有任何的不确定,请在后面的注释部分指出。

是否完整获取?
No entry

数据完整获取指的是数据可以被完整得下载或访问。一般而言如果数据不能被完整获取,那么就意味着你只能获得一部分你数据(比如,你只能通过输入关键字搜索来访问到整个数据库中的一部分数据)

数据是否提供在数字媒介下?
Yes

这个问题主要判断数据是否提供在数字媒介下(即是否存储在计算机或某种电子存储介质上)

数据是否在线?
Yes

这里关心的是是否能够通过官方途径在线访问或获得这个数据集。如果可以,请在之后填写相应网络链接地址。

数据是否存在?
Yes

这个数据是否存在?它可以是以任何形式存在(书籍、纸档文件、在线网页、可下载的CSV等等)。如果这个数据集完全不存在,那么其他问题都不用回答了

公开可获取?
Yes

这个问题主要侧重于数据集的「公开性」。数据集并不需要免费,但必须能够让在政府之外的人可以访问(比如数据可以购买到,又或者你能从网上下载到包含数据的PDF,又或者你能得到包含数据的纸质文件等等,那么这个数据集就是公开的)。但请注意,只能通过信息公开方式才能获取的数据并不能被认为「公开」。


Preview

No entry

Comments

comments powered by Disqus