只需几分钟的设置时间,您就可以将自己的 Dataverse 添加到您的主页,其中包含您提供的数据集或复制数据集列表,以及您希望为更广泛社区提供的任意级别的权限,以及大量专业服务(例如,这是我的主页上的Dataverse)。人们将能够更轻松地找到您的数据和主页,探索您的数据和学术成果,找到与其他资源的联系,下载任何格式的数据,并学习引用您工作的正确方法。他们甚至可以通过 Dataverse 与 Zelig :每个人的统计软件建立的透明和自动化连接,以及通过 Zelig 与R建立的透明和自动化连接,使用大量统计方法在您的网站上分析您的数据。结果是,您的数据将得到专业保存并更易于访问 - 有效地自动化专业归档任务,包括引用、共享、分析、归档、保存、分发、编目、翻译、传播、命名、验证和复制数据。
Dataverse_网络图
Dataverse 网络图,由量化社会科学研究所提供。CC-BY-2.0 通过Wikimedia Commons提供。
Dataverse 是一个活跃的项目,其软件、协议和社区联系方面的新进展正在迅速涌现。几个月后,我们将推出一个从头编写的全新代码版本。在斯隆基金会的慷慨资助下,我们一直在努力消除研究界获取数据的其他类型的交易成本。其中包括与学术期刊的深度集成,这样编辑就可以非常轻松地鼓励或要求提供与出版物相关的数据。我
自己动手。作者将数据发布到自己的数据库中,并在最终提交的论文中引用其数据。期刊通过让文字编辑检查引用是否存在来验证合规性。
期刊验证。作者将复制数据草稿提交给 Journal Dataverse。期刊对其进行审核,并批准发布。最后,数据集将与正式数据引用一起发布,并返回到文章中。(例如,请参阅Political Analysis Dataverse,其中包含可追溯到 1999 年的复制数据。)
全自动化:期刊提交系统与 Dataverse 无缝集成;文章与数据之间自动建立链接。这样期刊和作者就 投资者数据 可以轻松操作,并消除许多错误。
我们的第三个选项是完全自动化,这是我们的发展方向。如今,在开放期刊系统中的 400 种学术期刊中,作者在提交已接受论文的最终稿以供发表时输入其数据,并且引用、数据和文章之间的永久链接以及正式保存都由系统自动处理。我们正在努力将这一选项扩展到 OJS 的所有 5,000 多种期刊以及众多其他学术期刊出版商。结果将是,我们可以在最容易和最重要的时刻以最少的努力捕获数据。
我们还致力于扩展 Dataverse,以涵盖大数据收集以及公共卫生、医学和其他涉及人类受试者信息数据的领域中更普遍的更高安全级别。是的,您可以保存数据并在适当的保护下提供数据,即使您拥有高度机密、专有或其他敏感的数据。我们还在开发其他隐私工具。我们在 Dataverse 中已经有一个广泛的版本控制系统,但计划增加对持续更新数据(如从传感器流式传输的数据)的支持、用于在线快速数据访问的工具、查询、可视化、当数据因大小或隐私问题而无法移动时的分析方法,以及使用大量网络分析来改进 Dataverse 和 Zelig 的方法。
这篇文章来自我在 2014 年 8 月美国政治协会会议上的演讲,使用了这些幻灯片。非常感谢 Mike Alvarez 邀请我发表这篇文章。
特色图片: Comfreak的矩阵代码计算机。CC0 通过Pixabay。
加里·金是哈佛大学阿尔伯特·J·韦瑟黑德三世大学教授,任职于文理学院政府系。他还担任定量社会科学研究所所长。金和他的研究小组开发并应用实证方法,研究范围涵盖从统计理论到实际应用的创新。您可以通过@kinggary关注他。他是《政治分析》杂志上《稳健标准误差如何暴露它们无法解决的方法论问题,以及如何解决》(限时免费阅读)一书的作者。