Reproducible Research签名认证

可重复性研究

关注 (501) 学过 (26) 晒证书

7.0 (19人)

  • 知识量:6.9
  • 教师参与:7.0
  • 趣味性:6.3
  • 课程设计:6.7

难度:简单

开始时间:2017-06-19

持续时间:4.0周/每周4.0-9.0小时

去上课 申请课程签名认证>

你可能感兴趣换一换

这是约翰霍普金斯大学数据科学专项系列课程的第五门课。
课程重点讲解用可重复性研究的方式发布现代数据分析所需的概念和工具。可重复性研究指的是数据分析,或者说科学主张,是连同原始数据和代码一起发布的,这样其他人可以验证其结果,并在此基础上进一步研究。随着数据分析变得越来越复杂,涉及越来越大的数据集和越来越复杂的计算,人们对可重复性的需求也随之急剧增长。可重复性能让人们专注于数据分析的实质内容,而不是书面报告中所总结的表面的细节东西。另外,可重复性使分析更利于他人使用,因为别人可以用到分析实际使用的代码和数据。本课将重点讲解一些文字化统计分析工具,它们能让你将数据分析放到单一文件里发布,使他人可以方便地执行相同的分析并得到相同的结果。


课程大纲
通过本课,你将学会:用R markdown写文档、集成可执行的R代码到文字化统计程序中、用knitr和相关工具编译R markdown文档,以及整理数据分析使他人可获取和可重复。


先修知识
数据师的工具箱(Data Scientist"s Toolbox)
R编程(R Programming)


授课形式
每周都会有教学视频、小测验和同学互评的作业。
作为课程的一部分,你需要注册一个GitHub帐号和一个RPubs帐号。GitHub是代码协作共享和编辑的工具。RPubs是用于发布R数据分析的网站。在本课以及本系列的其他课程当中,你需要提交你放在GitHub上的公开文件链接,以进行同学互评。如果你担心隐私问题,你可以注册一个匿名的GitHub帐号,并注意不要透露那些不想让互评同学得知的信息。


常见问题解答

本课跟数据科学专项系列的其他课程有何依赖关系?
我们制作了九门课的相互依赖图表,方便你参考:
https://d396qusza40orc.cloudfront.net/rprog/doc/JHDSS_CourseDependencies.pdf

完成课程后,我能获得修课证书吗?
能,顺利完成本课程的学生将获得由授课老师签发的修课证书。

我需要什么资源来学习本课?
你需要一台能安装R软件环境的电脑(一台Mac/Windows/Linux电脑即可)

本课在数据科学专项系列的什么位置?
这是本系列的第五门课。我们强烈建议你先学习“数据师的工具箱”和“R编程”。


翻译:@肥叉烧
编辑:@玛雅蓝

所属专题

相关课程

京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号 ©2017果壳网

关于我们 新手指南