Reproducible Research签名认证

可重复性研究

关注 (492) 学过 (26) 写点评 (19) 晒证书

7.0 (19人)

  • 知识量:6.9
  • 教师参与:7.0
  • 趣味性:6.3
  • 课程设计:6.7

难度:简单

开始时间:2016-04-18

持续时间:4.0周/每周4.0-9.0小时

去上课 申请课程签名认证>

你可能感兴趣换一换

这是约翰霍普金斯大学数据科学专项系列课程的第五门课。
课程重点讲解用可重复性研究的方式发布现代数据分析所需的概念和工具。可重复性研究指的是数据分析,或者说科学主张,是连同原始数据和代码一起发布的,这样其他人可以验证其结果,并在此基础上进一步研究。随着数据分析变得越来越复杂,涉及越来越大的数据集和越来越复杂的计算,人们对可重复性的需求也随之急剧增长。可重复性能让人们专注于数据分析的实质内容,而不是书面报告中所总结的表面的细节东西。另外,可重复性使分析更利于他人使用,因为别人可以用到分析实际使用的代码和数据。本课将重点讲解一些文字化统计分析工具,它们能让你将数据分析放到单一文件里发布,使他人可以方便地执行相同的分析并得到相同的结果。


课程大纲
通过本课,你将学会:用R markdown写文档、集成可执行的R代码到文字化统计程序中、用knitr和相关工具编译R markdown文档,以及整理数据分析使他人可获取和可重复。


先修知识
数据师的工具箱(Data Scientist"s Toolbox)
R编程(R Programming)


授课形式
每周都会有教学视频、小测验和同学互评的作业。
作为课程的一部分,你需要注册一个GitHub帐号和一个RPubs帐号。GitHub是代码协作共享和编辑的工具。RPubs是用于发布R数据分析的网站。在本课以及本系列的其他课程当中,你需要提交你放在GitHub上的公开文件链接,以进行同学互评。如果你担心隐私问题,你可以注册一个匿名的GitHub帐号,并注意不要透露那些不想让互评同学得知的信息。


常见问题解答

本课跟数据科学专项系列的其他课程有何依赖关系?
我们制作了九门课的相互依赖图表,方便你参考:
https://d396qusza40orc.cloudfront.net/rprog/doc/JHDSS_CourseDependencies.pdf

完成课程后,我能获得修课证书吗?
能,顺利完成本课程的学生将获得由授课老师签发的修课证书。

我需要什么资源来学习本课?
你需要一台能安装R软件环境的电脑(一台Mac/Windows/Linux电脑即可)

本课在数据科学专项系列的什么位置?
这是本系列的第五门课。我们强烈建议你先学习“数据师的工具箱”和“R编程”。


翻译:@肥叉烧
编辑:@玛雅蓝

课程点评 写点评

综合评分:7.0难度:简单

  • 知识量:6.9
  • 教师参与:7.0
  • 趣味性:6.3
  • 课程设计:6.7
  • 入门级 2
  • 专项课程 2
  • 干货 1
  • 学院派 1
  • 讲解清楚 1
  • 照本宣科 1
  • 偏理论 1

最新点评

  • 我的肾好疼
    我的肾好疼 在上课

    这门课主要就是讲用R markdown写报告的方法。Rstudio集成了markdown语法,并有相关的包专门解析生成文档。实际上R markdown本质还是markdown,只是在Rstudio里的应用而已。但Markdown应用很广泛,并不仅限于R中。但这个专项课程的老师讲课讲得实在是不忍吐槽,可以上别的Markdown课程,足矣。杜克大学的数据分析课也有用R markdown写报告,可以以那门课作为实践。

    2015-12-31 13:57 0
  • 芦苇丛
    芦苇丛 已完成

    只看课程名可能不知道这课是干嘛的,其实就是怎么做出让别人可以重复做的研究,因此这门课就是教你怎么用RMarkdown+knitr写文档再上传到Rpubs。这个系列的课程很多都有同学互评的作业,这门课的互评是做一点数据分析然后写文档,看了一个人给我打的分数之后我觉得我改得真是太松了……

    晒证书 Reproducible Research Reproducible Research
  • 花枪
    花枪 已完成

    最大的收获是学会了如何用markdown写东西,R studio中集成的这个功能太好玩了, 我感觉这个机制可以向其他语言推广。

    晒证书 Reproducible Research Reproducible Research
    2015-04-11 15:38 0
  • henrysing
    henrysing 已完成

    课程主要介绍了使用RMarkdown和Knitr来做R数据分析的Report。 用此种方法做出来的Report是Reproduciable的,因为数据、代码、结果在一起,在一起

    晒证书 Reproducible Research Reproducible Research
    2015-03-09 11:23 0
  • PuNaDSmile
    PuNaDSmile 已完成

    经过艰苦卓绝的长期奋战(中间挂了几回),终于这套Data Science的课程完成了一半了…… 但是因为天资不足,然后上课上的非常慢,反而看到一些有趣的事情,从一开始这套课程被满满地吐槽,到老师逐渐补充各种辅助内容(比如swirl),到勤奋地助教提供了初学者非常大的帮助(论坛里的超详细step by step指导帖,github资源包,现在还搞了一本书的样子),能看到因为学生的反馈而做出改变的教学,这个也算是MOOC独有的了吧。传统的学校,可能一开始学生本身就经过筛选,为发生初学者集体吐槽事件的概率就比较小,老师按照大纲流程走,就不容易在短期内有很多改变。 再回到这门课程本身,可重复性的研究较本系列其他课程,算是一门“概念化”的课程,主要说明了研究本身的特性,数据科学家在做研究、发表结论的时候要注意给其他研究者创造重复研究结论的条件,使结论可被验证。另外介绍了r markdown,简单且实用。 不过这次的project作业不是在github上提交了,而是导出一个html提到到一个公共网站,这个网站似乎并不是很多人用,一登陆就看见很多其他人的作业……而且互评的时候就发现一模一样连文字都不带改的作业……Coursera的诚信体系感觉也出现了裂缝……(不过还是比国内抄袭作业的现象好太多)

    晒证书 Reproducible Research Reproducible Research
  • 流年闲草_AlexGe
    流年闲草_AlexGe 已完成

    Reproducible Research是非常棒的理念!上这门课我基本没看视频和Slides,同期主要好好读了一下Reproducible Research with R and RStudio。这本书非常条理,看完了能够对R中Reproducible Research相关工具有一个全面而系统的了解,对于未来的Documentation一定会有很大帮助。总之,推荐!

  • wishingbone
    wishingbone 已完成

    Again this course delivers an important concept but the structure and the way of delivery is not very interesting to follow.

    晒证书 Reproducible Research Reproducible Research
    2015-01-10 00:19 0
  • Bobo_Yang
    Bobo_Yang 已完成

    只有R markdown一个新鲜的要点。作业2比较麻烦,关于怎么把类型缩小归纳,有一定的实际意义。

    晒证书 Reproducible Research Reproducible Research
    2014-12-10 11:46 0

课程笔记

写笔记
查看全部笔记 >

所属专题

相关课程

京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号 ©2017果壳网

关于我们 新手指南