MITx的魔球課程:Analytics Edge之期中心得

sonnywang 2014-04-23 21:37

歡迎來逛逛,原文在我blogger: http://ilovemoocs.blogspot.tw/2014/04/mitxanalytics-edge.html


这是我第一门专心拿的edX的课,是由MIT开的,主要内容就是machine learning。巧的是,我第一门在Coursera上拿到的certificate就是创办人Andrew开的Machine Learning。Coursera那门machine learning说实在就是让你对这门课产生一点兴趣,让你愿意进一步探索这个领域,以及另一个最重要的目的:让人们感受一下在MOOCs上也能学到一些「高深」知识的可能性。


Stanford那门machine learning虽然被很多人批评很浅(我没接触过这领域,也没修过统计,就拿了100%),不过倒是真的开启了我对这个领域的兴趣,最近就是专门在上这类data science的课程,也付费拿了Coursera Data Science Specialization(还在进行中,请参考此系列)。不过今天我要赞美的主角是Analytics Edge这门课,充实有趣又耗工!

这门课有趣的地方在于他每个礼拜的主题都伴随一个在商业或是现实中的应用例子,有些还颇让人大开眼界。第二个礼拜讲到linear regression model的时候,就出现了「魔球」的案例。魔球这部Brad Pitt主演的电影相信很多人都看过,不过其中最大的内涵不是励志,而是「统计数字」战胜「主观偏见」在商业上的巨大典范,也暗示了人类理性的确可以战胜情感,并且从此影响了包括MLB在内的运动产业甚至其他产业,至今大联盟的奥克兰运动家队仍然采用此策略,堪称联盟中最高CP值队伍,屡屡创造惊奇,这就是资料的力量。

第三个礼拜讲到logistic regression,资料来源则为Framingham Heart Study, 是上世纪最重要的心脏研究之一,目标是找出导致心血管疾病的可能因子,课程中利用Framingham Heart Study来预测可能发生疾病的程度,另一个例子则是带你怎么利用民调来预测总统大选。这两个topic是没魔球那么有趣,不过也证明machine learning在预测中的实用性,甚至之后都有可能提供医生诊疗建议。

第四个礼拜讲到Boston房价预测(因为MIT在Boston Cambridge)和美国巡回法官的判决预测,前者算是常见的商业应用,但是后者这个主题倒是很耐人寻味。利用Classification and Regression Trees(CART)竟然可以发现某些法官的判决其实跟其他法官有关联性,例如某个法官有极大可能会采取另一个法官的立场来作判决,此外不可避免的政党属性(自由或是保守)也是个有影响性的模型变量,所以真的要公正说实在的不可能,因为人都有喜好,不管自知与否,但总是会留下蛛丝马迹。让我有点想要拿台湾的法官判决来玩玩看!

刚刚做完第五个礼拜的作业,大概花了五个小时吧....对了,这门课其实蛮操的,因为作业分量很厚重,不过做完的确有充实感,就是有点耗工。第五个礼拜的主题是文字的分析(text analysis),范例就是常见的拿twitter tweets来分析大众对Apple的感觉,由于twitter tweets可以即时拿到,所以等于是可以无缝追踪民意,用来调整商业策略,不过台湾流行的是facebook,好像也有类似的api可以拿到目前的贴文。另一个非常有趣的主题就是IBM怎么打造华生(Watson)这台超级电脑,打败美国著名的益智比赛节目Jeopardy的另外两名冠军选手。课程中播放了Watson参加Jeopardy的影片,可以说让人目瞪口呆(当然不是胜在它按铃速度比人类快),一些电脑擅长的题型(不涉及联想和暗示的),基本上人类是没有反击余地的,不过有一点小小可惜的地方就是,尽管Watson真的采用自然语言分析来了解题目,但不是像现在Siri一样分析声音,而是直接由制作单位输入文字(就是本周主题text analysis),所以离电影中的杀人电脑还远得很,不过如果不这样做,可能根本不用比了。以下是完整片段:

https://www.youtube.com/watch?v=qpKoIfTukrA


这门课还蛮强烈推荐!但是要有一个礼拜约花15小时的心理準备。這个礼拜开始会进行Kaggle.com (一个比赛machine learning的著名网站,最高奖金三百万美金)的课程比赛,强制参加,还占了15%的学期成绩...期待又怕受伤害啊~

所有评论(11)

  • changepoint 1楼
    changepoint

    难得看到有长评,跟风说一下感想吧

    本来选这门课是为了攒证书上的,前两周发现作业太多差点放弃,但坚持下来之后发现收获比想像的大。其中最主要的是了解了很多packages可以简化工作(之前遇到这种情况都是自己写function解决问题)。

    课程主要介绍了很多工具(model)以及如何使用这些工具来解决实际问题,但是对于模型的优劣,以及各种模型是如何实现的,在什么时候适用介绍不多。我想这是这门课程的一点不足。

    2014-04-24 00:29 举报 回复
  • sonnywang 2楼
    sonnywang
    引用@changepoint 的话:难得看到有长评,跟风说一下感想吧本来选这门课是为了攒证书上的,前两周发现作业太多差点放弃,但坚持下来之后发现收获比想像的大。其中最主要的是了解了很多packages可以简化工作(之前遇到这种情况都是自...

    這門課可以讓人知道怎麼用package, 但還是處於不知其所以然的境地。

    要靠自己用功去了解背後的數學理論了!

    2014-04-24 00:55 举报 回复
  • changepoint 3楼
    changepoint
    引用@sonnywang 的话:這門課可以讓人知道怎麼用package, 但還是處於不知其所以然的境地。要靠自己用功去了解背後的數學理論了!

    嗯,对。不过这门课就10周的时间,能够介绍这么多model也不容易了,统计系里面真要把这些东西讲明白也不是一个学期能做到的

    2014-04-24 00:59 举报 回复
  • sonnywang 4楼
    sonnywang
    引用@changepoint 的话:嗯,对。不过这门课就10周的时间,能够介绍这么多model也不容易了,统计系里面真要把这些东西讲明白也不是一个学期能做到的

    @changepoint 說起來, Andrew Ang的machine learning倒是把數學和演算法講得非常清楚,算是很棒的課!

    2014-04-24 01:03 举报 回复
  • changepoint 5楼
    changepoint
    引用@sonnywang 的话:@changepoint 說起來, Andrew Ang的machine learning倒是把數學和演算法講得非常清楚,算是很棒的課!

    相比Andrew Ag的课,我更喜欢台大的机器学习课程。Andrew的课比Stanford实体课程简化了不少,总觉得有点不爽

    2014-04-24 01:10 举报 回复
  • sonnywang 6楼
    sonnywang
    引用@changepoint 的话:相比Andrew Ag的课,我更喜欢台大的机器学习课程。Andrew的课比Stanford实体课程简化了不少,总觉得有点不爽

    really? 那我下次要來修臺大的!謝啦

    2014-04-24 01:12 举报 回复
  • 玛雅蓝 7楼
    玛雅蓝 MOOC学院吐槽官

    《魔球》在内地一般译作《点球成金》,《大数据时代》也提过这部电影,不过我没去看~

    2014-04-24 10:50 举报 回复
  • sonnywang 8楼
    sonnywang
    引用@玛雅蓝 的话:《魔球》在内地一般译作《点球成金》,《大数据时代》也提过这部电影,不过我没去看~

    如果不太懂棒球的話,基本上這部片也很難懂 @@

    2014-04-24 13:51 举报 回复
  • 已退休少先队员 9楼
    已退休少先队员
    引用@sonnywang 的话:如果不太懂棒球的話,基本上這部片也很難懂 @@

    如果列出近五年个人TOP 5,<Money Ball>绝对在名单上;为看这部电影,还略微研究了点棒球的规则。

    2014-04-24 13:59 举报 回复
  • changepoint 10楼
    changepoint
    引用@sonnywang 的话:如果不太懂棒球的話,基本上這部片也很難懂 @@

    还是看小说好,michael lewis写的小说都不错。

    2014-04-24 14:44 举报 回复

你的评论

课程全部笔记
The Analytics Edge

The Analytics Edge分析学的优势

评分:
8 (24人评价)
时间:
2016-04-12
难度:
一般

京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号 ©2017果壳网

关于我们 新手指南