统计之旅

zmx428 2014-05-18 21:19

我是学工程的,本身没有任何统计分析背景。不过MIT的这门课很亲民,数学理论深度不高,只对几个重要的思想和理论做了定性的阐述。相对而言,大量的作业实践和R编程虽然极耗时间,但认真做完后,个人感觉收获颇丰。

简单谈谈几个印象比较深的Problem

  1. P2P借贷策略

数据来源为国外某一P2P网站的历史借贷记录。通过分析不同用户的历史借贷记录筛选出信誉最高的100个用户,而且还算出了这100个用户的平均年投资回报率高达33%!

  1. 文本分析与机器学习

介绍了现在email中的垃圾邮件分类系统的工作原理,并简单模拟了其中的核心算法,通过文本分析找出垃圾邮件中典型的关键词。有趣的是,学了这个才知道为什么现在的垃圾邮件里面总有很长一串看似正常的问候或者各种看似无用的转发信息了,全是为了骗过邮件分类系统啊!

  1. 航空公司对客户的分类

对客户进行个性化,差异化的服务一直是服务业的追求,看看航空公司是怎么给他的客户分类的。公务出差型客户,出行少但忠诚的客户,穷游一族等等,针对不同的客户类型采取不同的推销,服务乃至定价策略,以期实现利润的最大化。

  1. 区域销售代理的规划与分配

再普遍化一些这其实是一个人力资源调配最优化的问题。与上面的几个问题不同,这是在excel中完成的线性规划求解问题,在运筹学中线性求解是一个最基础的优化问题。相比曾经翻看过的国内出版的枯燥无趣的运筹学教材,这门课则将公式和概念转化为实际可见的结果,让人不用重新温习厚厚的线性代数以及高等数学就能完成实际生活中的最优化问题。

-----------------------------------------------------------------------------------------

很多同学提到作业的重复性,其实这也是MIT的无奈之举,因为是即时机改作业,所以很多重复步骤其实是为了保证作业中每一步程序的正确性。

不过,相对较为死板的作业,期中竞赛(Competition)是我个人认为最精彩的一部分。竞赛给定一个网上的调查数据(每个被调查者被要求回答101个问题),然后根据上千份调查结果来预测被访者是否“快乐”(Happiness)。完全没有任何限制,没有任何官方提示,全凭自己所学摸索,在这种不断探索,试错,修正的过程中巩固所学知识,但更重要的是加深对分析过程的理解。学知识并不是为了分数,为了证书而是真正用来解决实际问题。

所有评论(0)

你的评论

课程全部笔记
The Analytics Edge

The Analytics Edge分析学的优势

评分:
8 (24人评价)
时间:
2017-06-06
难度:
一般

京ICP证100430号    京网文[2015] 0609-239号    新出发京零字东150005号     京公网安备11010502007133号 ©2017果壳网

关于我们 新手指南