百分网 > 教育 > 学习资讯 > 《大数据挖掘初读感想》正文

大数据挖掘初读感想

百分网【学习资讯】 编辑:嘉馨 发布时间:2017-09-06 16:03:35

  这篇文章是小编大学上课时交的一篇作业,对,就是一篇表达小编完全没理工细胞的感想日志,哈哈哈哈哈哈~所以小编后来就离技术之路越来越远了~~


  上课的时候听了很多有关大数据的项目,心里默默地崇敬起来,于是课后也去网上找了老师说的大数据创新与创业大赛:第一届大数据技术创新与创业大赛——基于出租车GPS轨迹的位置服务。看了一下题目就懵了,连题目都没看懂到底要干什么!?浏览了一下样例,一开始以为类似ACM,结果一路看下去,除了看出奖励很高以外几乎都没看懂。

  可以肯定,这东西跟数学和算法有关,而且很难!

  既然很难,那么就要付出更大的努力去学习了,去图书馆找书,找了好久发现老师经常说的hadoop都被借完了,只好找了本《数据挖掘教程》//《Data Mining A Tutorial-Based Primer》,看起来比较入门,借着平时空闲的时间翻阅了一下,数据挖掘,顾名思义就是挖掘数据中有用的信息,帮助解释当前行为或预测未来的结果。对于数据挖掘的含义,虽然听多了也耳熟的很,也还是看了书才知道到底是干什么的。这几天也看了些,虽然不是看得特别懂,就是了解了一下数据挖掘的研究方面及应用领域,浏览了一下各种例子中的算法,

  初看数据挖掘的应用,我想也就商业上用的比较多吧,没想到医药卫生自然科学也有它的身影,让我有些意外,仔细读来,发现确实,各种数据会形成一种特定的模式或规律,如地球资源探测卫星图像数据集,这个数据集包括了表示一部分地球表面的数字化卫星图像的像素点,每个实例分类到15个类别中的一个,由于每个类都包括巨大的数据量,分类的准确度受到了特定模型参数设置的影响。除了自然科学,还有医药卫生中心脏病患者数据集,脊柱临床数据集等,甚至包括泰坦尼克号数据集!

  说到数据挖掘,自然想到数据库,书上还真有说到数据库,KDD——数据库中的知识发现,很专业的术语,感觉和数据挖掘差不多,不过KDD处理模型中还包括一个方法论,用来提取和准备数据,以及数据挖掘执行后对所要采取的行动做出决策。——其实我真没看懂。

  大部分理论和概念都没怎么看懂,可能是刚开始接触,还生疏,理解起来挺难的,书上提到可以为数据创建决策树,可以概化数据,总结各数据属性间的关系,看上去一目了然。不过要我自己来弄估计还得弄好长一段时间,理解了和自己能动手做毕竟还有段距离。

  看了几天书,其实也没看懂多少,就大概了解了一下数据挖掘的一些关键术语,如果说收获的话,应该是建立了一种思维模式吧,也许还不算正式形成了,不过对生活中的一些数据会多留意,会想是不是可能产生什么联系,不过这也是想象而已啦,还是要多看下书,慢慢会理解的,对数学、算法这类学科会有一个针对性的学习。

[大数据挖掘初读感想]相关的文章

Copyright © 2010-2017 乾程互联科技(广州)有限公司版权所有 All Rights Reserved

百分网 版权所有 粤ICP备17065803号-2