文章目录
  1. 1. 起因
    1. 1.1. 买了两本书
  2. 2. 这两本书都是很多年前写的,但是最近这几年随着”大数据”被大家越炒越热,随即被大家所看重.
  3. 3. 这两个作者很牛,在30年前大数据还只是萌芽的时候就提出未来大数据的重要性和价值.
  • 大数据是什么了,现在为什么这么火,以前没有大数据吗?
    1. 1. 大数据的产生就像是科技带来的附带品一样,原来我们把信息存贮在图书馆里面,因为人类的活动产生的信息越来越多,图书馆也越来越大,但是由于管理和存贮的成本越来越多,我们被迫要缩减浓缩我们的信息,我们想出了很多很方法来对付这种情况,比如抽样,只要抽取一部分的代表信息存在图书馆里面然后记录主要特征和平均分量,我们就可以把信息降低几个数量级.
    2. 2. 但是现在不同.
    3. 3. 芯片做的越来越小,容量做的越来越大,我们有能力存贮所以的信息,一些先驱发现我们用另一种思维去对待信息.
  • 用全体数据而不是随机样本
  • 用混杂性而不是精确性
  • 用相关关系而不是因果性
  • 最近在学习大数据,书看了不少,但是总是觉得很迷茫,不知道怎么学下去,今天
    突然想写点什么来
    总结一下这些天.

    起因

    逛博客的时候看到一篇分享如何修炼成大数据高手感觉很有趣

    买了两本书

    大数据时代

    失控

    这两本书都是很多年前写的,但是最近这几年随着”大数据”被大家越炒越热,随即被大家所看重.

    这两个作者很牛,在30年前大数据还只是萌芽的时候就提出未来大数据的重要性和价值.

    大数据是什么了,现在为什么这么火,以前没有大数据吗?

    大数据的产生就像是科技带来的附带品一样,原来我们把信息存贮在图书馆里面,因为人类的活动产生的信息越来越多,图书馆也越来越大,但是由于管理和存贮的成本越来越多,我们被迫要缩减浓缩我们的信息,我们想出了很多很方法来对付这种情况,比如抽样,只要抽取一部分的代表信息存在图书馆里面然后记录主要特征和平均分量,我们就可以把信息降低几个数量级.

    但是现在不同.

    芯片做的越来越小,容量做的越来越大,我们有能力存贮所以的信息,一些先驱发现我们用另一种思维去对待信息.

    用全体数据而不是随机样本

    用混杂性而不是精确性

    用相关关系而不是因果性

    文章目录
    1. 1. 起因
      1. 1.1. 买了两本书
    2. 2. 这两本书都是很多年前写的,但是最近这几年随着”大数据”被大家越炒越热,随即被大家所看重.
    3. 3. 这两个作者很牛,在30年前大数据还只是萌芽的时候就提出未来大数据的重要性和价值.
  • 大数据是什么了,现在为什么这么火,以前没有大数据吗?
    1. 1. 大数据的产生就像是科技带来的附带品一样,原来我们把信息存贮在图书馆里面,因为人类的活动产生的信息越来越多,图书馆也越来越大,但是由于管理和存贮的成本越来越多,我们被迫要缩减浓缩我们的信息,我们想出了很多很方法来对付这种情况,比如抽样,只要抽取一部分的代表信息存在图书馆里面然后记录主要特征和平均分量,我们就可以把信息降低几个数量级.
    2. 2. 但是现在不同.
    3. 3. 芯片做的越来越小,容量做的越来越大,我们有能力存贮所以的信息,一些先驱发现我们用另一种思维去对待信息.
  • 用全体数据而不是随机样本
  • 用混杂性而不是精确性
  • 用相关关系而不是因果性