早期在描述大数据的时候,往往从大数据本身的特点来入手,比如数据量大、速度快、数据类型多样化、价值密度低、真假难辨等等,但是对于普通人来即使知道了这些特点,对于大数据的概念依然是模糊的,依然不知道大数据到底用来做什么,能够与普通人产生哪些连接。
1、什么是大数据?
这是一个非常好的问题,作为一名IT从业者,同时也是一名计算机专业的教育工作者,我来回答一下。首先,要想把大数据搞清楚,首先要明白大数据本身并不是一个单一的概念,如今的大数据已经发展成了一个庞大的生态体系,涉及到的产业链也在不断完善和发展,随着大数据技术体系逐渐成熟,大数据的落地应用已经开始逐渐展开,随着诸多行业企业纷纷实现业务上云,未来大数据的应用场景会越来越多,大数据所构建起来的价值空间也有很大的潜力。
早期在描述大数据的时候,往往从大数据本身的特点来入手,比如数据量大、速度快、数据类型多样化、价值密度低、真假难辨等等,但是对于普通人来说,即使知道了这些特点,对于大数据的概念依然是模糊的,依然不知道大数据到底用来做什么,能够与普通人产生哪些连接,实际上,要想了解大数据,首先要搞清楚大数据的目的,大数据的目的就是实现数据的价值化,大数据的所有操作几乎都是围绕数据价值化展开的,包括数据采集、数据整理、数据存储、数据分析和数据应用等等,这一系列环节都是围绕数据的价值增量来展开的,最终通过数据应用来完成价值体现。
简单的说,通过大数据能够让更多的数据产生价值,通过大数据能够让数据的价值进行传递(赋能)和提升,通过大数据能够让数据逐渐成为一个重要的生产材料,通过大数据能够衡量一个企业的价值和发展潜力等等,随着工业互联网的发展,未来大数据本身所承载的价值空间会越来越大,我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。
2、大数据是什么?
采集记录足够多的数据,使工作更加针对化和精准化,这是大数据吗?这不是大数据而只是数据化,什么是大数据呢?例如洛杉矶警方曾对以往的刑事案件做了统计,通过算法得出了第二天的高概率犯罪地点,然后有针对性的派警察去该处巡逻,从而使得当地的犯罪现象下降20%。这是大数据,再比如,经济学家都认为股票无法预测,而一位剑桥大学毕业的博士搞了个公司,对有史以来几乎所有的证券交易的数据进行记录,然后通过算法进行分析。
他对什么国家政策、公司业绩、行业走向等等一眼都不看,100%地排除主观意志的,只根据计算结果来进行投资,最后赚了大钱,这是大数据。大数据的精髓并不在于数据的精准和数量,而在于对内在规律的挖掘和对未来趋势的预测,其思路是:一个结果是有很多原因的,原因作用的强度可能是随机的,我们对其中作用的机理并不清楚。
我们难以找出规律性,但知道规律性就蕴含在结果数据之中,如果我们能建设合适的模型,写出好的算法,就有可能把这个规律性提炼出来,从而能科学地发现真相和预测未来,今天上午在贵州省大数据中心看到了大数据应用的事例。金润建设和鹏润达这两家企业分别投标200多次,一次也没中过,依然积极地投,投标是要成本的,这两家公司那里来的动力?通过大数据的知识挖掘技术,发现了它们总是陪着固定的一家公司一同招标,最后总是那家公司中标。
3、大数据的概念和应用,到底是什么?
大数据技术是指从各种各样类型的数据中,快速获得有价值信息的能力,适用于大数据的技术。包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统,大数据的应用:大数据是信息产业持续高速增长的新引擎,几乎各个行业都会逐步引入大数据技术,尤其是那些将要实现互联网信息化转型的传统企业。