定义三:大数据包括A、B、C三个要素
基于应用要求,大数据包括A、B、C三个要素:分析(Analytic),带宽(Bandwidth)和内容(Content)。
1. 大分析(Big Analytics),帮助获得真知—-指的是对巨大数据集进行实时分析的要求,它能带来新的业务模式,更好的客户服务,并实现更好的结果。
2. 高带宽(Big Bandwidth),帮助走得更快—-指的是处理极端高速的关键数据的要求。它支持快速有效地消化和处理大型数据集。
3. 大内容(Big Content),不丢失任何信息—-指的是对于安全性要求极高的高可扩展的数据存储,并能够轻松实现恢复。它支持可管理的信息内容存储库、而不只是存放过久的数据,并且能够跨越不同的大陆板块。
大数据是一股突破性的经济和技术力量,它为 IT 支持引入了新的基础架构。大数据解决方案消除了传统的计算和存储的局限。借助于不断增长的私密和公开数据,一种划时代的新商业模式正在兴起,有望为大数据客户带来新的实质性的收入增长点以及富于竞争力的优势。
2、大数据的特点
要理解大数据,首先要从“大”入手,“大”是指数据规模,大数据一般指在10TB(1012B,万亿级数据)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Volume、Variety、Value和Velocity),即体量大、多样性、价值密度低、速度快。主要特点有:
① 数据体量巨大。从 TB级别,跃升到 PB(1015B,千万亿级数据)级别。
② 数据类型繁多,多为非结构型数据,如网络日志、视频、图片、地理位置信息,等等。
③ 价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
④ 新的数据处理技术。大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。目前所说的“大数据”不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。大数据研发的目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展。因此,大数据时代带来的挑战不仅体现在如何处理巨量数据从中获取有价值的信息,也体现在如何加强大数据技术研发,抢占时代发展的前沿。
⑤ 处理速度快,秒级定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式,多要求在秒级时间范围内给出分析结果。