卅思大数据
访问官方 实现一些高级别数据分析的需求,助力用户理解数据,帮助用户完成决策工作
数据时代,谁掌握了足够的数据,谁就有可能掌握未来。数据的背后隐藏着信息,而信 息之中蕴含着知识和智慧。几乎任何规模企业,每时每刻也都在产生大量的数据,但这些数 据如何归集、提炼始终是一个困扰。大数据作为具有潜在价值的原始数据资产,只有通过深 入分析才能挖掘出其中蕴含的信息、知识和智慧。大数据时代处理数据的三大转变:要全体 不要抽样,要效率不要绝对精确,要相关不要因果。未来人们的决策将日益依赖于大数据分 析的结果,而非单纯的经验和直觉,因此,大数据分析是大数据研究领域的核心内容之一。
技术框架:
数据采集
大数据的采集是指利用数据采集工具如 Flume、Kettle 等对多个数据源的 数据进行收集,并进行预处理以存储到大数据平台上。数据收集过程就是数据这一将来的流 动资产积累。
数据存储
大数据的存储是指利用分布式的存储工具如面向非结构化的 HDFS、文档结 构化的 MongoDB 以及面向消息流的 Kafka 进行海量数据的存储。