东方国信-让数据改变工作与生活

产品功能

分布存储HDFS
Hadoop 的分布式文件系统，实现大规模数据可靠的分布式读写
分布式计算框架MapREduce
用于大规模数据集的并行运算
分布式队列Kafka
快速、可扩展的、分布式的发布-订阅消息系统
批量数据计算：Spark
基于内存计算的集群计算系统，目的是让数据分析更加快速。Hive：一个基于Hadoop平台的数据仓库工具，主要应用于综合数据分析平台的数据统计分析
实时流计算SparkStreaming
是Spark核心API的一个扩展，可以实现高吞吐量的、具备容错机制的实时流数据的处理
全文检索计算ElasticSearch
提供了一个分布式多用户能力的全文搜索引擎
分布式数据库HBase
适合存储海量非结构化数据或半结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储
非结构计算：SparkGraphx
分布式图处理框架，把图拆分成很多的子图，然后分别对这些子图进行计算，提供对图计算和图挖掘简洁易用的而丰富的接口
机器学习计算SparkMilb
由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API
BEH－Manager
具备快速构建、管理可视化、便于驾驭、多租户、主动告警、安全审计六个方面的特征。