产品介绍

BEH是在开源Hadoop的基础上对其组件进行增强和封装, 适用于超大规模数据存储和在线分析,帮助企业快速的搭建大数据平台。

我们的优势

HBase功能增强

文件系统HDFS功能增强

Map Reduce性能增强

Hadoop安全

Hadoop数据生命周期管理

高通量消息队

HA方案

特性

产品功能

  • 分布存储HDFS

    Hadoop 的分布式文件系统,实现大规模数据可靠的分布式读写

  • 分布式计算框架MapREduce

    用于大规模数据集的并行运算

  • 分布式队列Kafka

    快速、可扩展的、分布式的发布-订阅消息系统

  • 批量数据计算:Spark

    基于内存计算的集群计算系统,目的是让数据分析更加快速。Hive: 一个基于Hadoop平台的数据仓库工具,主要应用于综合数据分析平台的数据统计分析

  • 实时流计算SparkStreaming

    是Spark核心API的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理

  • 全文检索计算ElasticSearch

    提供了一个分布式多用户能力的全文搜索引擎

  • 分布式数据库HBase

    适合存储海量非结构化数据或半结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储

  • 非结构计算:SparkGraphx

    分布式图处理框架,把图拆分成很多的子图,然后分别对这些子图进行计算, 提供对图计算和图挖掘简洁易用的而丰富的接口

  • 机器学习计算SparkMilb

    由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API

  • BEH-Manager

    具备快速构建、管理可视化、便于驾驭、多租户、主动告警、安全审计六个方面的特征。