数据智能

变得前所未有的简单

购买 试用

大数据平台 Analytix Data Hub 企业灵活易用的全业务链的大数据存储/分析解决方案

  • 关注业务全局,避免价值孤岛;
  • 建立全景业务图谱,深度挖掘潜在价值;
  • 无代码、灵活的可视化建模和分析流程设计;
  • 强大的分布式智能计算引擎;
  • 包括自然语言、推理引擎、机器学习等;
  • 丰富的数据展示、可视化手段;
  • 产品特性
  • 产品文档
  • 应用案例

产品特性

支持多源异构的知识提取
高吞吐
最高支持单主题(Topic)每日T级别的数据量写入,每个分片(Shard)支持最高每日百GB级别的写入量。
实时性
通过DataHub服务,您可以实时的收集各种方式生成的数据并进行实时的处理,对您的业务产生快速的响应。
高安全性
提供企业级多层次安全防护,多用户资源隔离机制;提供多种鉴权和授权机制及白名单、主子账号功能。
实时数据发布
同时支持结构化和非结构化的数据类型 支持单主题级别的吞吐能力扩缩容,按需使用 高吞吐低延迟的数据写入能力,单Topic TB级别的写入能力
丰富的提取组件
全景价值分析
实时数据订阅
数据在毫秒级别实时可订阅 订阅接口简单易用,多种订阅接口,满足不同的场景需求 和流计算产品紧密结合,自动订阅和计算
实时数据归档
数据链路全自动化 无需人工干预 数据延迟低 最大五分钟延迟
以本体表征真实的多维世界
强大的图谱分析工具
极致的性能与可扩展性
批处理可以对从GB到PB级的数据量实现复杂的查询和分析 具有高可扩展性,用户可以通过增加集群节点数量, 线性提高系统的处理能力。
丰富的计算引擎
包含离线计算框架MapReduce、内存计算框架Spark、 DAG作业计算框架Tez,同时Hive可以根据需要选择不同的计算框架
以本体表征真实的多维世界
强大的图谱分析工具
低延迟的流处理
具备微批处理(Spark Streaming)和近乎实时(Storm)的流处理引擎, 计算延迟最低可至毫秒级。支持高可用性(HA),从而支持7x24小时的生产业务
大数据开发工具套件
包括元数据管理、工作流oozie、任务调度。 用户可以使用这些工具来提高大数据的开发效率, 降低技术门槛
以本体表征真实的多维世界
强大的图谱分析工具
简易的操作和管理
Ambari是专门用于部署、 管理和运维Data Hub集群的组件。 它支持产品一键安装、一键升级和图形化运维, 并提供了预警和健康检测功能,帮助用户简化运维过程。
统一的安全/多租户管理
Data Hub平台中实现安全控制和资源管理的中央服务平台 可以做细粒度的权限控制,并且提供租户管理功能
以本体表征真实的多维世界