多源数据的高效集成
云海Insight HD作为多源数值源(一般包括格局化、半格局化和非格局化数值源)的ibms特性,作为高吞吐、可突出的数值源串口通信和数值源下发效果,认可一键载入图片、雷达回波图载入图片、数值源库载入图片、文件夹载入图片等很多种载入图片模式。异构数据的海量存储
云海Insight HD供给针对布置式文件目录名称控制系统和并行计算成分的大动态储备系统器工作能力,认可PB级动态资料产值的高信得过和高需用储备器,认可存储多种多样文件目录名称格试,随后的关联动态资料库等成分化动态资料,系统日志、360网页等半成分化动态资料,已经视频图文、图文、文档文件等非成分化动态资料。多场景下的数据计算框架
处于有所不同业务部3d场景,云海Insight HD给出在线测算方法、流式的测算方法、电脑内存测算方法、图测算方法等充裕的测算方法架构,可以测算方法世界任务注意事项编撰、规划拟定,给出标准化SQL的数据统计訪問性能。基于机器学习的大数据分析
云海Insight HD提供涵盖多源数据接入、数据特征提取、算法模型管理、算法模型评估和结果预测等完整机器学习过程的可视化大数据分析功能。支持多元分类、回归分析、协同推荐等分析模式,SVM、朴素贝叶斯、K-Means、线性回归等10+种算法,支持批量预测和实时预测功能并提供API。预测过程基于内存进行迭代式计算,并且支持分布式计算,可以应对海量数据分析。
安全有效的资源隔离与共享
云海Insight HD提供对结构化、非结构化数据的多用户资源管理,满足对数据资源的权限隔离、安全授权和资源调度。提供多用户的可视化数据空间管理功能,支持数据空间大小、文件数、计算队列等的配额设置;支持多用户间数据资源的开放订阅和指定共享,共享权限可控制到文件目录、表及列族级;支持对数据访问的审计和监控。
统一的大数据平台运维管理
云海Insight HD保证针对性HDFS、MapReduce、Hive、HBase、ZooKeeper、Oozie和Spark等20+插件的自己化安裝部暑,同心同德app平台保证健全完善的分配方法、把控告警等力量。米乐m6 云海Insight HD已通过权威软件测评实验室的测试认证。
1.性能参数评价指标
测试软件学习环境:8节点集群;节点典型配置:CPU:2*E5-2640,内存:256G,硬盘:SATA盘
分类 |
指标项 |
规格 |
MapReduce耐腐蚀性的指标 | WordCount:平均水平每顶点进行处理力 | 8GB/1分钟 |
Terasort:平衡每结点操作效果 | 6.4GB/一分钟 | |
Spark性能公式公式 | WordCount:的平均每时间除理水平 | 30GB/7分钟/Node |
Terasort:差不多每连接点整理功能 | 9GB/分钟的时间/Node | |
SQL on Hadoop | Aggregation:平衡每组件处置专业能力 | 8GB/半个小时 |
Join:均衡每子域进行处理实力 | 4GB/分钟左右 | |
HBase | 100%随机性读:平均水平每顶点导入数据条数(每一条数据1KB),初始化失败时间间隔不大于50MS | 30,000 Records/s |
100%随机数写:年均每组件读入记载条数(每根记载1KB),死机日期大于50MS | 40,000 Records/s | |
依次扫描机:一般每分支scan数据条数(每根数据1KB),积极地响应时期乘以50MS | 15,000 Records/s | |
50%随即的写+50%随即的读:差不多每时段读取收录条数(每一条收录1KB),加载失败时段不低于50MS | 写25,000 Records/s 读18,000 Records/s | |
50%任意写+50%扫描器读:平均值每子域注入记载条数(一条记载1KB),响应的事件不大于50MS | 写30,000 Records/s 读10,000 Records/s |
项目编号 |
厂家 |
CPU 全系列 |
体系结构 |
1 |
Intel |
至强全系列,Xeon5X、Xeon6X等 |
X86 |
2 |
飞腾 |
FT-1500A、FT-2000+、FT-2500 |
ARM |
3 |
华为荣耀 |
鲲鹏系列的 |
ARM |
2.2 基本操作应用程序兼容问题
序号顺序 |
操作方法体系 |
1 |
CentOS |
2 |
Redhat |
3 |
浩瀚银河麟麟 |
4 |
中标公示麟麟 |
5 |
青龙OS |
6 |
EulerOS |