分布式文件系统:
HDFS(可计算资源仓库)、mooseFS、fastDFS+nginx(115网盘)、riak、GlusterFS(intel hbase发行版)
分布式爬虫:
Nutch、httpclient
计算框架:
MapReduce:
hadoop的mapreduce(依托于hadoop、适合于100T以上计算)
mongodb
DAG:
hadoop2的Tez框架(hive on hadoop2支持tez框架,TB以上)
spark:(依托于rdd,GB以上,窄依赖最佳)
Graph图计算:
Giraph、graphX(spark)
neo4j(不支持分布式)
MPI:
HAMA
openmpi
流计算:
storm、spark streaming(小批量流)
日志收集:
chukwa
flume
Scribe
数据导入:
Hiho, sqoop
newsql:
Pig, Hive、Phoenix
spark on sql-->前身是shark(处理java程序统计数据困难)
impala、drill
数据处理流:
oozie, Cascading
监控工具:
ganglia,nagos,zabbix,ambari
高一致性:
zookeeper、bookeeper
大表(大磁盘缓存、避免sql等运算出结果)(nosql):
hbase、Cassandra
k,v库(nosql):
redis、memcached、leveldb(SSD磁盘)
文档库(nosql):
couchdb、mongodb
简单的web框架:h5+node.js+mongodb
机器学习:
mahout、mlib(spark)、R(Rhadoop,Rspark)、weka
消息队列:
activemq、rabbitmq、qpid、kafka、hedwig,redis,memcacheq
ETL:
kettle
分布式搜索:
solr(web)、elasticsearch
分享到:
相关推荐
Hadoop生态圈,讲解,带你深入了解Hadoop平台。
hadoop生态圈组件搭建全过程,介绍如何安装一套大数据计算框架的过程。
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅...
最新Hadoop生态圈开发学习资料 Linux、Hadoop、HDFS、Zookeeper、Hive、Flume、Kafka、等等
Hadoop生态圈介绍及入门
在Ubuntu系统下安装Hadoop圈中的部分软件。 VMWare Ubuntu SSH JDK Hadoop MySQL Hive Hbase Mahout Sqoop Spark Flume Kafka ElasticSearch Redis Phoenix
Hadoop生态圈总体介绍 Hadoop生态圈总体介绍 Hadoop生态圈总体介绍
第1讲_Hadoop生态圈简介
详细描述了spark,hadoop生态圈的各个组建,能充分了解各个组建的原理以及使用
Centos 7安装配置Hadoop生态圈CDH5版本 其中包括hadoop hbase hive spark 等组件安装
Hadoop生态圈常用软件打包rpm spec描述文件,包括 Hadoop,spark, alluxio,spark,ranger等
hadoop生态圈hive数据仓库的部署详细流程
基于Spring Boot与Hadoop生态圈构建的大数据平台+源代码+文档说明 -------- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96...
Hadoop专业解决方案-第一章大数据和Hadoop生态圈.docx
Hadoop专业解决方案-第1章大数据和Hadoop生态圈.docx
毕业设计项目,使用scrapy框架和hadoop生态圈框架实现的招聘信息大数据处理.zip
hadoop 2.7.5 集群搭建 spark 2.2.1 集群搭建,配置scala编译环境 hive on spark 安装 hbase 搭建
毕业设计&课设--毕业设计项目,使用scrapy框架和hadoop生态圈框架实现的招聘信息大数据处理