概览

知识库概览

repository

概述

个人学习知识库涉及到数据仓库建模、实时计算、大数据、Java、算法等。
在线文档

RoadMap

基础能力

数据结构

JVM

Java

并发编程

JDK源码

todo

算法

算法题解

BigData

cache

数据编排技术

alluxio

datalake

hudi

iceberg

kvstore

K-V结构存储,如Hbase、RocksDb(内嵌KV存储)等

rocksDB

HBase

Hadoop

广义上的Hadoop生态圈的学习笔记，主要记录HDFS、MapReduce、Yarn相关读书笔记及源码分析等。

HDFS

MapReduce

Yarn

Yarn快速入门

生产配置

Engine

计算引擎相关，主要包含Flink、Spark等

Flink

主要包含对Flink文档阅读的总结和相关Flink源码的阅读，以及Flink新特性记录等等

Core

SourceCode

Book

Flink内核原理与实现

Feature

Practice

Connector

自定义Table Connector

monitor

搭建Flink任务指标监控系统

Spark

主要包含Spark相关书籍读书笔记、Spark核心组件分析、Spark相关API实践以及Spark生产踩坑等。

Spark Core

Spark SQL

Spark Practice

Spark生产实践

Spark Streaming

源码解析

Collect

数据采集框架，主要包含Binlog增量与SQL快照方式框架

Canal

CanalOverView

Debezium

Flume

Sqoop

MQ

消息中间件相关，主要包含大数据中使用比较多的Kafka和Pulsar

Kafka

Pulsar

Zookeeper

schedule

Azkaban

Azkaban生产实践

DolphinScheduler

DolphinScheduler快速开始

olap

主要核心包含Kudu、Impala相关Olap引擎，生产实践及论文记录等。

Hive

Presto

presto概述

clickhouse

Druid

Druid概述

Kylin

Kylin概述

Kudu

paper

Kudu论文阅读

Impala

graph

图库相关

nebula graph

tools

工具集相关，包含计算平台、sql语法Tree等

zeppelin

zeppelin

SQL语法树

calcite

ApacheCalciteOverView

数据仓库建设

理论

数据中台设计

方案实践

读书笔记

数据中台读书笔记

devops

maven

服务监控

Prometheus

mac

iterm2

贡献方式

欢迎通过Gitter参与贡献
贡献者指南

技术分享

下一页bigdata

最后更新于2年前

hashtagrepository

hashtag概述

hashtagRoadMap

hashtag基础能力

hashtag数据结构

hashtag分布式理论

hashtag计算机理论

hashtagScala

hashtagJVM

hashtagJava

hashtag算法

hashtagBigData

hashtagcache

hashtagdatalake

hashtagkvstore

hashtagHBase

hashtagHadoop

hashtagEngine

hashtagCollect

hashtagCanal

hashtagDebezium

hashtagMQ

hashtagZookeeper

hashtagschedule

hashtagolap

hashtaggraph

hashtagtools

hashtag数据仓库建设

hashtag理论

hashtag数据中台设计

hashtag方案实践

hashtag读书笔记

hashtagdevops

hashtagmaven

hashtag服务监控

hashtagmac

hashtag贡献方式

hashtag技术分享