【Hadoop MapReduce】Filtering Patterns [Hadoop / Spark]
基本的な、mapperとreducerの書き方はだいたいわかったので、
MapReduce Design Patternsというものを勉強し始めました。
よく使うフィルタリング、サンプリング、集計、データ結合などの基本的な部分を理解することで、それを組み合わせ使えるようになることが目的です。
Filtering Patterns
・Simple Filter
・Bloom Filter
確率的なフィルタ
・Sampling
・Random Sampling
・Top N
MapReduce Design Patternsというものを勉強し始めました。
よく使うフィルタリング、サンプリング、集計、データ結合などの基本的な部分を理解することで、それを組み合わせ使えるようになることが目的です。
Filtering Patterns
・Simple Filter
・Bloom Filter
確率的なフィルタ
・Sampling
・Random Sampling
・Top N