hadoop - Should map() and reduce() return key/value pairs of same type? -
एक MapReduce नौकरी लिखते समय (विशेषकर Hadoop यदि प्रासंगिक हो), तो एक को मानचित्र () को परिभाषित करना चाहिए
और एक कम करें ()
फ़ंक्शन, दोनों कुंजी / मान युग्म के अनुक्रम प्रदान करते हैं।
शब्द गणना के विहित उदाहरण में, दोनों कार्यों के प्रकार (स्ट्रिंग, int) के युग्म उत्पन्न करते हैं
कुंजी एक शब्द और मूल्य की घटनाओं की गिनती के साथ। यहां- साथ ही साथ मैंने अन्य सभी उदाहरणों में देखा है- आउटपुट किए गए कुंजी और वैल्यू के प्रकार दो फ़ंक्शंस के बीच संगत हैं।
कुंजी / मान जोड़ी का प्रकार map ()
और कम करें ()
MapReduce के किसी भी आवेदन के भीतर ही हो सकता है? यदि हां: क्यों?
नहीं जाहिर है, ज़ाहिर है, मानचित्र के लिए आउटपुट जोड़े के प्रकार और कम से कम इनपुट जोड़े समान हों, क्योंकि एक को दूसरे में दिया जा रहा है।
यह काफी संभव है, हालांकि, यह संभव है कि आप कार्य को कम कर सकें कि आउटपुट मानचित्र जोड़े से आए एक अलग प्रकार की तुलना में - उदाहरण के लिए, यदि नक्शा कार्य में किसी दस्तावेज़ में शब्द गिना गया हो, लेकिन कार्य को कम किया जाए एक औसत शब्द आवृत्ति गणना उस स्थिति में मानचित्र पूर्णांक होगा, लेकिन कम से कम अस्थायी बिंदु संख्याओं का उत्सर्जन होगा।
Comments
Post a Comment