hadoop - Should map() and reduce() return key/value pairs of same type? -


एक MapReduce नौकरी लिखते समय (विशेषकर Hadoop यदि प्रासंगिक हो), तो एक को मानचित्र () को परिभाषित करना चाहिए और एक कम करें () फ़ंक्शन, दोनों कुंजी / मान युग्म के अनुक्रम प्रदान करते हैं।

शब्द गणना के विहित उदाहरण में, दोनों कार्यों के प्रकार (स्ट्रिंग, int) के युग्म उत्पन्न करते हैं कुंजी एक शब्द और मूल्य की घटनाओं की गिनती के साथ। यहां- साथ ही साथ मैंने अन्य सभी उदाहरणों में देखा है- आउटपुट किए गए कुंजी और वैल्यू के प्रकार दो फ़ंक्शंस के बीच संगत हैं।

कुंजी / मान जोड़ी का प्रकार map () और कम करें () MapReduce के किसी भी आवेदन के भीतर ही हो सकता है? यदि हां: क्यों?

नहीं जाहिर है, ज़ाहिर है, मानचित्र के लिए आउटपुट जोड़े के प्रकार और कम से कम इनपुट जोड़े समान हों, क्योंकि एक को दूसरे में दिया जा रहा है।

यह काफी संभव है, हालांकि, यह संभव है कि आप कार्य को कम कर सकें कि आउटपुट मानचित्र जोड़े से आए एक अलग प्रकार की तुलना में - उदाहरण के लिए, यदि नक्शा कार्य में किसी दस्तावेज़ में शब्द गिना गया हो, लेकिन कार्य को कम किया जाए एक औसत शब्द आवृत्ति गणना उस स्थिति में मानचित्र पूर्णांक होगा, लेकिन कम से कम अस्थायी बिंदु संख्याओं का उत्सर्जन होगा।


Comments

Popular posts from this blog

MVP, design question -

excel - Populate list via a bi-Condition -

iphone - How do I make a UIPickerView in a UIActionSheet -