hadoop - Should map() and reduce() return key/value pairs of same type? -


एक MapReduce नौकरी लिखते समय (विशेषकर Hadoop यदि प्रासंगिक हो), तो एक को मानचित्र () को परिभाषित करना चाहिए और एक कम करें () फ़ंक्शन, दोनों कुंजी / मान युग्म के अनुक्रम प्रदान करते हैं।

शब्द गणना के विहित उदाहरण में, दोनों कार्यों के प्रकार (स्ट्रिंग, int) के युग्म उत्पन्न करते हैं कुंजी एक शब्द और मूल्य की घटनाओं की गिनती के साथ। यहां- साथ ही साथ मैंने अन्य सभी उदाहरणों में देखा है- आउटपुट किए गए कुंजी और वैल्यू के प्रकार दो फ़ंक्शंस के बीच संगत हैं।

कुंजी / मान जोड़ी का प्रकार map () और कम करें () MapReduce के किसी भी आवेदन के भीतर ही हो सकता है? यदि हां: क्यों?

नहीं जाहिर है, ज़ाहिर है, मानचित्र के लिए आउटपुट जोड़े के प्रकार और कम से कम इनपुट जोड़े समान हों, क्योंकि एक को दूसरे में दिया जा रहा है।

यह काफी संभव है, हालांकि, यह संभव है कि आप कार्य को कम कर सकें कि आउटपुट मानचित्र जोड़े से आए एक अलग प्रकार की तुलना में - उदाहरण के लिए, यदि नक्शा कार्य में किसी दस्तावेज़ में शब्द गिना गया हो, लेकिन कार्य को कम किया जाए एक औसत शब्द आवृत्ति गणना उस स्थिति में मानचित्र पूर्णांक होगा, लेकिन कम से कम अस्थायी बिंदु संख्याओं का उत्सर्जन होगा।


Comments

Popular posts from this blog

c# - How to capture HTTP packet with SharpPcap -

php - Multiple Select with Explode: only returns the word "Array" -

php - jQuery AJAX Post not working -