python里的map和reduce

发布时间:2019-09-15 10:01:33编辑:auto阅读(1542)

    有不少文章介绍python的map与reduce,这到底是什么样的东西呢?

    先看看google的paper里对mapreduce的解释

    http://static.googleusercontent.com/media/research.google.com/zh-CN//archive/mapreduce-osdi04.pdf


    MapReduce is a programming model and an associated implementation for processing and generating large data sets. Users specify a map function that processes a key/value pair to generate a set of intermediate key/value pairs, and a reduce function that merges all intermediate values associated with the same intermediate key.



    map

    map(function, iterable, ...)的第一个参数是一个函数,第二个参数接受一个iterable对象(字符串,列表,元组等)。该函数返回一个列表。


    python实现map的代码

    实现:将输入的不规范的用户名转换成首字母大写的标准格式

    逻辑写的简单点,就3种情况,当然可以写成4种,就相对复杂了。。。

    1. 初次循环,首字母小写

    2. 非初次循环,字母大写

    3. 其它(因为初次循环,首字母大写和非初次循环,字母小写默认就满足我们的需求)

    def lower2upper(s):
        loop = 0   '''循环计数'''
        str = ""    '''定义一个空字符串'''
        for i in s:
            if i.islower() and loop ==0:
                str = str + i.upper()
                loop +=1
            elif i.isupper() and loop !=0:
                str = str + i.lower()
                loop +=1
            else:
                str = str + i
                loop +=1
        return str
    
    result = map(lower2upper,["adam","LiSA","ChEn","Peter","tOM"])
    print result



    reduce
    reduce(function, iterable[, initializer])把函数从左到右累积作用在元素上,产生一个数值。如reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])就是计算((((1+2)+3)+4)+5)。Python提供的sum()函数可以接受一个list并求和,现实现一个prod()函数,可以接受一个list并利用reduce()求积。
    def prod(list):
        def multiply(x, y):
            return x * y
        return reduce(multiply, list)

    print prod([1, 3, 5, 7])

    map和reduce
    我们可以综合利用map和reduce来完成一个简单的字符串到数字的程序。
    def str2int(s):
        def fn(x, y):
            return x * 10 + y
        def char2num(s):
            return {"0":0, "1":1, "2":2, "3":3, "4":4, "5":5, "6":6, "7":7, "8":8, "9":9}
        return reduce(fn, map(char2num, s))

    print str2int("12345")
    其中map用于将字符串拆分为对应的数字,并以list的方式返回。reduce用来累加各个位上的和。

关键字