課程名稱:Python mrjob 操作 Hadoop培訓(xùn)

        4401 人關(guān)注
        (78637/99817)
        課程大綱:

        Python mrjob 操作 Hadoop培訓(xùn)

         

         

        Python是做數(shù)據(jù)分析好的語(yǔ)言。

        大數(shù)據(jù)當(dāng)然也離不開Hadoop,Hadoop由JAVA寫成,但Python也可以很好地操控它。

        課程介紹了Python中MRjob模塊,通過(guò)該模塊,

        可以讓開發(fā)者非常簡(jiǎn)單的通過(guò)Python來(lái)使用Hadoop進(jìn)行數(shù)據(jù)分析。

        1 Python MRJob模塊的安裝

        2 使用MRJob實(shí)現(xiàn)文本統(tǒng)計(jì)

        3 重寫MRJob函數(shù)實(shí)現(xiàn)復(fù)雜數(shù)據(jù)處理

        4 Hadoop——Python各模塊介紹

        5 Python MRJob的運(yùn)行方式

        1
        Python玩轉(zhuǎn)Hadoop之MRjob入門

        1.PythonMRJob模塊的安裝

        2.HadoopPython各模塊介紹

        3.使用MRJob實(shí)現(xiàn)文本統(tǒng)計(jì)

        4.PythonMRJob的運(yùn)行方式

        5.重寫MRJob函數(shù)實(shí)現(xiàn)復(fù)雜數(shù)據(jù)處理

        使用 mrjob 實(shí)現(xiàn)詞組統(tǒng)計(jì)

        實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每部電影的熱度

        實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每部電影的觀看用戶列表

        實(shí)戰(zhàn)模擬 - 統(tǒng)計(jì)每個(gè)用戶的觀影列表


        請(qǐng) 登錄 后發(fā)表評(píng)論
        新評(píng)論
        全部 第1節(jié) 第2節(jié) 第3節(jié) 第4節(jié) 第5節(jié) 第6節(jié) 第7節(jié) 第8節(jié) 第9節(jié) 第10節(jié) 第11節(jié) 第12節(jié) 第13節(jié) 第14節(jié) 第15節(jié) 第16節(jié) 第17節(jié)
        我的報(bào)告 / 所有報(bào)告