操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    問題的提出

    在進(jìn)行數(shù)據(jù)處理時,我們經(jīng)常遇到這樣的需求:把同一個key的數(shù)據(jù)寫到同一個文件/文件夾中。

    這樣,在進(jìn)行后續(xù)的處理,比如查看某個key占的磁盤空間,單獨處理某個key的數(shù)據(jù)等都會非常方便。

    小米4圖片里面有個文件是th的_數(shù)字.數(shù)字.map是啥文件_文件夾里面的數(shù)字都是什么

    解決方案

    通過來解決這個問題很方便。方案就是:通過該key進(jìn)行分區(qū),這樣同一個key的值就都分配到一個分區(qū)中了。

    val people_rdd = sc.parallelize(Seq((1, "alice"), (1, "bob"), (2, "charlie")))
    

    數(shù)字.數(shù)字.map是啥文件_小米4圖片里面有個文件是th的_文件夾里面的數(shù)字都是什么

    val people_df = people_rdd.toDF("number", "name") people_df.write.partitionBy("number").text("people")

    數(shù)字.數(shù)字.map是啥文件_小米4圖片里面有個文件是th的_文件夾里面的數(shù)字都是什么

    或則寫成其他文件格式:

    people_df.write.partitionBy("number").json("people-json")
    people_df.write.partitionBy("number").parquet("people-parquet")
    

    文件夾里面的數(shù)字都是什么_數(shù)字.數(shù)字.map是啥文件_小米4圖片里面有個文件是th的

    通過來實現(xiàn)該功能非常方便,其實就是按照某個字段先分區(qū)文件夾里面的數(shù)字都是什么,若要排序也可以按分區(qū)進(jìn)行排序,然后再按規(guī)定的格式寫入即可。

    要注意的是,寫入的分區(qū)數(shù)據(jù)會按分區(qū)創(chuàng)建一個文件夾,同一個分區(qū)的數(shù)據(jù)在同一個文件夾中。若分區(qū)數(shù)太多,則創(chuàng)建的分區(qū)文件夾也會很多。

    小米4圖片里面有個文件是th的_文件夾里面的數(shù)字都是什么_數(shù)字.數(shù)字.map是啥文件

    另外,在寫數(shù)據(jù)的時候也可以對數(shù)據(jù)先進(jìn)行排序文件夾里面的數(shù)字都是什么,這樣就得到了一個排好序的數(shù)據(jù)文件。

    小結(jié)

    本文講述了如何把一個同一個key的文件寫入到同一個文件/文件夾的方法。

網(wǎng)站首頁   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權(quán)所有