scala常用操作

发布时间:2019-10-13 09:03:38编辑:auto阅读(2364)

    scala常用操作

    版本信息
    python3.7
    pyspark2.4.0

    from pyspark import SQLContext,SparkContext,SparkConf
    
    conf = SparkConf()
    sc = SparkContext(conf=conf)
    sqlContext = SQLContext(sc)
    #加载csv文件
    data = sqlContext.read.format("csv").option("header","true").load("union_order_user")
    #按字段降序排序
    sorted=data.sort("created_at",ascending = False)
    #展示前100条记录 默认展示20条
    sorted.show(100)

关键字