问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

最新的spark支持python的什么版本

发布网友 发布时间:2022-04-23 20:27

我来回答

1个回答

热心网友 时间:2022-04-07 12:52

  两种方法:
  使用 spark-submit 解释执行python脚本
  使用 python 解释执行python脚本
  1. 使用Spark-submit解释执行python脚本
  python脚本中需要在开头导入spark相关模块,调用时使用spark-submit提交,示例代码如下:
  ===========================================================
  """odflow.py"""
  from pyspark import SparkContext
  fileDir = "/TripChain3_Demo.txt"
  # sc = SparkContext("local", "ODFlow")
  sc = SparkContext("spark://ITS-Hadoop10:7077", "ODFlow")
  lines = sc.textFile(fileDir)
  # python不能直接写多行的lambda表达式,所以要封装在函数中
  def toKV(line):
  arr = line.split(",")
  t = arr[5].split(" ")[1].split(":")
  return (t[0]+t[1]+","+arr[11]+","+arr[18],1)
  r1 = lines.map( lambda line : toKV(line) ).receByKey(lambda a,b: a+b)
  # 排序并且存入一个(repartition)文件中
  r1.sortByKey(False).saveAsTextFile("/pythontest/output")
  ===========================================================
  发布命令为:
  spark-submit \
  --master spark://ITS-Hadoop10:7077 \
  odflow.py
  2. 使用 python 解释执行python脚本
  直接用python执行会出现错误:
  ImportError: No mole named pyspark
  ImportError: No mole named py4j.java_gateway
  缺少pyspark和py4j这两个模块,这两个包在Spark的安装目录里,需要在环境变量里定义PYTHONPATH,编辑~/.bashrc或者/etc/profile文件均可
  vi ~/.bashrc # 或者 sudo vi /etc/profile
  # 添加下面这一行
  export PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH
  # 使其生效
  source ~/.bashrc # 或者 sudo source /etc/profile
  然后关闭终端,重新打开,用python执行即可
  python odflow.py
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
win7不能浏览网页,但用搜狗浏览器高速模式能上网,兼容就不行???求 ... ...64位 IE浏览器无法打开网页 搜狗浏览器可以打开 类似的新窗口网页都... 千牛工作台子账号怎么开权限?子账号的安全设置在哪里? 千牛怎么设置子账号-千牛设置子账号步骤 怎么把CD里的歌曲改成MP3格式? ...戴眼镜吗?想给孩子去检查一下,哪里比较推荐,渭南这块的 Windows Media Player将CD音乐转换为MP3 最简单的方法将CD转换为MP3音频文件(一步一步教你将CD音乐转换为MP3格 ... 孩子最近视力下降了有可能是近视吗?渭南哪里可以免费检查视力啊 奥运会跳远世界纪录 spark打开spark-shell报错 复合函数二阶偏导数问题 多元复合函数的二阶混合偏导求导顺序 复合函数的二阶偏导数怎么求 求助,多元复合函数求二阶偏导数老是计算错误怎么办 高数!!多元复合函数求二阶偏导数 画蓝色处不懂是怎么来的。 多元复合函数求二阶导,这道题里面多出来的f2'是什么情况?求大神解答 多元复合函数具有二阶连续偏导数中的yfv是什么意思 多元函数二阶偏导数存在为何一阶不一定连续 北方蒸月饼的做法大全 求助!多元复合函数求二阶偏导数老是计算错误怎么办。。 徐州蒸月饼的做法大全 复合函数二阶偏导数 (书上例题看不懂啊) 就求2阶那一步看不懂是怎么出来的。希望详细点,文字表述也可以 怎样做好月饼? 怎么蒸月饼 多元复合函数的二节混合偏导数 怎么做好吃的月饼?月饼可以蒸吗? 复合函数求二阶偏导数,这一步转换是怎么做到的(红色问好的那一步),求详细过程 蒸的月饼怎么做 多元复合函数的二阶偏导怎么求? spark加载hadoop本地库的时候出现不能加载的情况要怎么解决 maven中${spark.version}是什么意思? 在linux上如何配置spark环境,在linux上安装scala和spark老是失败_百度... spark必须要hadoop吗 求助,spark 提交任务到集群报错 spark 4040页面 不能访问。如果使用的是spark-shell启动写程序,4040可 ... spark 怎么启动worker spark独立模式还需要编译吗 如何在Ubuntu下搭建Spark集群 spark集群搭建时报TimeoutException是怎么回事 ubuntu 16.04怎么配置spark环境 安装spark需要安装scala吗 昆山电话的区号? Spark-shell和Spark-submit提交程序的区别 0520 是不是一个区号? spark输出log信息中怎么过滤INFO信息 江苏昆山的电话区号是多少? 如何运行含spark的python脚本 昆山区号是多少 sparksession 作用域