1、将java项目打包成jar文件

    具体过程这里不解释,在我的另一篇博客 将java程序打包成jar 里,有win系统通过idea打包jar的教程。


2、打开hadoop集群,start-all.sh


3、将jar包传到linux平台上,删除jar包里的.SF .RSA *SF文件

zip -d xxx.jar ‘META-INF/.SF’ ‘META-INF/.RSA’ ‘META-INF/*SF’


4、将jar包上传到hadoop集群(默认在/user/hadoop/下面)

hadoop fs -put xxx.jar


5、通过hadoop jar指令运行jar文件

hadoop jar xxx.jar [输入文件] [输出文件存放路径]


6、在输出文件存放路径下面找到程序运行结果文件,通过cat指令打印文件内容

hadoop fs -cat /user/hadoop/output/part-r-00000

更多推荐

hadoop 在hadoop集群上执行java程序