- 运行提交参数
运行提交参数
在XLearning客户端,使用$XLEARNING_HOME/bin/xl-submit命令,将作业提交至Yarn集群进行调度执行。提交命令使用说明请见README运行示例部分,详细提交参数说明如下:
| 参数名称 | 含义 |
|---|---|
| app-name | 指定作业名称 |
| app-type | 指定作业类型,默认为XLearning,可根据使用深度学习平台设置为TensorFlow、Caffe、XGBoost等 |
| input | 输入文件路径,格式为 HDFS路径#本地文件夹名称 |
| output | 输出文件路径,格式为 HDFS路径#本地文件夹名称 |
| files | 指定作业执行所需本地文件 |
| cacheArchive | 指定作业执行所需相关HDFS压缩文件 |
| cacheFile | 指定作业执行所需相关HDFS文件 |
| launch-cmd | 作业执行命令 |
| user-path | 用户追加环境变量$PATH |
| jars | 指定用户自定义jar包文件 |
| user-classpath-first | 是否优先加载用户自定义jar包,默认为系统配置xlearning.user.classpath.first |
| conf | 设置系统配置 |
| am-cores | 指定AM申请使用的CPU核数,默认个数为系统配置xlearning.am.cores |
| am-memory | 指定AM申请使用的内存大小,默认单位MB,默认大小为系统配置xlearning.am.memory |
| ps-num | 指定ps申请数目,默认个数为系统配置xlearning.ps.num |
| ps-cores | 指定ps申请的CPU核数,默认个数为系统配置xlearning.ps.cores |
| ps-memory | 指定ps申请的内存大小,默认单位为MB,默认大小为系统配置xlearning.ps.memory |
| worker-num | 指定worker申请数目,默认个数为系统配置xlearning.worker.num |
| worker-cores | 指定worker申请的CPU核数,默认个数为系统配置xlearning.worker.cores |
| worker-memory | 指定worker申请内存,默认单位为MB,默认大小为系统配置xlearning.worker.memory |
| chiefworker-memory | 指定chief worker申请内存, 主要是针对TensorFlow作业中index 0的worker,默认大小同worker-memory一致 |
| evaluatorworker-memory | 指定evaluator worker申请内存,主要针对TensorFlow Estimator作业中的estimator角色,默认大小同worker-memory一致 |
| queue | 指定作业提交队列,默认为系统配置xlearning.app.queue |
| priority | 指定作业提交优先级,默认为系统配置xlearning.app.priority对应级别 |
| board-enable | 是否开启Board服务,默认为系统配置xlearning.tf.board.enable |
| board-index | 指定开启Board服务的work index,默认为系统配置xlearning.tf.board.worker.index |
| board-logdir | Board日志存放路径,默认为系统配置xlearning.tf.board.log.dir |
| board-reloadinterval | TensorBoard数据加载时间间隔,默认为系统配置xlearning.tf.board.reload.interval |
| board-historydir | Board日志HDFS上传路径,默认为系统配置xlearning.tf.board.history.dir |
| board-modelpb | VisualDL加载的模型文件,默认为系统配置xlearning.board.modelpb |
| board-cacheTimeout | VisualDL加载缓存间隔时间,默认为系统配置xlearning.board.cache.timeout |
| input-strategy | 输入文件加载策略,默认为系统配置xlearning.input.strategy |
| inRenameInputFile | 当输入文件加载策略为DOWNLOAD时,设置是否对下载后的文件进行重命名,默认为系统配置xlearning.inputfile.rename |
| stream-epoch | 当输入文件加载策略为STREAM时,流式数据读取次数,默认为系统配置xlearning.stream.epoch |
| inputformat | 当输入文件加载策略为STREAM时,指定inputformat类,默认为系统配置xlearning.inputformat.class |
| inputformat-shuffle | 当输入文件加载策略为STREAM时,指定inputformat输入是否需要shuffle操作,默认为系统配置xlearning.input.stream.shuffle |
| output-strategy | 输出文件加载策略,默认为系统配置xlearning.output.strategy |
| outputformat | 当输出文件加载模式为STREAM时,指定outputformat类,默认为系统配置xlearning.outputformat.class |
| tf-evaluator | 在分布式TensorFlow作业类型下,是否设置evaluator角色,默认为系统配置xlearning.tf.evaluator |
| output-index | 指定保存index对应worker的输出文件,默认保存所有worker的输出结果 |
