这是一个使用ANSI C编写(C89标准)的online judge的评测机,将在完善优化后作为KalznOJ的评测沙盒。Judger每次从一个json文件中读入任务的配置信息。然后生成评测结果,在测试例中,结果将写入指定目录的result.json。
目前Judger仅在centOS7以及ubnutu20.04中测试过,理论上适用于所有支持seccomp沙盒机制的linux版本。在进行编译前,请确保已经安装了seccomp库。
seccomp库安装方法(以ubuntu为例)
sudo apt install libseccomp-dev libseccomp2 seccomp
虽然seccomp文件夹中上传了seccomp包,但是仅适用于unbuntu20.04,目的是让travis ci用于build。请使用时请务必自行安装seccomp库。如有其他问题,请自行解决。
请连接seccomp库进行编译,在build目录下。
make
makefile将会对代码进行编译,并将产物kalznjudger
移动至/usr/bin
目录下。目前版本均为测试版本,错误和调试信息将全部计入log并显示在屏幕上。
使用时,请输入
sudo kalznjudger <json file path> [log path]
其中如果省略log path
,在json解析成功之前,log目录将默认设置为Judger同目录下的log.log
,当json解析成功后,log路径将采用json配置中的log。这里不建议省略log path
,建议指令中log path
与json中配置的log path
保持一致。执行kalznjudger
时,应使用root或sudo。否则judger将会报错。Judger评测完成后,会在工作区的RESULT_FILE_PATH目录下生成结果json文件。
删除/usr/bin
目录中的kalznjudger即可。
sudo rm -f /usr/bin/kalznjudger
这里使用JSON文件作为示例,数据项的意义及注意事项见注释。 对于任务配置的json文件,如果有说明有默认值,则为选填项,否则必填。
{
"taskID":"100031", // 任务ID号 必选项,务必从1开始。0视为无效ID号。
"maxCharBuffer" : "10000000", //字符串最大缓存 必选项
"judgeMode": 0, // 评测模式 默认为SINGLE_RESULT_MODE 具体见下表格
"iOMode": 0, // IO模式 默认为STD_IO 见下表
"gid" : 65534, // gid 默认为DEFAULT_UID 评测时的进程的effective gid
"uid" : 65534,// uid 默认为DEFAULT_UID 评测时的进程的effective uid
"strictMode" : true, // 严格模式,默认为NOT_STRICT_MODE 见下表
"workSpacePath":"/home/kalzn/Desktop/testworkspace/",
// 工作区目录 必选项 评测该任务的工作区目录,以下涉及到目录的配置,均必须是相对工作区的目录,或者绝对目录。
"resultPath" : "result.json", //输出结果的json文件, 默认为RESULT_FILE_PATH
"logPath":"/home/kalzn/Desktop/testworkspace/log.log", // log目录 必选项
"sPJ": true, // 是否启用SPJ,默认为false
"spjExePath":"/home/kalzn/Desktop/testworkspace/spj", // SPJ目录,当isSPJ=true时,必填项
"spjExeName":"spj", // SPJ可执行文件名字,当isSPJ=true时,必填项
"maxSPJTime" : 10000, // SPJ时限,单位为ms, 默认为 MAX_SPJ_TIME_LIMIT
"maxSPJMemory": 102400 // SPJ内存限制 单位为kb, 默认 MAX_SPJ_MEMORY_LIMIT
"translator": { // 翻译选项
"mode": 2, // 翻译模式 必选项 见下表
"compilerPath": "/usr/bin/javac", // 编译器路径 当翻译模式==COMPILER_MODE或者COMPILER_INTERPRETER_MODE时,必选项
"compilerInfoPath" : "compiler.log", // 编译器输出路径,默认为DEFAULT_COMPILER_INFO_PATH
"compilerOptions":[ // 编译器选项 当翻译模式==COMPILER_MODE或者COMPILER_INTERPRETER_MODE时,必选项
"javac", "Main.java"
],
"compilerProductName":"Main.class",
// 编译产物名 当翻译模式!=INTERPRETER_MODE时,必选项,Judger编译后,将确认工作区目录下是否生成了名为compilerProductName的文件,以此判定编译是否正确。
"interpreterInfoPath" : "interpreter.log", // 解释器输出路径,默认为DEFAULT_INTERPRETER_PATH
"interpreterPath":"/usr/bin/java", // 解释器路径,当翻译模式==INTERPRETER_MODE,或者COMPILER_INTERPRETER_MODE时 必选项。
"interpreterOptions":[ // 解释器选项,当翻译模式==INTERPRETER_MODE或者或者COMPILER_INTERPRETER_MODE时 必选项。
"java", "Main"
]
},
"data" : [ // 数据配置,这里数据的数量不超过MAX_DATA_CASE_NUMBER个
{
"inputData":"data/1.in", // 输入数据
"outputData":"data/output.out", // 输出文件(一般所有数据填一个即可)
"stdAnswer":"data/1.out", // 标准输出
"maxCPUTime": 1000, //时限 单位为ms
"maxMemory" : 102400, // 内存限制, 单位为kb
"maxStack" : 1024000 //Stack数量限制。
},
{
"inputData":"data/2.in",
"outputData":"data/output.out",
"stdAnswer":"data/2.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
},
{
"inputData":"data/3.in",
"outputData":"data/output.out",
"stdAnswer":"data/3.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
},
{
"inputData":"data/4.in",
"outputData":"data/output.out",
"stdAnswer":"data/4.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
}
]
}
选项 | 取值 | 意义 |
---|---|---|
Task.judgeMode | ||
SINGLE_RESULT_MODE(0) | 单一结果模式,且若某样例没有AC,之后的样例直接跳过 | |
POINTS_MODE(1) | 积分模式,返回每个样例的结果,即使某样例没有AC,也会接着评测后面的样例。 | |
ONLY_COMPILE_MODE(2) | 只编译模式 (详见文档 并发评测与解释 了解详情) | |
Task.iOMode | ||
STD_IO(0) | 评测时使用标准读入输出 | |
FILE_IO(1) | 评测时使用文件读入输出,文件路径为FILEIO_INPUT_PATH以及FILEIO_OUTPUT_PATH | |
Task.strictMode | ||
NOT_STRICT_MODE(0) |
在答案和输出匹配时,按照以下执行: 1、如果输出或者答案最后有一个'\n',则删掉一个'\n'。 2、将答案和输出的所有连续空白字符都用一个空格替代。 3、如果此时输出和答案相等,则AC。 4、否则WA。 |
|
STRICT_MODE(1) |
在答案和输出匹配时,按照以下执行: 1、如果输出或者答案最后有一个'\n',则删掉一个'\n'。 2、如果输出和答案相等,则AC。 3、否则:将答案和输出的所有连续空白字符都用一个空格替代。 4、如果此时输出和答案相等,则PE。 5、否则WA。 |
|
Task.translator.mode | ||
COMPILER_MODE(0) |
compiler mode, 编译模式 此模式下,judger先切换到work space目录下,根据设置的编译器路径及选项进行编译, 这里规定产生物的名字应为compilerProductName,此后judger将检测目录下是否成功生成名字为 compilerProductName的文件,以判定编译是否成功。编译信息会输出至设定的文件中。如果失败则报告编译失败,否则运行编译产物。 这里box进程经初始化,会直接使用exec函数,运行编译后的产物。(例如C语言,属于此种模式) |
|
INTERPRETER_MODE(1) |
interpreter mode 解释模式 此模式下,judger先切换到work space目录下,直接根据解释器路径和选项,执行解释器。在box进程初始化成功后,启用解释器运行代码,解释器报错将输出至设定的文件中。(例如python语言,属于此种模式) |
|
COMPILER_INTERPRETER_MODE(2) |
compiler interpreter mode 编译解释模式 此模式下,judger先切换到work space目录下,先编译产生编译产物,然后用解释器运行编译产物。(例如java语言,属于此种模式) |
|
DO_NOT_TANSLATE_MODE(3) |
do not tanslate mode 不做翻译模式 直接运行名为compilerProductName的可执行文件,不做任何处理,详见文档 并发评测与解释 了解详情 |
{
"taskID": 100031, // 任务ID号
"doneTime": "2021-07-18 21:06:22", // 任务完成时间
"judgeTime": 15753, //ms 评测所花费的实际时间 (从开始解析任务json到评测结束的实际时间)
"extraTime": 819, //ms 评测所花费的额外时间 ( 评测所花费的实际时间 减去 所有样例下待测程序运行的实际时间之和 )
// judger在用于处理进程、初始化配置、匹配输出等非待测程序运行开销的时间
"result": [{
"time": 0, //ms 样例耗费CPU时间(按照这个标准比对是否超时)
"realTime": 5, //ms judger运行此样例的真正时间 (仅仅用于评断judger效率)
"memory": 1660, //kb 耗费内存
"signal": 0, // 待测进程结束信号量
"code": 0, // 待测程序exit code
"result": 0, // 评测结果
"detail": "No info" // 评测信息
}, {
"time": 0,
"realTime": 4,
"memory": 1656,
"signal": 0,
"code": 0,
"result": 0,
"detail": "No info"
}]
}
工作区是Judger在评测时的工作目录,与评测有关的数据、待测源程序等最好都在此目录下,Judger所生成的编译器和解释器信息,以及最终结果都将会存储在此。当高层管理程序回收时,应该从工作区目录回收评测结果,并做好工作区的清理。
v0.2.0版本发布的重要功能
相信大家都注意到了,在评测选项中,有几处看起来令人困惑的内容。
第一处是Task.judgeMode,评测模式中的ONLY_COMPILE_MODE。在此模式下judger仅仅对目标代码进行编译,只返回编译成功或者编译失败。不进行真正的评测。
第二处是Task.translator.mode,翻译模式的DO_NOT_TANSLATE_MODE,在此模式下,judger直接运行compilerProduct,而不进行编译或者解释工作。
这两者都是为了高层的并发评测调度准备的。首先,为了更好的对大量任务进行评测,并发评测应由高层的任务队列管理器进行调配。究其原因是,高层的任务队列管理器知晓目前待测的所有任务,相较于底层judger,它可以更好的对任务调配。
为了更好的利用处理机,judger允许高层将评测任务拆解为编译过程和执行过程。对于一个评测任务,它只要编译过一次,就可以对一组样例执行评测。
试想这么一个场景:高层队列管理模组接收到一个c++代码的评测任务,它有10组数据。此时评测机不是太繁忙。所以高层决定对其并发评测。它先向judger发送一个评测模式为ONLY_COMPILE_MODE的任务。judger完成编译后就向高层返回编译是否正确。当编译正确时,高层并发地执行10个评测任务,每个包含1组样例。而这10个任务的翻译模式均为DO_NOT_TANSLATE_MODE。然后高层接受10组样例的返回结果就OK了。
结果名 | 结果代码 | 说明 |
---|---|---|
ACCEPTED | 0 | 该测试点通过了测试 |
WRONG_ANSWER | 1 | 该测试点输出与标准答案不一致,或spj认为该待测程序答案错误 |
TIME_LIMIT_EXCEEDED | 2 | 待测程序没有在时间限制内给出答案 |
MEMORY_LIMIT_EXCEEDED | 3 | 待测程序没有在内存限制内给出答案 |
RUNTIME_ERROR | 4 | 待测程序崩溃 |
PRESENTATION_ERROR | 5 | 待测程序格式错误,此结果只在严格模式生效 |
OUTPUT_LIMIT_EXCEEDED | 6 | 待测程序输出字符数大于maxCharBuffer |
COMPILE_ERROR | 7 | 待测程序没有通过编译 |
SKIP | 8 | 跳过,当评测模式为SINGLE_RESULT_MODE时,如果一个测试点不为AC或者PE,则后面的测试点跳过 |
SYSTEM_ERROR | 9 | 系统错误,执行log |
系统在得出评测结果时按照以下顺序: 首先查看box是否正常退出,检查是否系统错误。然后检查待测程序返回码和信号量,查看是否RE,然后比较其使用的CPU时间和规定限制,查看是否超时,此后比较其使用的内存和规定限制,查看是否超内存。最后调用matcher或者spj,对比输出和答案,查看是否WA,或者PE。在single result mode下,如果一个测试点为AC或者PE,才会接着评测下一个用例。否则直接退出。
Judger产生的所有System Error都将会尽最大努力的存储到指定的log文件中。这里提供错误代码对照。
错误名 | 错误代码 | 说明 |
---|---|---|
INVALID_JUDGE_CONFIG | -100 | 评测配置不合法 |
WAIT_BOX_FAILED | -101 | 无法收集box进程资源统计, |
WAIT_KILLER_FAILED | -102 | 无法wait killer进程终止 |
FORK_BOX_FAILED | -103 | 无法fork box进程 |
FORK_KILLER_FAILED | -104 | 无法fork killer进程 |
FORK_KILLER_FOR_SPJ_FAILED | -106 | 无法fork用于监控spj的killer进程 |
WAIT_SPJ_FAILED | -107 | 无法收集spj进程资源统计 |
WAIT_KILLER_FOR_SPJ_FAILED | -108 | 无法wait用于监控spj的killer进程终止 |
COMPILER_RUN_FAILED | -109 | 编译器无法启动 |
PERMISSION_ERROR | -110 | judge进程不是root |
ACCESS_WORKSPACE_FAILED | -111 | 无法访问工作区目录 |
FILE_IO_INIT_FAILED | -112 | 文件IO模式初始化失败 |
WRITE_RESULT_FILE_FAILED | -113 | 写入结果文件失败 |
BOX_SECURITY_CONFIG_LOAD_FAILED | -200 | 安全配置加载失败 |
BOX_DATA_REDIRECT_FAILED | -201 | 评测数据重定向失败 |
BOX_EXE_RUN_FAILED | -202 | 无法启动待测程序 |
BOX_SET_UID_FATLED | -203 | 无法设置用户及用户组 |
BOX_SET_LIMIT_FAILED | -204 | 无法设置资源限制 |
KILLER_SLEEP_FAILED | -300 | killer无法阻塞 |
KILLER_KILL_FAILED | -301 | killer无法kill掉目标进程 |
MATCHER_OPEN_DATA_FAILED | -400 | matcher无法打开数据文件 |
MATCHER_STD_DATA_TOO_LARGE | -401 | 标准答案文件字符数大于maxCharbuffer |
LOG_IDENTIFY_ERROR_FAILED | -500 | log无法识别错误 |
LOG_FILE_OPEN_FAILED | -501 | 无法打开log文件 |
其中,-50系列报错将直接输出至stderr,其他错误将记录到log文件
Judger采用seccomp沙盒机制,且box在极低权限下运行,在标准IO模式下,由于seccomp设置,box无法执行execve,fork,clone等系统调用,无法写文件。 box进程设置的effective UID权限极低,无法读取文件。文件IO模式的权限控制还没有配置好,所以请不要在公开环境使用本系统。
SPJ程序理论上可以使用任何语言书写,judger执行SPJ时,将会传入3个参数:1、输入文件路径,2、标准输出文件路径,3、待测程序输出文件路径。这里占用SPJ程序的Exit Code作为评测的结果,SPJ的返回值为0,则Judger认为待测程序在此样例下通过,其他情况均为WRONG_ANSWER。因为很多语言Exit Code不太好设定,且性能较C/C++来说很差,所以这里还是建议使用C/C++书写,SPJ程序需要引入spjlib.h
文件,编译SPJ时,要链接spjlib.cpp
.在开始调用START_JUDGE()
,另外,input,output,stdoutput
分别是输入数据,待测程序输出数据以及标准输出的文件指针。在得到评测结果后,应调用EXIT_JUDGE(<ACCEPTED|WRONG_ANSWER>)
返回结果。不要直接return
。这里要注意的是,如果SPJ程序崩溃、超时、超出内存限制,均视为源程序WRONG_ANSWER。这里给一个SPJ程序的示例。(判断答案和输入相差不超过1e-4)
#include "spjlib.h"
#include <cmath>
int main(int argc, char * argv[]) {
START_JUDGE();
//------------SPJ--CODE--------------------
double a;
fscanf(out, "%lf", &a);
double b;
fscanf(sout, "%lf", &b);
if (fabs(a - b) < 1e-4) {
EXIT_JUDGE(ACCEPTED);
}
EXIT_JUDGE(WRONG_ANSWER);
//------------SPJ--CODE--------------------
EXIT_JUDGE(ACCEPTED);
}
judger支持多文件代码评测,将所有代码文件放到工作区后,只要在任务json中配置好编译选项和解释选项即可。模块评测当作多文件测试,将用户提交的模块代码文件,连接驱动代码文件一起处理即可。
judger对编译和解释代码的过程有高度的自定义性。judger内置的4种翻译模式已经可以应对大部分的翻译过程。但是如果有特殊的翻译过程。你可以在translator的配置中运行自行定义的shell脚本。完成代码的编译工作。你也同样可以使用一段脚本运行待测程序。下面是一个示例,在示例中,使用自定义脚本完成对java代码的编译运行:
"translator": {
"mode": 2,
"compilerPath": "/usr/bin/bash",
"compilerOptions":[
"bash", "/home/kalzn/sh/make.sh", "/home/kalzn/workspace/Main.java", "/home/kalzn/workspace/Main.class"
],
"compilerProductName":"Main.class",
"interpreterPath": "/usr/bin/bash",
"compilerOptions":[
"bash", "/home/kalzn/sh/run.sh", "/home/kalzn/workspace/Main.class"
]
}
#!/bin/bash
# make.sh
javac $1 -o $2
#!/bin/bash
# run.sh
java $3
但是请保证脚本是可靠的! 系统没有对编译过程进行监控!
judger可以用于编译SPJ,因为存在only compiler mode, judger server也可以接受编译SPJ的任务。
如果没有重大改变,此章节没有随着版本更迭,所以json文件的配置可能与上面章节有出入。请以上面的章节为准。
以下演示在v0.2.0版本进行。这里对一个java源程序进行评测,源代码如下
import java.util.*;
public class Main {
public static void main(String[] args) {
Scanner in = new Scanner(System.in);
int a = in.nextInt(), b = in.nextInt();
System.out.println(a+b);
System.out.println(a-b);
}
}
这里将Main.java
以及对其评测的数据放到同一目录下,组成工作区。
然后配置json文件
{
"Judger": {
"maxCharBuffer" : "10000000"
},
"Task" : {
"taskID":"100031",
"workSpacePath":"/home/kalzn/Desktop/testworkspace/",
"logPath":"/home/kalzn/Desktop/testworkspace/log.log",
"translator": {
"mode": 2,
"compilerPath": "/usr/bin/javac",
"compilerOptions":[
"javac", "Main.java"
],
"compilerProductName":"Main.class",
"interpreterPath":"/usr/bin/java",
"interpreterOptions":[
"java", "Main"
]
},
"data" : [
{
"inputData":"data/1.in",
"outputData":"data/output.out",
"stdAnswer":"data/1.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
},
{
"inputData":"data/2.in",
"outputData":"data/output.out",
"stdAnswer":"data/2.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
},
{
"inputData":"data/3.in",
"outputData":"data/output.out",
"stdAnswer":"data/3.out",
"maxCPUTime": 1000,
"maxMemory" :102400,
"maxStack" : 1024000
},
{
"inputData":"data/4.in",
"outputData":"data/output.out",
"stdAnswer":"data/4.out",
"maxCPUTime": 1000,
"maxMemory" : 102400,
"maxStack" : 1024000
}
]
}
}
评测结束后,工作区目录下生成文件
其中result.json
内容如下
{
"taskID": 100031,
"time": "2021-07-10 03:35:56",
"result": [{
"time": 65,
"memory": 37664,
"signal": 0,
"code": 0,
"result": 0,
"detail": "No info"
}, {
"time": 74,
"memory": 37524,
"signal": 0,
"code": 0,
"result": 1,
"detail": "No info"
}, {
"time": 0,
"memory": 0,
"signal": 0,
"code": 0,
"result": 8,
"detail": "No info"
}, {
"time": 0,
"memory": 0,
"signal": 0,
"code": 0,
"result": 8,
"detail": "No info"
}]
}