Kalzn_Code_Judger

愿你我的未来充满光明，陌生人。

Kalzn_Code_Judger

简介

这是一个使用ANSI C编写(C89标准)的online judge的评测机，将在完善优化后作为KalznOJ的评测沙盒。Judger每次从一个json文件中读入任务的配置信息。然后生成评测结果，在测试例中，结果将写入指定目录的result.json。

准备

目前Judger仅在centOS7以及ubnutu20.04中测试过，理论上适用于所有支持seccomp沙盒机制的linux版本。在进行编译前，请确保已经安装了seccomp库。

seccomp库安装方法（以ubuntu为例）

sudo apt install libseccomp-dev libseccomp2 seccomp

虽然seccomp文件夹中上传了seccomp包，但是仅适用于unbuntu20.04，目的是让travis ci用于build。请使用时请务必自行安装seccomp库。如有其他问题，请自行解决。

编译代码

请连接seccomp库进行编译，在build目录下。

make

makefile将会对代码进行编译，并将产物kalznjudger移动至/usr/bin目录下。目前版本均为测试版本，错误和调试信息将全部计入log并显示在屏幕上。

开始使用

使用时，请输入

sudo kalznjudger <json file path> [log path]

其中如果省略log path，在json解析成功之前，log目录将默认设置为Judger同目录下的log.log，当json解析成功后，log路径将采用json配置中的log。这里不建议省略log path，建议指令中log path与json中配置的log path保持一致。执行kalznjudger时，应使用root或sudo。否则judger将会报错。Judger评测完成后，会在工作区的RESULT_FILE_PATH目录下生成结果json文件。

删除kalznjudger

删除/usr/bin目录中的kalznjudger即可。

sudo rm -f /usr/bin/kalznjudger

任务JSON文件

这里使用JSON文件作为示例，数据项的意义及注意事项见注释。对于任务配置的json文件，如果有说明有默认值，则为选填项，否则必填。

{
    "taskID":"100031", // 任务ID号 必选项，务必从1开始。0视为无效ID号。

    "maxCharBuffer" : "10000000",  //字符串最大缓存 必选项

    "judgeMode": 0, // 评测模式 默认为SINGLE_RESULT_MODE 具体见下表格 

    "iOMode": 0,  // IO模式 默认为STD_IO 见下表

    "gid" : 65534, // gid 默认为DEFAULT_UID 评测时的进程的effective gid

    "uid" : 65534,// uid 默认为DEFAULT_UID 评测时的进程的effective uid

    "strictMode" : true, // 严格模式，默认为NOT_STRICT_MODE 见下表

    "workSpacePath":"/home/kalzn/Desktop/testworkspace/", 
    // 工作区目录 必选项 评测该任务的工作区目录，以下涉及到目录的配置，均必须是相对工作区的目录，或者绝对目录。

    "resultPath" : "result.json", //输出结果的json文件, 默认为RESULT_FILE_PATH

    "logPath":"/home/kalzn/Desktop/testworkspace/log.log", // log目录 必选项

    "sPJ": true, // 是否启用SPJ，默认为false

    "spjExePath":"/home/kalzn/Desktop/testworkspace/spj", // SPJ目录，当isSPJ=true时，必填项

    "spjExeName":"spj", // SPJ可执行文件名字，当isSPJ=true时，必填项

    "maxSPJTime" : 10000, // SPJ时限，单位为ms, 默认为 MAX_SPJ_TIME_LIMIT

    "maxSPJMemory": 102400 // SPJ内存限制 单位为kb, 默认 MAX_SPJ_MEMORY_LIMIT

    "translator": { // 翻译选项

        "mode": 2, // 翻译模式 必选项 见下表

        "compilerPath": "/usr/bin/javac", // 编译器路径 当翻译模式==COMPILER_MODE或者COMPILER_INTERPRETER_MODE时，必选项
        
        "compilerInfoPath" : "compiler.log", // 编译器输出路径，默认为DEFAULT_COMPILER_INFO_PATH

        "compilerOptions":[ // 编译器选项 当翻译模式==COMPILER_MODE或者COMPILER_INTERPRETER_MODE时，必选项
            "javac", "Main.java"
        ],

        "compilerProductName":"Main.class",
        // 编译产物名 当翻译模式!=INTERPRETER_MODE时，必选项，Judger编译后，将确认工作区目录下是否生成了名为compilerProductName的文件，以此判定编译是否正确。

        "interpreterInfoPath" : "interpreter.log", // 解释器输出路径，默认为DEFAULT_INTERPRETER_PATH

        "interpreterPath":"/usr/bin/java", // 解释器路径，当翻译模式==INTERPRETER_MODE,或者COMPILER_INTERPRETER_MODE时 必选项。

        "interpreterOptions":[ // 解释器选项，当翻译模式==INTERPRETER_MODE或者或者COMPILER_INTERPRETER_MODE时 必选项。
            "java", "Main"
        ]

    },
    "data" : [ // 数据配置，这里数据的数量不超过MAX_DATA_CASE_NUMBER个
        {
            "inputData":"data/1.in", // 输入数据

            "outputData":"data/output.out", // 输出文件（一般所有数据填一个即可）

            "stdAnswer":"data/1.out", // 标准输出
            
            "maxCPUTime": 1000, //时限 单位为ms

            "maxMemory" : 102400, // 内存限制, 单位为kb
            
            "maxStack" : 1024000 //Stack数量限制。
        },
        {
            "inputData":"data/2.in",
            "outputData":"data/output.out",
            "stdAnswer":"data/2.out",
            
            "maxCPUTime": 1000,
            "maxMemory" : 102400,
            "maxStack" : 1024000
        },
        {
            "inputData":"data/3.in",
            "outputData":"data/output.out",
            "stdAnswer":"data/3.out",
            
            "maxCPUTime": 1000,
            "maxMemory" : 102400,
            "maxStack" : 1024000
        },
        {
            "inputData":"data/4.in",
            "outputData":"data/output.out",
            "stdAnswer":"data/4.out",
            
            "maxCPUTime": 1000,
            "maxMemory" : 102400,
            "maxStack" : 1024000
        }
    ]
}

一些配置选项的说明

选项	取值	意义
Task.judgeMode
	SINGLE_RESULT_MODE(0)	单一结果模式，且若某样例没有AC，之后的样例直接跳过
	POINTS_MODE(1)	积分模式，返回每个样例的结果，即使某样例没有AC，也会接着评测后面的样例。
	ONLY_COMPILE_MODE(2)	只编译模式（详见文档并发评测与解释了解详情）
Task.iOMode
	STD_IO(0)	评测时使用标准读入输出
	FILE_IO(1)	评测时使用文件读入输出，文件路径为FILEIO_INPUT_PATH以及FILEIO_OUTPUT_PATH
Task.strictMode
	NOT_STRICT_MODE(0)	在答案和输出匹配时，按照以下执行： 1、如果输出或者答案最后有一个'\n'，则删掉一个'\n'。 2、将答案和输出的所有连续空白字符都用一个空格替代。 3、如果此时输出和答案相等，则AC。 4、否则WA。
	STRICT_MODE(1)	在答案和输出匹配时，按照以下执行： 1、如果输出或者答案最后有一个'\n'，则删掉一个'\n'。 2、如果输出和答案相等，则AC。 3、否则：将答案和输出的所有连续空白字符都用一个空格替代。 4、如果此时输出和答案相等，则PE。 5、否则WA。
Task.translator.mode
	COMPILER_MODE(0)	compiler mode, 编译模式此模式下，judger先切换到work space目录下，根据设置的编译器路径及选项进行编译，这里规定产生物的名字应为compilerProductName，此后judger将检测目录下是否成功生成名字为 compilerProductName的文件，以判定编译是否成功。编译信息会输出至设定的文件中。如果失败则报告编译失败，否则运行编译产物。这里box进程经初始化，会直接使用exec函数，运行编译后的产物。（例如C语言，属于此种模式）
	INTERPRETER_MODE(1)	interpreter mode 解释模式此模式下，judger先切换到work space目录下，直接根据解释器路径和选项，执行解释器。在box进程初始化成功后，启用解释器运行代码，解释器报错将输出至设定的文件中。（例如python语言，属于此种模式）
	COMPILER_INTERPRETER_MODE(2)	compiler interpreter mode 编译解释模式此模式下，judger先切换到work space目录下，先编译产生编译产物，然后用解释器运行编译产物。（例如java语言，属于此种模式）
	DO_NOT_TANSLATE_MODE(3)	do not tanslate mode 不做翻译模式直接运行名为compilerProductName的可执行文件，不做任何处理，详见文档并发评测与解释了解详情

不过要明确的是，translator的配置应该由系统的部署人员完成，此部分的配置一般不会修改除非要改动OJ的编译指令，或者添加、删减某种语言。编译器和解释器输出以及评测结果文件，将可以在评测结束后一同交由高层的评测队列管理模块回收处理。如果出现某种语言或者某翻译过程无法适配的情况，就劳烦自行编写shell脚本了。具体方式见自定义翻译脚本。

结果json文件

{
	"taskID":	100031, // 任务ID号

	"doneTime":	"2021-07-18 21:06:22", // 任务完成时间

	"judgeTime":	15753, //ms 评测所花费的实际时间 （从开始解析任务json到评测结束的实际时间）

	"extraTime":	819, //ms 评测所花费的额外时间 （ 评测所花费的实际时间 减去 所有样例下待测程序运行的实际时间之和 ） 
                         // judger在用于处理进程、初始化配置、匹配输出等非待测程序运行开销的时间
	"result":	[{

			"time":	0, //ms  样例耗费CPU时间（按照这个标准比对是否超时）

			"realTime":	5, //ms judger运行此样例的真正时间 （仅仅用于评断judger效率）

			"memory":	1660,  //kb 耗费内存

			"signal":	0, // 待测进程结束信号量

			"code":	0, // 待测程序exit code

			"result":	0, // 评测结果 

			"detail":	"No info" // 评测信息

		}, {
			"time":	0,
			"realTime":	4,
			"memory":	1656,
			"signal":	0,
			"code":	0,
			"result":	0,
			"detail":	"No info"
		}]
}

工作区

工作区是Judger在评测时的工作目录，与评测有关的数据、待测源程序等最好都在此目录下，Judger所生成的编译器和解释器信息，以及最终结果都将会存储在此。当高层管理程序回收时，应该从工作区目录回收评测结果，并做好工作区的清理。

并发评测与解释

v0.2.0版本发布的重要功能

相信大家都注意到了，在评测选项中，有几处看起来令人困惑的内容。

第一处是Task.judgeMode，评测模式中的ONLY_COMPILE_MODE。在此模式下judger仅仅对目标代码进行编译，只返回编译成功或者编译失败。不进行真正的评测。

第二处是Task.translator.mode，翻译模式的DO_NOT_TANSLATE_MODE，在此模式下，judger直接运行compilerProduct，而不进行编译或者解释工作。

这两者都是为了高层的并发评测调度准备的。首先，为了更好的对大量任务进行评测，并发评测应由高层的任务队列管理器进行调配。究其原因是，高层的任务队列管理器知晓目前待测的所有任务，相较于底层judger，它可以更好的对任务调配。

为了更好的利用处理机，judger允许高层将评测任务拆解为编译过程和执行过程。对于一个评测任务，它只要编译过一次，就可以对一组样例执行评测。

试想这么一个场景：高层队列管理模组接收到一个c++代码的评测任务，它有10组数据。此时评测机不是太繁忙。所以高层决定对其并发评测。它先向judger发送一个评测模式为ONLY_COMPILE_MODE的任务。judger完成编译后就向高层返回编译是否正确。当编译正确时，高层并发地执行10个评测任务，每个包含1组样例。而这10个任务的翻译模式均为DO_NOT_TANSLATE_MODE。然后高层接受10组样例的返回结果就OK了。

评测结果

结果名	结果代码	说明
ACCEPTED	0	该测试点通过了测试
WRONG_ANSWER	1	该测试点输出与标准答案不一致，或spj认为该待测程序答案错误
TIME_LIMIT_EXCEEDED	2	待测程序没有在时间限制内给出答案
MEMORY_LIMIT_EXCEEDED	3	待测程序没有在内存限制内给出答案
RUNTIME_ERROR	4	待测程序崩溃
PRESENTATION_ERROR	5	待测程序格式错误，此结果只在严格模式生效
OUTPUT_LIMIT_EXCEEDED	6	待测程序输出字符数大于maxCharBuffer
COMPILE_ERROR	7	待测程序没有通过编译
SKIP	8	跳过，当评测模式为SINGLE_RESULT_MODE时，如果一个测试点不为AC或者PE，则后面的测试点跳过
SYSTEM_ERROR	9	系统错误，执行log

系统在得出评测结果时按照以下顺序：首先查看box是否正常退出，检查是否系统错误。然后检查待测程序返回码和信号量，查看是否RE，然后比较其使用的CPU时间和规定限制，查看是否超时，此后比较其使用的内存和规定限制，查看是否超内存。最后调用matcher或者spj，对比输出和答案，查看是否WA，或者PE。在single result mode下，如果一个测试点为AC或者PE，才会接着评测下一个用例。否则直接退出。

报错

Judger产生的所有System Error都将会尽最大努力的存储到指定的log文件中。这里提供错误代码对照。

错误名	错误代码	说明
INVALID_JUDGE_CONFIG	-100	评测配置不合法
WAIT_BOX_FAILED	-101	无法收集box进程资源统计，
WAIT_KILLER_FAILED	-102	无法wait killer进程终止
FORK_BOX_FAILED	-103	无法fork box进程
FORK_KILLER_FAILED	-104	无法fork killer进程
FORK_KILLER_FOR_SPJ_FAILED	-106	无法fork用于监控spj的killer进程
WAIT_SPJ_FAILED	-107	无法收集spj进程资源统计
WAIT_KILLER_FOR_SPJ_FAILED	-108	无法wait用于监控spj的killer进程终止
COMPILER_RUN_FAILED	-109	编译器无法启动
PERMISSION_ERROR	-110	judge进程不是root
ACCESS_WORKSPACE_FAILED	-111	无法访问工作区目录
FILE_IO_INIT_FAILED	-112	文件IO模式初始化失败
WRITE_RESULT_FILE_FAILED	-113	写入结果文件失败
BOX_SECURITY_CONFIG_LOAD_FAILED	-200	安全配置加载失败
BOX_DATA_REDIRECT_FAILED	-201	评测数据重定向失败
BOX_EXE_RUN_FAILED	-202	无法启动待测程序
BOX_SET_UID_FATLED	-203	无法设置用户及用户组
BOX_SET_LIMIT_FAILED	-204	无法设置资源限制
KILLER_SLEEP_FAILED	-300	killer无法阻塞
KILLER_KILL_FAILED	-301	killer无法kill掉目标进程
MATCHER_OPEN_DATA_FAILED	-400	matcher无法打开数据文件
MATCHER_STD_DATA_TOO_LARGE	-401	标准答案文件字符数大于maxCharbuffer
LOG_IDENTIFY_ERROR_FAILED	-500	log无法识别错误
LOG_FILE_OPEN_FAILED	-501	无法打开log文件

其中，-50系列报错将直接输出至stderr，其他错误将记录到log文件

安全机制

Judger采用seccomp沙盒机制，且box在极低权限下运行，在标准IO模式下，由于seccomp设置，box无法执行execve，fork，clone等系统调用，无法写文件。 box进程设置的effective UID权限极低，无法读取文件。文件IO模式的权限控制还没有配置好，所以请不要在公开环境使用本系统。

SPJ说明

SPJ程序理论上可以使用任何语言书写，judger执行SPJ时，将会传入3个参数：1、输入文件路径，2、标准输出文件路径，3、待测程序输出文件路径。这里占用SPJ程序的Exit Code作为评测的结果，SPJ的返回值为0，则Judger认为待测程序在此样例下通过，其他情况均为WRONG_ANSWER。因为很多语言Exit Code不太好设定，且性能较C/C++来说很差，所以这里还是建议使用C/C++书写，SPJ程序需要引入spjlib.h文件,编译SPJ时，要链接spjlib.cpp.在开始调用START_JUDGE(),另外，input,output,stdoutput分别是输入数据，待测程序输出数据以及标准输出的文件指针。在得到评测结果后，应调用EXIT_JUDGE(<ACCEPTED|WRONG_ANSWER>)返回结果。不要直接return。这里要注意的是，如果SPJ程序崩溃、超时、超出内存限制，均视为源程序WRONG_ANSWER。这里给一个SPJ程序的示例。（判断答案和输入相差不超过1e-4）

#include "spjlib.h"
#include <cmath>
int main(int argc, char * argv[]) {
    START_JUDGE();
//------------SPJ--CODE--------------------
    double a; 
    fscanf(out, "%lf", &a);
    double b;
    fscanf(sout, "%lf", &b);
    if (fabs(a - b) < 1e-4) {
        EXIT_JUDGE(ACCEPTED);
    }
    EXIT_JUDGE(WRONG_ANSWER);
//------------SPJ--CODE--------------------

    EXIT_JUDGE(ACCEPTED); 
}

其他说明

多文件与模块评测

judger支持多文件代码评测，将所有代码文件放到工作区后，只要在任务json中配置好编译选项和解释选项即可。模块评测当作多文件测试，将用户提交的模块代码文件，连接驱动代码文件一起处理即可。

自定义翻译脚本

judger对编译和解释代码的过程有高度的自定义性。judger内置的4种翻译模式已经可以应对大部分的翻译过程。但是如果有特殊的翻译过程。你可以在translator的配置中运行自行定义的shell脚本。完成代码的编译工作。你也同样可以使用一段脚本运行待测程序。下面是一个示例，在示例中，使用自定义脚本完成对java代码的编译运行：

"translator": {
            "mode": 2,
            "compilerPath": "/usr/bin/bash",
            "compilerOptions":[
                "bash", "/home/kalzn/sh/make.sh", "/home/kalzn/workspace/Main.java", "/home/kalzn/workspace/Main.class"
            ],
            "compilerProductName":"Main.class",
            "interpreterPath": "/usr/bin/bash",
            "compilerOptions":[
                "bash", "/home/kalzn/sh/run.sh", "/home/kalzn/workspace/Main.class"
            ]
        }

#!/bin/bash
# make.sh
javac $1 -o $2

#!/bin/bash
# run.sh
java $3

但是请保证脚本是可靠的! 系统没有对编译过程进行监控!

编译SPJ

judger可以用于编译SPJ，因为存在only compiler mode， judger server也可以接受编译SPJ的任务。

演示

如果没有重大改变，此章节没有随着版本更迭，所以json文件的配置可能与上面章节有出入。请以上面的章节为准。

简单演示

以下演示在v0.2.0版本进行。这里对一个java源程序进行评测，源代码如下

import java.util.*;
public class Main {
   public static void main(String[] args) {
   	Scanner in = new Scanner(System.in);
   	int a = in.nextInt(), b = in.nextInt();
   	System.out.println(a+b);
   	System.out.println(a-b);
   }
}

这里将Main.java以及对其评测的数据放到同一目录下，组成工作区。

然后配置json文件

{
    "Judger": { 
        "maxCharBuffer" : "10000000"
    },
    "Task" : {
        "taskID":"100031",
        "workSpacePath":"/home/kalzn/Desktop/testworkspace/",
        "logPath":"/home/kalzn/Desktop/testworkspace/log.log",
        "translator": {
            "mode": 2,
            "compilerPath": "/usr/bin/javac",
            "compilerOptions":[
                "javac", "Main.java"
            ],
            "compilerProductName":"Main.class",
            "interpreterPath":"/usr/bin/java",
            "interpreterOptions":[
                "java", "Main"
            ]
        },
        "data" : [
            {
                "inputData":"data/1.in",
                "outputData":"data/output.out",
                "stdAnswer":"data/1.out",             
                "maxCPUTime": 1000,
                "maxMemory" : 102400,
                "maxStack" : 1024000
            },
            {
                "inputData":"data/2.in",
                "outputData":"data/output.out",
                "stdAnswer":"data/2.out",           
                "maxCPUTime": 1000,
                "maxMemory" : 102400,
                "maxStack" : 1024000
            },
            {
                "inputData":"data/3.in",
                "outputData":"data/output.out",
                "stdAnswer":"data/3.out",               
                "maxCPUTime": 1000,
                "maxMemory" :102400,
                "maxStack" : 1024000
            },
            {
                "inputData":"data/4.in",
                "outputData":"data/output.out",
                "stdAnswer":"data/4.out",            
                "maxCPUTime": 1000,
                "maxMemory" : 102400,
                "maxStack" : 1024000
            }
        ]
    }
}

评测结束后，工作区目录下生成文件

其中result.json 内容如下

{
	"taskID":	100031,
	"time":	"2021-07-10 03:35:56",
	"result":	[{
			"time":	65,
			"memory":	37664,
			"signal":	0,
			"code":	0,
			"result":	0,
			"detail":	"No info"
		}, {
			"time":	74,
			"memory":	37524,
			"signal":	0,
			"code":	0,
			"result":	1,
			"detail":	"No info"
		}, {
			"time":	0,
			"memory":	0,
			"signal":	0,
			"code":	0,
			"result":	8,
			"detail":	"No info"
		}, {
			"time":	0,
			"memory":	0,
			"signal":	0,
			"code":	0,
			"result":	8,
			"detail":	"No info"
		}]
}

Name		Name	Last commit message	Last commit date
Latest commit History 196 Commits
.vscode		.vscode
bin		bin
build		build
include		include
seccomp		seccomp
sh		sh
spj_code		spj_code
src		src
test_driver		test_driver
test_sample		test_sample
.travis.yml		.travis.yml
CMakeLists.txt		CMakeLists.txt
README.md		README.md
README_en.md		README_en.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Kalzn_Code_Judger

简介

准备

编译代码

开始使用

开始使用

删除kalznjudger

任务JSON文件

一些配置选项的说明

结果json文件

工作区

并发评测与解释

评测结果

报错

安全机制

SPJ说明

其他说明

多文件与模块评测

自定义翻译脚本

编译SPJ

演示

简单演示

About

Releases 5

Packages

Languages

Kalzncc/KalznCodeJudgerCore

Folders and files

Latest commit

History

Repository files navigation

Kalzn_Code_Judger

简介

准备

编译代码

开始使用

开始使用

删除kalznjudger

任务JSON文件

一些配置选项的说明

结果json文件

工作区

并发评测与解释

评测结果

报错

安全机制

SPJ说明

其他说明

多文件与模块评测

自定义翻译脚本

编译SPJ

演示

简单演示

About

Resources

Stars

Watchers

Forks

Releases 5

Packages 0

Languages

Packages