- GLUE의 난이도를 올린 버전
- GLUE는 9가지 NLU Task를 포함하며, 공개된 데이터셋을 기반으로 작성된 벤치마크
- Super GLUE는 GLUE의 디자인을 기반으로하며, 난이도 상승, Task 추가 버전(QA, Coreference Resolution)
- Super GLU는 다음 Task들을 포함함
BoolQ(Boolean Questions)
: QA Task. 위키피디아의 짧은 본문과 yes/no 질문으로 구성CB(CommitmentBank)
: Entailment Task. WSJ나 소설 코퍼스로 구성COPA(Choice of Plausible Alternatives)
: 인과관계를 추론하는 Task. 문장을 받고 원인 또는 결과로 결정해야함MultiRC(Multi-Sentence Reading Comprehension)
: QA Task. 어떤 답변이 참이고 거짓인지 판단해야함ReCoRD(Reading Comprehension with Commonsense Reasoning Dataset)
: 객관식 QA Task. 뉴스 기사에 마스킹된 개체를 예측해야함RTE(Recognizing Textual Entailment)
: Text Entailment Task. 기존 GLUE에 포함되어 있음WiC(Word-in-Context)
: 문장 Pair의 Binary Classification Task. 단어 의미가 중의적인지 판단해야함WSC(Winograd Schema Challenge)
: Coreference Resolution Task. 선택지중 대명사의 올바른 참조 대상을 결정해야함
-
source: huggingface
-
hf_path: aps/super_glue
-
hf_name:
Click
-boolq
-cb
-copa
-multirc
-record
-rte
-wic
-wsc
-wsc.fixed
-axb
-axg