CAIL 2020-司法人工智能挑戰(zhàn)賽(閱讀理解)

任務(wù)一:閱讀理解

1. 任務(wù)介紹

CAIL2019上我們提出了中文司法閱讀理解任務(wù),今年我們將提出升級版,不僅文書種類由民事、刑事擴展為民事、刑事、行政,問題類型也由單步預(yù)測擴展為多步推理,難度有所升級。

具體而言,對于給定問題,只通過單句文本很難得出正確回答,選手需要結(jié)合多句話通過推理得出答案。

我們允許選手使用去年的閱讀理解數(shù)據(jù)集(CJRC)作為輔助數(shù)據(jù)集,同時允許選手使用任何外部資料作為知識來幫助模型,但是我們要求選手在預(yù)測過程中不能夠進行聯(lián)網(wǎng)的操作。

更多的詳細信息以及下文提到的資源都可以參考https://github.com/china-ai-law-challenge/CAIL2020/tree/master/ydlj。

2. 數(shù)據(jù)介紹

本任務(wù)技術(shù)評測訓(xùn)練集包括兩部分,一部分為去年的CJRC訓(xùn)練集,一部分為重新標(biāo)注的約3000個問答對,其中民事、刑事、行政各1000個問答對,均為需要多步推理的問題類型。驗證集和測試集各約3000個問答對,同樣均為需要多步推理的問題類型。

3. 評價方式

本任務(wù)采用F1進行評估。

對于每個問題,需要結(jié)合案情描述內(nèi)容,給出回答,回答為Span(內(nèi)容的一個片段)、YES/NO、Unknown中的一種,并且給出答案依據(jù),即所有參與推理的句子編號。評價包括兩部分:1)Answer-F1,即預(yù)測答案會與標(biāo)準(zhǔn)答案作比較,計算F1;2)SupFact-F1,即預(yù)測句子編號序列會與標(biāo)準(zhǔn)句子編號序列作比較,計算F1。最終為這兩部分F1的聯(lián)合F1宏平均。

4. 基線系統(tǒng)

我們將提供一組基線模型,即BERT的閱讀理解模型。

5. 參賽方式

  • 參賽對象 : 本次技術(shù)競賽面向全社會開放,相關(guān)領(lǐng)域的個人、科研機構(gòu)、高等院校、企業(yè)單位等人員均可報名參加。

  • 報名方式 : 競賽網(wǎng)站將于2020年05月15日開放注冊報名,登錄網(wǎng)站主頁即可報名,完善相關(guān)信息,即可報名參賽。

  • 報名時間 : 2020年05月15日至2020年07月30日。(可能根據(jù)參賽隊伍情況調(diào)整,具體時間請關(guān)注官方網(wǎng)站公告欄)

6. 賽程安排

  • 第一階段(2020.05.15-2020.07.30):
    開啟本任務(wù)比賽報名,發(fā)放CAIL2020-CJRC2.0訓(xùn)練集,用于編寫模型進行訓(xùn)練和測試。每周限提交3次,開放排行榜;

  • 第二階段(2020.07.15-2020.08.18)
    開放第二階段測試。對于高于任務(wù)預(yù)設(shè)基準(zhǔn)算法成績的隊伍,我們將開放第二階段的測試提交,第二階段的最終成績以各參賽隊伍在第二階段結(jié)束之前選擇的三個模型中的在第二階段測試集上的最高分?jǐn)?shù)作為最終成績。

  • 第三階段(2020.08.19-2020.09.07):
    封閉評測,第二階段結(jié)束時,所有參賽者需要選擇三個在第二階段提交成功的模型作為最終模型,三個模型取最高值。
    挑戰(zhàn)賽的最終成績計算方式:最終成績 = 第二階段的成績 * 0.3 + 第三階段的成績 * 0.7。

  • 第四階段(2020.09.07之后):
    公布最終成績,并開展技術(shù)交流和頒獎活動。

7. 獎項設(shè)置

挑戰(zhàn)賽將對閱讀理解任務(wù)評出一等獎1名,二等獎2名,三等獎4名。由主辦方中國中文信息學(xué)會(CIPS)為獲獎?wù)咛峁s譽證書認(rèn)證;由科大訊飛股份有限公司和中國司法大數(shù)據(jù)研究院為獲獎?wù)咛峁┆剟詈蛥涣髻澲?/p>

  • 一等獎 15000

  • 二等獎 7500

  • 三等獎 5000

  • 說明:

    1. 以上所有提及金額均為稅前金額。

    2. 獲獎算法與系統(tǒng)的知識產(chǎn)權(quán)歸參賽隊伍所有,僅要求獲獎團隊提供算法與系統(tǒng)報告(包括方法說明、數(shù)據(jù)處理、參考文獻和使用開源工具等信息)及團隊成員名單,供頒獎會技術(shù)交流。

參考鏈接:
http://cail.cipsc.org.cn/instruction.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容