This page in English

Centre for empirical research on information systems (CERIS)

ISPAI-CSIMQ Dataset

ISPAI-CSIMQ-datasetet innehåller 600 slumpmässigt utvalada meningar från 10 informationssäkerhetsriktlinjer från den brittiska nationella hälsovården. Dessa meningar är klassificerade som talhandlingar, med utgångspunkt i Searles talhandlingsteori.

Forskare kan använda datasetet för testa, jämföra och reproducera klassificeringar av meningar i informationssäkerhetsriktlinjer som talhandlingar. Exempelvis kan det användas i jämförelser av hur bra stora språkmodeller klassificerar innehåll i informationssäkerhetsriktlinjer.

Tre forskare klassificerade var och en oberoende av varandra 200 av de slumpmässigt utvalda meningarna i informationssäkerhetsriktlinjerna. Klassificeringen följde Searles taxonomi för språkhandlingar, dvs. den åtskilde mellan assertiva, kommissiva, deklarativa, direktiva och expressiva.

När du använder datasetet, vänligen hänvisa till artikeln publicerad av Karlsson F, Gao S, Krogstie J, & Aro-Sati L (2026) Advancing a Speech Act-Based Model to Improve Future Quality of Information Security Policies Using Large Language Models. Complex Systems Informatics and Modeling Quarterly.

ISPAI-CSIMQ Dataset