Do doktorského studia šel s tím, že se bude zabývat právní teorií. Tehdy však netušil, jaké možnosti jeho výzkumu – respektive celé justici – přinese rozvoj velkých jazykových modelů, umělé inteligence. Tomáš Koref, jenž se věnuje své dizertaci v režimu joint Ph.D. jak na Právnické fakultě UK, tak na Goethe-Universität Frankfurt, začal spolu s počítačovými vědci vyvíjet AI nástroj pro analýzu soudních rozhodnutí. Takový výzkum by mohl v budoucnu proměnit práci soudů, potažmo šetřit peníze státu anebo i účastníkům soudních řízení.

Portréty Tomáše Korefa vznikly v galerii digitálního umění Signal Space v Praze.
S jakou myšlenkou jste začal stavět svůj výzkumný projekt?
Moje téma lze koncentrovat do dvou slov: právní argumentace. Zajímá mě napětí mezi tím, co v právní teorii zkoumáme a učíme, a tím, co se skutečně děje v praxi. Právní věda rozlišuje různé typy argumentů – například jazykový výklad, kdy se soustředíme na text předpisu, nebo teleologický výklad, který hledá účel zákona. Jenže my vlastně nevíme, jak tyto argumenty používají české soudy, které ročně vynesou stovky tisíc rozhodnutí. Ve středoevropském kontextu je to o to zajímavější, že se o zdejší justici často tvrdí, že je přehnaně formalistická, tedy že soudy lpí na textu právních předpisů a nezabývají se například důsledky svých rozhodnutí. Kritizují to politici i veřejnost, třeba slovenská exprezidentka Zuzana Čaputová v jednom interview zmínila, že právě formalismus justice je jedním z důvodů společenské frustrace v ČR i na Slovensku. Často se to označuje za postkomunistické dědictví, kdy soudy údajně slepě lpí na textu zákona a ignorují smysl nebo důsledky svých rozhodnutí. Mě zajímalo, jestli je to pravda. Pomoci s hledáním odpovědi nám teď může dynamický vývoj v oblasti zpracování přirozeného jazyka, které nám umožňují analyzovat stovky tisíc rozhodnutí, což by bylo dříve jinak nemyslitelné. My se teď snažíme zjistit, zda to skutečně půjde, jak to udělat a jak moc jsou modely spolehlivé.
Pojem „právní formalismus“ je vnímán někdy až negativně. Co si pod ním představit?
To byla důležitá otázka našeho výzkumu: jak formalismus definovat, aby byl měřitelný. V literatuře existuje řada definic, ale my se pokusili najít společného jmenovatele. Identifikovali jsme pět základních znaků, z nichž nejdůležitější je právě lpění na doslovném textu předpisu a ignorování toho, co je za ním. Formalistický soudce se soustředí primárně na to, co je napsáno, a už neřeší účel zákona nebo dopady svého rozhodnutí.
Můžete být méně abstraktní?
Uvedu velmi zjednodušený příklad. Účastník řízení má podat odvolání do patnácti dnů. Podá ho šestnáctý den, protože jeho advokát náhle vážně onemocněl. Formalistický soudce řekne: „V zákoně je patnáct dní, přišlo to šestnáctý den, odmítá se.“ Neformalistický soudce by se podíval na kontext, na účel té lhůty, důsledky v konkrétním případě a na širší právní principy a možná by takové odvolání připustil, ač by pro to text předpisu přímo neposkytoval podklad. V našem regionu se formalismus užívá téměř jako nadávka. Přitom určitá míra formalismu je nutná – právo stojí na pravidlech. Otázkou je, jaká míra je žádoucí. A kdy už je to na škodu.
Jak tedy do analýz rozhodování soudů zapojit velké jazykové modely, LLM?
Pracujeme na tom rok a půl. Zkoušeli jsme trénovat různé modely, konfigurace a různé architektury. Výsledky nás překvapily, přesnost modelů je poměrně vysoká. Použili jsme je na dataset 300 tisíc rozhodnutí. Model analyzuje, jaké argumenty soud používá a zda vykazuje znaky formalismu. Důležité je, že nepoužíváme uzavřené modely typu ChatGPT nebo Gemini. V empirickém výzkumu je zásadní replikovatelnost. Uzavřené modely mohou generovat pokaždé trochu jiné výsledky, mění se v čase a také nevíte, na čem byly trénovány. Proto využíváme otevřené modely, jako je Llama od společnosti Meta, nebo plně open-source modely typu encoder only, například ModernBERT.
Jak je cvičíte?
Proces učení probíhá formou „supervised learning“. Nejdříve jsme s mými výzkumnými asistenty ručně anotovali asi tři stovky rozhodnutí (takzvaný Gold Standard Dataset), na kterých se model naučil identifikovat argumenty. Také jsme vytvořili nový dataset o 300 tisících anonymizovaných českých soudních rozhodnutích, na němž jsme provedli „continued pre-training“, aby se jazykové modely naučily specifickou českou právní terminologii, protože původně jsou trénovány hlavně na angličtině.
Cílem vaší práce je tedy vytvořit nástroj, který budou moci využít další vědci a vědkyně pro empirický výzkum, nebo dokonce sami soudci při analýze své rozhodovací praxe?
Přesně tak. Nedávno jsme zveřejnili první preprint našeho odborného článku. Co se mi na interdisciplinární spolupráci líbí, že v AI výzkumu se klade obrovský důraz na replikovatelnost. My právníci s tím zatím takovou zkušenost nemáme, což je škoda. Důsledkem tohoto přístupu je, že nezveřejňujeme jen samotný text studie, ale úplně vše, modely, které jsme natrénovali, kompletní anotovaný dataset, anotační instrukce, všech 300 tisíc rozhodnutí použitých pro vývoj i veškerý kód. Kdokoliv tak může náš výzkum zreplikovat nebo náš model použít na úplně jiná soudní rozhodnutí. Vše je veřejně dostupné.
A můžou výsledky vaší práce reálně pomoci české justici?
Všudypřítomná kritika formalismu může snížit důvěru v justici. Proto je zapotřebí ověřit, zda je kritika oprávněná a podložit ji případnými daty. První výsledky ukazují, že například Nejvyšší soud (NS) je výrazně méně formalistický, než se traduje, a jeho formalismus v čase klesá. Z praktického hlediska mohou naše modely pomoci soudcům s analýzou toho, jak vyšší instance interpretují předpisy a proč ruší rozhodnutí nižších soudů. Pokud soudce nižšího stupně ví, jak o daném problému uvažuje NS, může svůj výklad přizpůsobit, čímž se předejde rušení rozsudků. To může ušetřit čas i peníze jak státu, tak účastníkům řízení.
Čemu se ještě věnujete?
Vedle toho řešíme, jak různé AI nástroje implementovat přímo do pracovního procesu soudců při psaní rozsudků, ovšem s maximálním ohledem na eliminaci rizik, jež AI přináší. Aktuálně rozvíjíme spolupráci s Vrchním soudem v Praze a jeho prostřednictvím s dalšími soudy i ministerstvem spravedlnosti. Česká justice je k inovacím a spolupráci s akademií velmi otevřená, což není samozřejmostí v jiných státech. Těší mě, že jako akademici jsme pro justici důvěryhodným partnerem, kterého žene vědecký a celospolečenský zájem. Důvěru a otevřenost české justice vůči akademii považuji za důležitou výsadu a příležitost.
Pracujete nějak i s mezinárodním srovnáním?
Spolupracuji s kolegy z Cornell Law School v USA. Srovnáváme, jak naše modely fungují na amerických rozsudcích, a naopak. Připravujeme také větší projekt s profesory Holgerem Spamannem z Harvardu, Jedem Stiglitzem z Cornellu a Ivanem Habernalem z TrustHLT (v Bochumi). Cílem je porovnat více států, ale to je zatím vize na další roky, která závisí na financování. Momentálně se tedy primárně zaměřujeme na české prostředí.
Prozraďte, jak pro vás jako právníka bylo těžké a složité proniknout do světa IT a AI? Jak jste hledal svůj tým? A co všechno jste se musel doučit?
To je vtipná historka. Zjednodušeně řečeno jsem „z ulice“ zaklepal na dveře katedry profesora Ivana Habernala. On mi otevřel a od té doby už rok a půl spolupracujeme na šesti různých projektech. Vstup do tohoto světa byl snazší díky jeho neuvěřitelné otevřenosti a smyslu pro týmovou práci. Samotný interdisciplinární výzkum je ovšem náročný, protože každý mluvíme jiným „jazykem“. Bariéru se snažím částečně překonat kurzy programování či strojového učení, pomohla mi také zkušenost z interdisciplinárních center ve Frankfurtu, na Cornellu, v Boloni či Hamburku.
Liší se i náš pohled. Když se na soudní rozhodnutí dívám já, vidím v něm kontext právního systému, aplikaci norem a instituci, která právo vykonává. Počítačový vědec to ale vidí úplně jinak, vidí v tom pouhý text, kód či soubor vektorů, do nichž se text převede… Máme také někdy mírně odlišné cíle. Mojí ambicí bylo třeba analyzovat těch 300 tisíc rozhodnutí, abych zjistil, jak soudy argumentují. Pro počítačové vědce je zase jádrem projektu dosáhnout co nejvyšší přesnosti modelu na malém datasetu. Právní čeština je ovšem pro ně fascinující oříšek, protože je to specifický a málo zastoupený jazyk. Je důležité si tyto rozdílné motivace uvědomovat a umět je v týmu sladit a naučit se společně komunikovat.
Narazili jste při slaďování dvou výzkumných světů na nějaké obtíže?
S Ivanem Habernalem a počítačovou vědkyní Lenou Held jsme pořádali v rámci konference v Chicagu workshop o využití AI pro empirický výzkum v právu. Chtěli jsme oslovit obě komunity a při tom jsme narazili na naprosté základy. V právní vědě standardně vypíšete call for abstracts, lidé pošlou shrnutí a na jeho základě je vyberete. Ivan a Lena mi na to řekli: „Co to je call for abstracts? Jak můžeš hodnotit kvalitu práce podle odstavce textu?“ V počítačové vědě se posílají rovnou celé články, které procházejí anonymním a často velmi přísným recenzním řízením nezávislých recenzentů. A teď co s tím? Workshop měl být zároveň pro obě odborné komunity. Museli jsme tyto světy propojit a nastavit standardy, které vyhovují oběma.
Co jste se díky tomu naučil?
Může to znít banálně, ale já si na tom uvědomil, že interdisciplinarita vás skrze podobné typy problémů neustále vrací k základům. Abych mohl rozhodnout, zda budu přijímat abstrakt, či paper, potřebuji zodpovědět, k čemu workshop vlastně slouží? A to vede k otázce, jak odlišně komunikují poznání obory jako právo a počítačová věda, proč to tak je a zda to nemá být jinak. A podobně se interdisciplinarita propisuje do výzkumu. Práce s daty a modely mě nutila odpovídat si na zcela elementární otázky: Co je to vlastně právní argument? Jak přesně definovat jazykový výklad, aby jej model dokázal v textu identifikovat? Ukázalo se, že právní teorie není vždy tak jasná, jak si v právu myslíváme. A to mě na celém výzkumu fascinuje, protože otevírá fundamentální právně-teoretické otázky, které je zapotřebí zodpovědět.
Vy na doktorátu pracujete pod dvojím vedením. Jakou inspiraci si vozíte ze zahraniční „domů“ na pražská práva?
Inspirovalo mě fungování německého AI labu TrustHLT, s nímž intenzivně spolupracuji. Tamní prostředí je daleko méně hierarchické. Velmi mladí studenti bakalářského studia se podílejí na komplexních vědeckých úkolech jako rovnocenní partneři. Například s Yassinem z našeho týmu, který ještě ani nemá bakalářské zkoušky, máme prezentovat paper na špičkové konferenci v Berkeley. To je v počítačové vědě, myslím, běžnější, ale z kontinentální právní akademie podobnou atmosféru neznám. Proto se tento přístup snažím přenést i k nám přes svůj tým výzkumných asistentů, který jsem si mohl postavit díky tomu, že jsem získal stipendium SYLFF. Na pražské fakultě máme neuvěřitelně talentované lidi s obrovským nadšením. Příkladem jsou úžasní studující, s nimiž dlouhodobě spolupracuji: Maty Barták, Vašek Lipš, Mára Švajda a Vítek Eichler. Byla by škoda toho nevyužít! Částečně je to samozřejmě věc financí – v Německu mají projekty v počítačových vědách větší rozpočty na vědecké asistenty, ale onen princip zapojení studentů do reálného výzkumu a podpory jejich růstu je replikovatelný, myslím, i u nás. Inspirovat se můžeme také interdisciplinaritou. V našem Center for Critical Computational Studies (C3S ve Frankfurtu) se intenzivně propojuje studium umělé inteligence s dalšími obory: s počítačovými vědci se tam pod jednou střechou potkávají sociologové, politologové nebo vědci, kteří se zabývají ochranou klimatu. A všichni společně hledají průniky svých oborů a cesty, jak poznání člověka posunout někam mnohem dál.
Je taková mezioborovost v právu běžná?
Vnímám, že na Právnické fakultě UK se postoj k interdisciplinaritě v posledních letech zásadně proměňuje. Vznikají tu skvělé nové projekty, jako je výzkum Jakuba Drápala, který získal ERC Starting Grant, nebo projekt financovaný z programu OP JAK, jenž vede Josef Montag z Katedry ekonomie a empirických právních studií PF UK a který se zabývá tím, proč ve společnosti vznikají nerovnosti. To jsou důležité kroky mířící správným směrem.
| Mgr. Tomáš Koref, LL.M. |
| Absolvoval Právnickou fakultu UK a magisterský program v právní teorii na Goethe-Universität Frankfurt. Nyní pracuje v režimu joint Ph.D. na své dizertaci na PF UK a ve Frankfurtu, kde je členem nového hubu Center for Critical Computational Studies. Působí též v týmu profesora Ivana Habernala na Ruhr-Universität Bochum. Zabývá se právní teorií i zapojením empirických a počítačových metod ke studiu práce soudů. Díky stipendiu SYLFF od nadace The Tokyo Foundation a dalších grantů si už coby doktorand mohl vybudovat vědecký minitým, s nímž kromě řešení několika výzkumných projektů založil platformu CYLT pro studující se zájmem o právní výzkum či pravidelnou diskuzní skupinu Jurisprudential Cocktails. S manželkou pečuje o dvě nedávno narozené dcerky. |


