Pojem Legal Tech znamená použitie akéhokoľvek druhu technológie a/alebo softvéru na poskytovanie právnych služieb a/alebo na pomoc jednotlivým právnikom či právnym teamom v ich praxi, resp. na podporu právneho priemyslu ako takého. V priebehu času sa preferovali rôzne prístupy kreovania Legal Tech softwérov a vyvinuli sa rôzne nástroje, ktoré počítačovým technológiám umožnili riešiť právne úlohy viac alebo menej autonómne.
Reprezentácia znalostí a uvažovania vs. Strojové učenie. Ktoré je o čom. A prečo je to dobré vedieť
Reprezentácia znalostí a uvažovania [Knowledge Representation and Reasoning, KR&R, KR²]
Už od samého začiatku v 70-tych rokov, keď sa odvetvie Legal Tech začalo rozvíjať, približne až do konca druhého tisícročia, dominovali v oblasti Legal Tech myšlienky a prístupy na vytvorenie technologických riešení, ktoré reprezentujú odborné právne znalosti a nahrádzajú právne uvažovanie človeka [t.j. KR&R]. V tomto období aj vznikli viaceré softwérové KR&R riešenia. Wikipédia uvádza, že prvý komerčne dostupný právny systém umelej inteligencie [AI] bol expertný systém vytvorený na báze KR&R a uvedený v roku 1988 Oxfordskou univerzitou, ktorý na základe vstupných údajov zadaných používateľmi dokázal autonómne vyhodnotiť, či sa na používateľov vzťahuje novo prijatá legislatíva.
Tradičná softvérová architektúra a webové technológie postavené na princípoch KR&R sa bežne používajú aj dnes, napríklad v právnych knižničných systémoch na poskytovanie prístupu k databázam judikatúry / databázam právnych aktov, vyhľadávanie v nich podľa kľúčových slov a na a prácu s nimi, ako aj na vyhodnocovanie vzťahov subordinácie posudzovaných právnych predpisov. Takéto typy produktov Legal Tech sú stále veľmi stabilnou súčasťou právnej praxe moderných právnikov a často sú v krajinách EÚ prevádzkované vládou ako otvorený a voľne dostupný zdroj dát.
Vývoj softwareových riešení KR&R v oblasti Legal Tech je časovo a tým aj finančne dosť náročný, pretože musíme pochopiť, čo tento termín znamená v jeho detailoch.
KR&R je oblasť umelej inteligencie, ktorá sa venuje reprezentovaniu [prevažne]
profesionálnych informácií o svete vo forme, ktorú počítačový systém dokáže využiť na riešenie zložitých úloh. KR&R zahŕňa znalostný strom vytvorený z dokumentu alebo z iného materiálu pomocou sémantického rozkladu a štruktúrovania, takým spôsobom, že sú v ňom identifikované všetky sémanticky významné entity. V modeloch KR&R musíte aplikovať poznatky z psychológie o tom, ako ľudia riešia problémy a ako reprezentujú svoje odborné vedomosti, aby ste mohli navrhnúť softwérové formalizmy, ktoré uľahčia dizajnovanie, štruktúrovanie a vytváranie zložitých systémov. Vývoj softwareu na
princípe reprezentácie odborných znalostí a uvažovania v sebe esenciálne
zahŕňa aj potrebu poznať pravidlá logiky a vedieť s nimi dobre narábať, aby sa podarilo automatizovať rôzne druhy a faktory uvažovania, ako je napr. aplikácia pravidiel alebo vzťahy množín a podmnožín.
Softwarové riešenia KR&R zahŕňajú aj aplikáciu sémantických sietí, architektúru
systémov, rozhodovacie rámce a pravidlá, a ontológie.
Strojové učenie [Machine Learning, ML]
Od začiatku nového tisícročia sa objavilo viac pokusov s cieľom zjednodušiť softwérové riešenia právnych úloh a zadaní, a to vďaka využívaniu prístupu strojového učenia namiesto prístupu reprezentácie znalostí a uvažovania. Prístupy strojového učenia sa v súčasnosti používajú v oblastiach Legal Tech predovšetkým na pomoc pri hľadaní právnych textov a/alebo dokumentov, na účely ako je vypracovanie zmluvy, due diligence, a vo všeobecnosti na zjednodušenie používania právnych textov a práce s nimi.
Strojové učenie je zastrešujúcim pojmom pre riešenie problémov algoritmami, ktoré vyvinúť ľudskými programátormi by bolo cenovo nedostupné, a teda na riešenie zadaní sa používa metóda, ktorou sa strojom pomáha „objaviť“ ich „vlastné“ algoritmy. Toto vysvetlenie je značne zjednodušujúce a v podstate aj trocha zavádzajúce, konkrétne v tom zmysle, že stroje žiadne nové „vlastné“ algoritmy nevytvoria, ale na základné objasnenie problematiky je toto prirovnanie dostatočne vhodné.
Strojové učenie je postavené na využívaní (najmä) štatistických algoritmov, ktoré dokážu efektívne zovšeobecňovať nespracované údaje a transformovať ich na poznatky, s dôrazom na štatistické metódy zamerané na výhody počítača, ako je napr. veľkosť skúmanej vzorky alebo jej nehomogénnosť. A teda softwéry strojového učenia sú spôsobilé vyriešiť aj zadania, na ktoré im absentujú explicitné pokyny ako ich riešiť.
Teda strojové učenie je limitované tým algoritmom/algoritmami, ktoré boli stroju „dané do vienka“ ľudskými programátormi a na základe ktorých je stroj spôsobilý autonómne vyhodnocovať určité posudzované objekty [napr. text, obraz, diagram a pod.], avšak je tu esenciálne prítomná spôsobilosť stroja autonómne prehlbovať resp. autonómne zdokonaľovať parametre, na základe ktorých uskutočňuje vyhodnocovanie posudzovaných objektov.
Tu môžeme vidieť jednu vtipnú ilustrovanú metaforu, ako funguje strojové učenie:
Je nesporné, že prístupy ML dosiahli pozoruhodné aplikačné výsledky, a najmä nedávno vyvinuté generatívne neurónové siete sú schopné prekonať výsledky mnohých predchádzajúcich prístupov ako stroje naučiť riešiť zadania. Prístupy strojového učenia sa aplikovali o.i. na veľké jazykové modely, na počítačové videnie, na rozpoznávanie reči, kde je príliš nákladné vyvinúť na vykonávanie potrebných úloh schémy reprezentácie vedomostí a uvažovania. Avšak z podstaty povahy strojového učenia, ktorou je architektúra postavená na štatistických metódach zovšeobecňovania, používania podobností a pod., majú tieto modely tendenciu generovať síce vierohodne znejúce, ale nesprávne informácie, prípadne si môžu informácie o konkrétnom predmete vymýšľať, tzv. halucinovať. Práve tento nedostatok, plynúci z ich podstaty, hendikepuje ich širšie nasadenie do životných situácií, ktoré vyžadujú 100%-nú spoľahlivosť výstupnej informácie/poznatku, a naopak favorizuje ich masívne nasadzovanie do situácií, kde sa toleruje určitá miera nespoľahlivosti výstupu [napr. ako konverzačné modely, objektové videnie/rozpoznávanie a pod.]
Bude nám stačiť úzka umelá inteligencia, nebude lepšia tá silná?
Pojmy ako Úzka AI [Narrow AI] a Silná AI [Strong AI]
Silná umelá inteligencia alebo Silná AI využíva technológiu na to, aby dokázala myslieť a autonómne sa „učiť“. Ako sme uviedli vyššie, počítače sú dnes schopné autonómne využívať metódy, ako sú algoritmy a predchádzajúce znalosti, na rozvíjanie vlastných spôsobov „myslenia“. Napriek tomu, že v počítačoch sa používajú iné spôsoby „učenia“ než ako funguje učenie ľudských bytostí, v softvéri existuje istý druh metódy zlepšovania a zdokonaľovania vlastného algoritmu. Silné systémy umelej inteligencie sa učia, ako fungovať nezávisle od programátorov, ktorí ich naprogramovali.
Je však potrebné dodať, že Silná AI je o zlepšovaní výkonu počítača v rámci „priestoru“ definovaného v algoritme, ktorý softvéru predvolene pridelili ľudský programátori pri jeho vytvorení, a preto úroveň „počítačových znalostí“ za hranicami algoritmu zostáva nezmenená.
Úzka umelá inteligencia [Narrow AI] alebo tiež niekedy uvádzaná ako slabá AI [weak AI] je umelá inteligencia, ktorá konkuruje len jednej oblasti ľudského myslenia, je zameraná len na jednu úzku úlohu, pri riešení ktorej dominuje nad ľuďmi. Úzka umelá inteligencia sa nedokáže sama „učiť“, nakoľko slovo úzka v pojme Úzka AI znamená, že počítač je striktne obmedzený na to, aby riešil naraz iba jeden presne definovaný problém s takým výstupom, ktorý je v softvéri striktne definovaný ľudskými programátormi.
Ak má Úzka AI slúžiť v praxi na riešenie situácií s vyššou zložitosťou alebo ak má Úzka AI riadiť komplex viacerých vzájomne sa ovplyvňujúcich situácií, musí byť tento software robustný. Úzka umelá inteligencia sa zameriava na napodobňovanie toho, ako ľudia vykonávajú činnosti, ako je napr. zapamätanie si vecí, vnímanie vecí a riešenie jednoduchých problémov. Slabá AI nie je schopná mať vlastnú myseľ a môže len napodobňovať fyzické správanie, ktoré môže pozorovať.
Napriek pomenovaniu slabá AI, toto nie je synonymum pre hlúpu AI, keďže medzi príklady slabej umelej inteligencie patria autá s autonómnym riadením, robotické systémy používané v lekárskej oblasti a digitálne lekárske diagnostiky, tzv. autopiloti v leteckej doprave, a pod. Väčšina moderných systémov umelej inteligencie používaných v praxi by bola zaradená práve do tejto kategórie Úzkej AI. Reprezentácia znalostí a uvažovania je typickým príkladom úzkej alebo ak chcete slabej AI.
Resumé
Legal Tech je veľmi zaujímavou oblasťou života právnikov, ktorá teraz viac ako kedykoľvek predtým, zdá sa, prináša nové spôsoby pracovných postupov v právnej praxi, prináša príležitosti na vysokú efektivitu výroby v právnom priemysle, a s tým aj ruka v ruke idúce potreby nových právnych regulácií umelej inteligencie. Tí právnici, ktorí chcú penetrovať a dostať sa hlbšie do témy Legal Tech, a nielen mať rolu vonku laických softvérových používateľov, by mali poznať aspoň základné údaje o princípoch softvéru, na ktorých sú postavené produkty Legal Tech. A to je cieľom jedného z našich blogov. Ďalšie budú skôr či neskôr nasledovať.