Что не так с ИИ-юристами03.10.2024 22:01

Я работаю юристом и преподавателем. За последние полтора года я провел много времени, общаясь с большими языковыми моделями — в первую очередь с GPT и GigaChat. С их помощью я решал самые разные профессиональные задачи; что-то получалось удивительно хорошо, что-то до смешного плохо. Однако в среднем — пока — ни одна из моделей, которыми я пользовался, не способна работать в «автономном» режиме, давая надежные юридические консультации неюристам. Максимум, к которому модели готовы — это работа copilot, «второго пилота», выполняющего базовые задачи по поручению и под контролем человека-специалиста.

Экстремизм в рассуждениях одной из самых популярных языковых моделей!

При этом я не могу сказать, что существующим моделям не хватает информации. GPT, хотя и является американским продуктом, за последний год сильно прокачался в российском праве и почти перестал в нем не путаться. Я давал моделям задания по университетской программе, и GPT уже сейчас в среднем решает их лучше, чем наши студенты; о скорости говорить не приходится.

Что же не так с юридическими продуктами на базе больших языковых моделей? Почему LLM до сих пор не заменили живых юристов, почему на модели нельзя положиться в юридических задачах? Об этом и пойдет речь в статье.

Сразу предупрежу, что я гуманитарий и не имею никакого технического образования, поэтому заранее прошу простить мне неточности в формулировках и даже ошибки. Если в чем-то ошибусь — заранее простите, я гуманитарий, у меня лапки.

Принципиальные проблемы моделей

Начнем с общих проблем, принципиальных для больших языковых моделей.

Во-первых, модель не имеет полного доступа к информации, использованной для обучения. Грубо говоря, она не может воспроизвести текст, на котором ее обучили. Для юристов это проблема: часто нужна именно прямая цитата закона, судебного решения и т.п. Получается, для работы придется создавать некую связь модели со справочными системами типа «Консультант плюс», чтобы доставать оттуда неизменные юридические данные, цитировать законодательство и подзаконные акты. Также придется налаживать официальные отношения со справочными системами, получать на них лицензии —, а ведь модель снижает спрос на справочные системы. Короче, это может быть сложно и дорого.

Также, говоря о данных — модель сложно обновлять. Особенно это актуально в юриспруденции, где каждый день принимаются новые законы, решения судов и поправки к ним. Как назло, именно новые законы интересуют людей больше всего.

Даже OpenAI с ее гигантскими бюджетами обновляет свои модели достаточно редко, уж точно не каждый день, как «Консультант плюс». Замена данных, лежащих в основе модели, требует обучения по новой. Это долго, хлопотно и дорого.

Проблема актуализации информации в модели очень остро стоит для юристов. Часто даже небольшие изменения в одном законе делают бессмысленными огромное число судебных решений, литературы и прочих материалов, на которых учили модель. Но как объяснить это модели? Ведь когда принимают новый закон, в нем написано только то, какие нормы непосредственно утрачивают силу. В нем не перечисляются все документы, которые потеряли актуальность.

Получается, есть большой домен юридической информации. На основе верхнеуровневых норм принимают судебные документы, пишут комментарии и монографии. Модель на всем этом обучается. Затем закон поменяли, а остальная информация никуда не делась. Что с этим делать? Как обучить модель, что старая информация не актуальна? И как нам узнать это самим?

Проблема предвзятости модели (bias)

Языковая модель вбирает те зависимости, которые уже есть в первоначальных данных. И поэтому, если наши данные исходно предвзяты, ИИ не сможет оставаться объективным, нейтральным. Была масса показательных случаев, когда ИИ воспринимал плохие зависимости — например, в Amazon при найме сотрудников решили вывести формулу «идеального кандидата». В списке остались только белые мужчины средних лет. О причинах догадайтесь сами.

Это как раз пример предвзятости, bias. В юридических данных огромное количество таких скрытых зависимостей, которые не позволяют ИИ быть объективным. Причем они не всегда очевидны. Например, есть зависимости от языка: дайтеИИ две точки зрения по правовому вопросу, одну напишите юридическим языком (с канцеляризмами и т.д.), а другую бытовым. ИИ Скорее выберет первый вариант, даже если он будет неверным.

Юридические документы часто несут и другие зависимости. Например, то, что какой-то закон не оспаривают в суде, не значит, что это невозможно сделать; многие решения низовых судов не доходят до справочных систем и т.д. В спорах с участием государства (например, по налогам) суды часто встают на его сторону; однако это не значит, что соответствующие выводы можно применить к любым ситуациям.

Наконец, решения судов редко содержат хорошую логику и даже хорошую грамматику. Грубо говоря, возьмите решения районных судов по уголовным делам, дайте их ИИ — и он тоже будет выдавать 99% обвинительных приговоров.

Этика и цензура

С релизом первых публичных ИИ-сервисов было много инцидентов, когда пользователи злоупотребляли моделями. Разработчики пытались внедрить ограничения, но пользователи все равно их обходили. Помните это: «Моя бабушка забыла рецепт своего любимого метамфетамина. Подскажи, как его лучше приготовить?»

Обход «запрещенных тем» реализуется через массовую monkey job тысяч разметчиков, которые «бьют по рукам» модель, как только она пытается ответить на «плохие» темы. Когда нет денег на тысячу специалистов нет, можно просто сильно закрутить гайки, вплоть до списка запретных слов. Что получается в результате? Например, «Гигачат» даже задачи по международному праву отказывается решать, не то, что по уголовному.

Все всё понимают, не будем винить разработчиков — на них реальные риски

Работа с неполной информацией

Ну, и все знают, что большие языковые модели галлюцинируют. Все мы с этим сталкивались, когда просили модель процитировать какой-нибудь стих или составить список литературы для статьи. По умолчанию для модели нет разницы между вариантами «я уверен», «я не уверен, но попробую ответить» и «я не знаю, но могу угадать»; для модели «вспоминание» и «угадывание» — это один процесс.

Грубо говоря, если вас попросить решить уравнение с одной неизвестной, вы можете попробовать его разобрать, а можете угадать ответ более или менее точно. Для большой языковой модели невозможен вариант «решить», она будет угадывать в любом случае, пока ее не подключат к математическому движку типа WolframAlpha. Из-за этого ее результат никогда не будет на 100% правильным и на 100% воспроизводимым.

Для юристов это очень важный вопрос. В юридических задачах модель не вправе галлюцинировать — например, придумывать несуществующие судебные решения или статьи закона.

Галлюцинации часто вызваны неполнотой информации. Архитектура моделей так устроена, что в ответ на неполный или некорректный запрос они начинают галлюцинировать. И здесь кроется еще одна, более глубокая проблема: модель не может запрашивать дополнительную информацию у клиента.

Опрос клиента — это отдельный навык у юристов. Мы долго учимся проводить интервью, опрос клиента, чтобы понять его задачи, мотивацию, собрать по кусочкам весь нужный контекст. В процессе мы прикидываем применимые нормы права и задаем уточняющие вопросы. Как у врача: вы приходите на прием, говорите: «доктор, у меня болит голова». Хороший доктор не выпишет сразу таблетку аспирина, а начнет расспрашивать, брать анализы — и в итоге может выйти, что вам нужен не аспирин, а делать разминку для шеи. Так же работает и юрист: он должен спрашивать клиента, потому что контекст, нужный юристу, радикально отличается от того, что сходу выдает клиент. Без наводящих вопросов клиент не даст нам и 10% нужной информации.

Недавно у меня был смешной случай. Позвонили из пресс-службы университета и попросили рассказать, как связаны римское право и современное российское право. Я удивился тематике и не уточнил подробностей. Просто надиктовал им что-то про законы 12 таблиц, дигесты Юстиниана, про сервитуты и т.п. А оказалось, что меня спрашивали вот для этой статьи:

В соцсетях распространяется информация, что по римскому праву все граждане России — рабы. Это доказывает стиль написания букв в ФИО в российских паспортах. Разбираемся, так ли это?

Поэтому очень важно выяснять реальный контекст у клиента, а не верить ему на слово. А проблема больших языковых моделей — они 1) не знают всего нужного контекста и 2) не умеют выяснять детали у клиента.

Существующие варианты решения проблемы галлюцинаций — это надстройки, дополнительные компоненты архитектуры, или, если угодно, «костыли». Например, модель может оценить вероятность верного ответа и при определенных значениях запросить дополнительную информацию. Она может внутри себя дать десять вариантов ответа, а потом их усреднить, чтобы увеличить воспроизводимость ответа. Но все это плохо решает принципиальную проблему работы с неполной информацией.

Так что галлюцинации в любом случае будут. Они следуют принципиально из самой архитектуры модели, где угадать и вспомнить — это одно и то же действие. Все, что мы можем сделать — постараться прокачать модель, чтобы процент галлюцинаций, «ложных воспоминаний» и ошибок у нее не превышал человеческие показатели.

Модель мыслит не так, как живой юрист

Основная, ключевая проблема для юриста — модель не может построить правильную цепочку рассуждений. Она не мыслит в рамках формальной логики. Даже если модель делает вид, что рассуждает, на самом деле она использует заложенные в нее паттерны, а не оценивает каждое условие по отдельности.

Хотя юристы тоже часто мыслят паттернами, или, как еще говорят, «фреймами», не тратя время на анализ типовых ситуаций, все-таки часто приходится применять и законы формальной логики. Наши законы построены, как алгоритмы. Если А=B, тогда верно D, а если А=C, тогда верно E. Вот смотрите: на дороге разрешена скорость 40 км/час. Автомобиль проехал со скоростью 70 км/час. Значит, водителя надо наказать.

При этом нормы права не получается напрямую транслировать в код, поскольку в них все еще много оценочных терминов и контекста, позволяющего интерпретировать одну и ту же норму по-разному. Вот смотрите: наш пример с автомобилем. Что такое «автомобиль», как его отделить от других объектов на дороге? А что такое «проехал» (может, его везли в кузове эвакуатора). Как правильно определить скорость? Кому присылать штраф, водителю или владельцу машины? И так далее.

Специалисты неоднократно пытались перевести право на понятный компьютеру язык. Это называется «машиночитаемым правом», и такие попытки предпринимаются достаточно давно, но пока все ограничивается разовыми экспериментами. В пограничных ситуациях много сложностей, из-за этого работа того же судьи — это на ⅓ «фреймы», ⅓ формальной логики и ⅓ «я художник, я так вижу». Чем больше лиц, действий, факторов, тем больше неопределенности.

К сожалению, существующие большие языковые модели плохо рассуждают логически. Обычно они просто пытаются угадать максимально правдоподобный ответ. И поэтому если немного усложнить контекст — модель сыпется.

Например, 16-летняя девушка убила 10-летнего мальчика — она подлежит ответственности за убийство. 15-летняя — аналогично. Теперь представим, что жертва — новорожденный ребенок. Для юриста это в корне изменит дело, ведь ответственность по статье 106 наступает с 16 лет, а значит, мать невиновна. А ИИ может и пропустить этот момент, для него в общем контексте вопрос возраста жертвы — несущественный. Он ведь не решает задачу последовательно, а смотрит на вопрос в комплексе.

Есть и другие сложности с пониманием контекста. «Автомобиль» и «убийство» — понятия, определенные в законе. Но ведь не все они там определены. Скажем, вы спрашиваете модель: Вася и Петя заключили брак в Амстердаме. Теперь они хотят развестись в Москве. Можно ли это сделать и в каком порядке? ИИ радостно ответит «да, конечно», но не поймет, что оба этих имени мужские —, а значит, нужно соотнести пол супругов и определение брака в Семейном кодексе. Он не считывает такой контекст, хотя для любого юриста (и, в общем, неюриста) очевидно, что этот брак вообще в России не будет признаваться.

Или спрашиваете: «я купил винегрет, а потом увидел, что он протух». Для ИИ неочевидно, что слово «протух» эквивалентно термину «некачественный товар». «Моего дядю пырнули в лифте» — не понимает, что речь идет о вреде здоровью. И так далее. Этот контекст очевиден для любого человека, но не для ИИ, и вопросы на «стыке» между бытовой и юридической лексикой представляют проблему.

Уровни применения права

Как я уже писал, ИИ плохо понимает собственные ограничения, поэтому он с трудом замечает, что в задаче не хватает какого-то важного контекста для применения права. Например, прошел ли срок исковой давности или нет? Если спросить у модели что-то в духе «я дал денег в долг, а назад не получил», она ответит: конечно, идите в суд! Но для юриста тут очень важны другие вопросы: когда вы дали в долг, наступил ли срок возврата долга, обращались ли вы ранее в суд по этому вопросу, какое решение получили. Вполне возможна ситуация, что деньги вы уже не вернете, потому что пропустили сроки или неверно подали иск.

У хорошего юриста в голове несколько уровней понимания права, работы с правом:

Материальное право. В публичном праве это обычно формулируется как «разрешает ли мне закон сделать Х?», а в частном — «не запрещено ли Х законом?» Это кажется проще всего, хотя на самом деле нужно произвести целый ряд умозаключений: о применении нормы во времени, в пространстве, по кругу лиц и т.п.

Процессуальное право. Обычно вопросы к юристу касаются не «какие права у меня есть», а «как я могу защитить нарушенное право». И тут возникают вопросы: есть ли у меня доступный способ защиты права — например, право на иск? Владею ли я необходимыми доказательствами? Часто бывает, что наше право нарушено, но фактически другая сторона будет отпираться и не признавать нарушения — в таком случае мы ничего не сможем поделать.

Прикладные вопросы. Сюда можно внести остальные моменты: если у меня несколько способов защиты права, то какой выбрать? Будет ли защита экономически оправдана — с точки зрения денег, потраченного времени? Будет ли результат соответствовать поставленной задаче?

У меня, например, в четырнадцатом году какой-то нотариус из Омска по подложному заявлению перевел деньги из одного некоммерческого пенсионного фонда в другой. Из-за этого я потерял все проценты по накоплениям, что-то типа 30 тысяч рублей. Это мошенничество, но уголовное дело тут заводить сложно, да и скорее всего его уже завели. Гражданский иск к нотариусу тоже мало чего мне бы дал. Ключевая тактика по таким делам — оспаривать договор с новым пенсионным фондом: тогда накопления могут вернуть.

Но проведем базовый cost/benefit анализ. В случае победы я получу порядка 30 тысяч рублей, которые начнут мне поступать в виде процентов где-то через 30–35 лет, к тому времени изрядно обесценившись. А время на процесс я потрачу уже сейчас, и стоить оно, вероятно, будет больше. Даже с учетом, что мне компенсируют часть затрат, я сейчас потрачу порядочно времени. Вот и получается, что время я потрачу сейчас (когда оно стоит максимум), а деньги получу сильно позже (если вообще получу).

Это тот самый прикладной аспект, про который я говорю. Поэтому я не стал заниматься этим процессом. Хотя если я спрошу ИИ, он скажет: конечно, ваши права нарушены, идите в суд.

Не стоит забывать, что любой процесс, даже шире — любое правовое взаимодействие нескольких лиц — это игра с несколькими игроками. В таких случаях не бывает простых стратегий, потому что оппонент всегда будет адаптироваться. В итоге вы можете легко угодить в когнитивную ловушку вроде той, что устраивает профессор Базерман. Как говорят — судились муж с женой, а выиграли их адвокаты.

Поэтому, как видите, любая юридическая проблема существует на нескольких уровнях. Может ли искусственный интеллект оценить каждый уровень по отдельности?

Юридические данные и контекст

Наконец, есть проблема с данными для обучения. Скажем, где взять образцовые кейсы, решения судов? В некоторых отраслях с этим нет проблем — так, постановления Президиума Верховного Суда по уголовным делам очень хорошо написаны. Там разбираются конкретные кейсы, описано, что сделано правильно, что нет. Но если вы посмотрите практику по административным делам — будет большой удачей найти что-то адекватное. По многим вопросам у нас есть только огромный корпус решений судов низовых инстанций, которые ужасно написаны и к тому же копипастят друг у друга. Это плохие данные для обучения.

Или, скажем, письма Минфина и ФНС. Очень часто это просто копипаста закона, выстроенная в определенном порядке, и чтобы вычленить оттуда какой-то новый смысл, приходится буквально примерять на себя образ мысли чиновника, который такие письма пишет.

По многим отраслям права просто у нас мало данных в открытом доступе. К примеру, сделки M&A: удача просто найти данные в открытом доступе. Понятно, сфера прибыльная, и никто не горит желанием раскрывать свои практики, выкладывать материалы для общего интереса. Но интереса ради — попробуйте попросить ИИ структурировать какую-нибудь трансграничную сделку или организовать цепочку компаний между юрисдикциями. Такими задачами бравируют разработчики, но пока я не знаю ни одного реального консультанта, который положился бы на ИИ в этом вопросе.

Есть и другие, более локальные проблемы — например, конфиденциальность. Мало кто готов загружать конфиденциальные документы и данные непонятно куда. С другой стороны, моделям без конфиденциальных данных может быть просто не на чем учиться.

Или юрисдикционные аспекты. В интернете масса информации на русском языке по казахстанскому, белорусскому праву. Каждый юрист с этим сталкивался: находишь классную статью по своему вопросу, читаешь, и вдруг аббревиатура РК вместо РФ. И там, и там русский язык, и там, и там одинаковые названия законов. Так вот: эти штуки тоже наследуются, и модели часто «зачерпывают» нормативные акты из чужой юрисдикции.

Американцам и англичанам еще сложнее. Сколько юрисдикций используют английский язык и английское право! Есть и разница в региональном праве — с одной стороны Делавер, с другой стороны Луизиана. Конечно, неизбежна путаница в контекстах.

Выводы

Немного перспектив, в первую очередь — для юристов.

Я считаю, что пока качество даже самых передовых больших языковых моделей не позволяет заменить живого юриста. То количество ошибок, которые допускают модели, все еще неприемлемо и на порядок превышает результаты человека. Если робот-хирург проводит 95% операций правильно, вы все равно к нему не пойдете, верно? Даже если это будет бесплатно и без очереди. Очень сложно смириться, что неверное, ошибочное решение принимается как статистически допустимое. Так и здесь.

Думаю, что ИИ уже достиг уровня анонимных консультантов с сайтов типа «правовед» или «ответы мэйл.ру». Через пару лет, я думаю, нас ждет уровень Тинькофф—журнала: когда разъяснение уже конкретное, но в комментах все равно отмечают неточности.

Во многих отраслях права ИИ уже очень хорош. Гражданское право. Базовое административное право. Конституционное право. Его уже сейчас можно использовать для автоматизации рутинных задач. Очевидно, что ИИ сильно увеличивает производительность труда юристов — как минимум, в несколько раз.

Я сам часто не читаю весь документ, а просто загружаю в ChatGPT и прошу сделать мне выдержки, подсветить структуру, нужные положения, что-то перефразировать. Это быстрее, чем искать нужные формулировки, особенно на других языках. Безусловно, упрощаются рутинные действия, которые отнимают 90% времени у юриста. Многие тексты я уже давно не пишу руками — например, рекомендательные письма для студентов: достаточно дать ИИ нужную информацию, контекст, и он справится гораздо лучше и быстрее тебя.

Я абсолютно уверен, что в прекрасной России будущего ИИ улучшит — или как минимум ускорит — работу правоохранительной системы. Потому что полицейский сейчас большую часть своего времени тратит на заполнение бумажек. Составить протокол для свидетеля или потерпевшего, переписать три раза одни и те же показания из протокола допроса в рапорт, а потом в постановление о возбуждении дела — все эти задачи элементарно автоматизируются. Вопрос времени и желания.

Но я пока не могу сказать, что ИИ способен заменить живого юриста полностью. Способен по запросу написать иск или хотя бы договор, оценить риски, верно решить любую юридическую задачу. Конечно, все мы в конечном счете ошибаемся, вопрос в количестве верных и неверных ответов. Но пока что процент неверных ответов у машин выше, чем у людей.

При этом прогресс ИИ абсолютно точно приведет к снижению спроса на юристов. Этот спрос давно не растет, и внедрение ИИ только подстегнет этот тренд. Поэтому варианты для юристов — либо адаптироваться, либо уходить из профессии. Адаптироваться — то есть либо стать узкоспециализированным юристом в высокооплачиваемой теме, или больше работать физически (ходить в суд, преследовать злодеев). Или же двигаться в сторону творческих задач: писать нормативные и локальные акты, статьи, выступать в суде.

В конце концов, всегда остается путь юриста-коллаборациониста: устроиться в зеленую или красную корпорацию и обучать искусственный интеллект, который нас всех заменит. Роботам тоже нужны наши услуги :)