*Данный материал старше трёх лет. Вы можете уточнить у автора степень его актуальности.
Машиночитаемое право
Мечтает ли искусственный интеллект об идеальных правовых актах?
Зазулин Анатолий Игоревич
Советник
В настоящее время в недрах Минэкономразвития ведется работа над Концепцией развития технологий машиночитаемого права: в декабре вышел ее проект, подготовленный экспертами «Сколково». Давайте разберемся, что это такое, нужно ли оно нам и может ли российское право стать машиночитаемым.
Вокруг нас – информационный бум. Подключение к Интернету стало обыденным, а обладание смартфоном – привычным для большинства населения. Жизнь переходит в Интернет – во всяком случае, последний уже трещит от контента: тексты законов, судебные решения, статьи, заметки, учебники и комментарии к законам, правовые государственные сервисы и базы данных. И все это нужно юристу в ежедневной работе: найти нужную правовую норму, посмотреть к ней судебную практику, почитать комментарии или статьи коллег. У нас нет времени на ожидание – мы привыкли получать информацию из Интернета быстро и оперативно. И очень сетуем, когда не можем найти что-либо релевантное.
В поиске нужной информации нам уже помогает искусственный интеллект – с того самого момента, как нажата в нетерпении кнопочка «найти» в поисковике или справочно-информационной системе. По введенным нами ключевым словам «Яндекс» или «Гарант» ищут нужную информацию. Осуществляется это по множеству алгоритмов, но основа поиска – это всегда ключевые слова или так называемые теги.
Наиболее умные машины не просто подбирают любые блоки информации, в которых находится введенное слово или словосочетание – они выдают релевантные ответы, т.е. ответы, адекватные логике человека, создавшего запрос. Такой подбор возможен только после «обучения» программы, и вот как оно работает.
Для ИИ готовится обучающий материал – эдакая интеллектуальная пища, состоящая из набора данных. В качестве такого набора могут служить тексты судебных актов или законов. Вообще, данные для машинного обучения всегда «тегируются» - т.е. к каждому объекту привязывается определенный набор ключевых характеристик, описывающих его и выделяющих на фоне остальных. Это необходимо для дискреции объекта – превращения его в информацию, понятную машине. Так, к изображениям привязываются определенные метки насыщенности пикселей, цветовой гаммы, позиции и т.п. Юридические тексты в этом плане тоже нуждаются в тегах – помимо того, что сам их текст представляет собой и данные, и теги, они должны быть размечены по тематике, виду, отраслям права и т.д.
Далее машине задаются вопросы или даются задания относительно загруженных данных. Методом случайного подбора (то есть «наугад») или следуя общему алгоритму, программа дает ответ. Ответ сравнивается с тестовым набором «правильных ответов» либо оценивается самим человеком. Если ответ неверный, набор прокручивается снова. При правильном ответе связи между вычислительными звеньями (нейронами в случае глубокого обучения) получают больший коэффициент значимости и используются чаще в последующем при решении сходной задачи. Один и тот же набор данных проходит через программу множество раз, пока не будет достигнута максимальная точность ответа на вопросы. В своем роде этот процесс похож на обучение ребенка – правда, чтобы ИИ усвоил, что на красный свет светофора переходить дорогу нельзя, а нужно дождаться зеленого, уйдет несколько десятков (а то и сотен) наездов на пешехода1.
В чем сложность такого обучения? В большинстве случаев образовательный материал приходится долго готовить, в том числе ручками: необходимо распознавать тексты документов, тегировать их, вводить вручную либо учить автоматически присваивать теги или значимость того или иного набора информации. Это расходует большое количество ресурсов и времени. Конечно, мы можем оставаться на текущем уровне, но все увеличивающийся объем правовой информации в конечном счете сделает современные способы поиска информации неэффективными. И главное – мы лишимся возможности использовать технологии не только для поиска информации, но и для ее создания – формирования типовых соглашений, законопроектов, интеллектуальных консультантов, автоматизированных систем.
Концепция машиночитаемого права подразумевает создание единого языка и системы понятий (онтологии), понятных как машине, так и человеку. Создаваемая на таком языке информация не будет нуждаться в предварительной обработке и станет сразу доступна для обучения и работы ИИ, но при этом будет понятна человеку.
Идеал машиночитаемого права – это нормативно-правовые акты и судебные акты, имеющие строгую логическую структуру, не содержащие фактических и логических ошибок, создаваемые по унифицированному образцу, сразу с метками и тегами, полностью коррелирующие с другими правовыми актами. Говоря простыми словами, для того чтобы машина смогла эффективно работать и обучаться на законе и судебной практике, ей нужна как минимум идеальная локальная и глобальная юридическая техника написания правовых документов.
Говорить о том, что российская юридическая техника написания правовых актов далека не только от идеала понимания интеллектуальной машиной, но и человеком, – сейчас и банально, и очевидно. В начале года эту тему обстоятельно описал Роман Бевзенко. В большинстве случаев тексты законов пестрят многочисленными отсылочными и бланкетными нормами, взаимоисключающими понятиями или откровенной тавтологией. Судебные акты представляют собой нагромождение цитат всех возможных и мало-мальски применимых к рассматриваемому спору правовых норм с тонущими в них худенькими абзацами, выражающими выводы суда. В поисках нужного толкования конкретной нормы в любой справочно-правовой системе мы тратим огромное количество времени на «отбраковывание» судебных актов, где данная норма только упоминается; подбор ключевых слов стал искусством предвидеть нужный судебный акт и найти нужное умозаключение в запутанном лабиринте канцеляризмов. Проблема здесь – не в инструменте поиска, а в его объекте. Такая информационная база – плохая пища для ИИ, бедная питательными веществами – корреляциями, логическими связями и обоснованными выводами.
Можно ли в таком случае увидеть сейчас в России предпосылки для развития машиночитаемого права? Ответ, я думаю, очевиден.
Но прежде, чем задумываться о концепции машиночитаемого права, не надо ли сперва разрешить вопрос о принципиальной возможности анализа права или хотя бы законодательства посредством ИИ? Разработчики концепции машиночитаемого права видят его дальнейшие перспективы в судопроизводстве и нормотворчестве: после машинизации ИИ сможет проводить правовую оценку законопроектов, автоматизированно «собирать» электронное судебное дело и создавать шаблоны НПА и судебных актов.
Но сможет ли ИИ, помимо нахождения корреляций между правовыми актами, толковать их не только буквально? Возможно ли научить машину толковать акты расширительно или ограничительно в зависимости от конкретной ситуации? Требуется ли для толкования не только «усвоение» (которое умеют современные ИИ), но и «понимание» (которого у современных ИИ нет)? Эти вопросы, находящиеся на стыке Data Science и теории государства и права, никем не изучены: мы любим порассуждать (или «похайпить») об этических вопросах ИИ, о правосубъектности ИИ, игнорируя более важные и «земные» вопросы. В большинстве случаев ортодоксальное и консервативное юридическое научное сообщество просто не готово выходить за рамки правовой «зоны комфорта».
Без ответа на многие вопросы такого рода концепции, как обсуждаемая здесь, останутся только концепциями – не закрыв старые гештальты мы уже мчимся открывать новые горизонты.
Источник: блог Анатолия Зазулина, INTELLECT, на сайте Zakon.ru
Статьи экспертов юридической фирмы INTELLECT >>
[1] Такое описание обучения ИИ – конечно же, слишком упрощенное: выделяется несколько парадигм обучения ИИ, их совмещения в рамках конкретного программного продукта (т.н. «ансамблирование»), а также методов обучения ИИ (с учителем, без учителя) и построения его алгоритмов (машинное обучение или нейронные сети). Интересующимся можно посоветовать серию отличных видео «Нейронные сети на Python» на YouTube.