Проверка судебной системы на коррупцию с помощью Data Science

  •  16 /
Spread the love

Плюс открытых данных в том, что можно отследить и вскрыть тайные механизмы принятия решений в юридической и судебной системе в частности.
Как пример, приводятся выдержки из работ российских и американских авторов по анализу судебных решений.

Первая работа в журнале ScienceDirect от Oleg Metsker, Egor Trofimov, Max Petrov, Nikolay Butakov (ИТМО) Russian Court Decisions Data Analysis Using Distributed Computing and Machine Learning to Improve Lawmaking and Law Enforcement — по судебным решениям в регионах РФ. В данной статье описаны результаты исследования обработки полуструктурированных данных и анализа решений российских судов (почти 30 миллионов) с использованием распределенной кластерной вычислительной среды и машинного обучения. Spark использовался для обработки данных, а деревья решений — для анализа. На примере закона о пожарной безопасности демонстрируется метод машинного обучения для определения эффективности изменения и прогнозирования последствий изменения закона. Также показана ассоциация влияния законотворчества на правоохранительную деятельность. Выявлены связи правоохранительных органов с экономическими и социальными показателями между регионами. Судебная интерпретация наблюдений также описана в этой статье, что доказывает соответствие результатов.

Выявлены связи правоохранительных органов с экономическими и социальными показателями между регионами.

В ходе вычислительного эксперимента они проанализировали серию данных, описывающих изменения относительно времени и регионов в процессе принятия административных судебных решений на примере статьи 20.4 Административного закона Российской Федерации «Нарушение требований пожарной безопасности». Более 50 000 решений по восьми наиболее упоминаемым регионам России были отобраны из общих собранных данных о 4 444 562 решениях административных судов. Ретроспектива была с 2009 по 2017 год. Из текстов были извлечены такие обстоятельства, как отмена по малозначительности, размер наказания, смягчающие и отягчающие обстоятельства. Дата принятия решения, результат решения, регионы были структурированы на этапе предварительной обработки по технологии Spark. Статья 20.4 Кодекса была пересмотрена с целью выявления возможных закономерностей с 2010 года. С 17 июня 2011 года административные санкции были пересмотрены в сторону ужесточения и изменили компетенцию судов по рассмотрению дел (в первой инстанции). При этом следует учитывать, что основными нарушителями в данной категории дел всегда были должностные лица и юридические лица, а также привлечение к административной ответственности юридического лица.

На следующей диаграмме показано соотношение количества судебных решений, отражающих процесс обжалования, об изменении наказания и об отмене решения без изменений в разных регионах России.

Результаты исследования позволяют сделать два предварительных вывода. Во-первых, эффективность государственной политики в области административной ответственности и последовательной реализации принципов наказания за нарушения выше в тех регионах, которые более благополучны в социально-экономическом плане. В менее обеспеченных регионах наблюдается тенденция суда мириться с правонарушениями с учетом имущественного положения граждан и финансового состояния организаций. Во-вторых, парадоксальный результат рассмотрения дел в Республике Дагестан коррелирует с противоречивыми показателями его социально-экономического положения. Такой дисбаланс в правоохранительной сфере, социальной сфере и экономике заранее можно объяснить высоким уровнем отклонения в регионе, не соответствующим общероссийскому, в том числе вероятным высоким уровнем коррупции.

2-я статья «What Percentage of U.S. Supreme Court Cases are Decided 5-4, and Which Justices Vote Together Most Often? A Review of Historical and the 2017-2018 Term Data» от Yiqin Fu показывает, как и кем принимались судебные решения верховного суда США. Приведем выдержки из статьи.

Разделение голосов в Верховном суде США по составам судов (доля решений 5–4 и 9–0)

Сеть сидящих судей Верховного суда США по совпадению голосов

Затем мы обратимся к моделям голосования отдельных судей и сравним, кто за кого голосует чаще всего и реже всего. Опять же, на эту тему было написано много статей, обычно с использованием таблиц, показывающих процент решений, согласованных между судьями.

Нам легче понять отношения между судьями, если мы нарисуем сетевые диаграммы, которые показывают наиболее близкие модели голосования. Как показано ниже, два судьи соединяются линией, если они голосуют вместе более 67% времени, и чем темнее / толще линия, тем ближе они к схеме голосования. Я выбираю 67%, потому что это среднее значение: судья Томас и судья Сотомайор имеют самый низкий процент (46%), тогда как судья Горсуч и судья Томас имеют самый высокий процент (86%).

Сеть всех исторических судей Верховного суда США по совпадению голосов

Если мы вернемся в прошлое, то увидим, что красные и синие точки действительно смешивались в прошлом, совсем недавно в делах судьи Саутера (назначенного президентом-республиканцем Джорджем Бушем-старшим), судьи Стивенса (назначенного президентом-республиканцем Фордом) , Судья Бреннан и судья Уоррен (назначен президентом-республиканцем Эйзенхауэром) и судья Франкфуртер (назначен президентом-демократом Рузвельтом Демократической партии).


База данных верховного суда США

Как работает аналитика больших данных?

Правительственные и корпоративные документы часто представляют собой длинные и сложные документы, которые обычному человеку нелегко прочитать. В самом деле, потребуется некоторая огромная дисциплина и технические знания, чтобы обнаружить замысловатые закономерности, указывающие на ненадлежащее обращение со средствами — признак коррупции. Однако с помощью аналитики больших данных можно прочесать информацию, чтобы найти сложные детали, которые люди могут упустить. Например, «Панамские документы» были написаны потому, что журналисты использовали большие данные для анализа более 11 000 документов.

Кроме того, аналитика больших данных может оценивать несколько различных источников информации, чтобы выявить тенденции, которые в противном случае легко пропустить. Например, Европейская комиссия и Transparency International использовали собственное запатентованное программное обеспечение для анализа больших данных для сравнения данных, полученных из частных и государственных учреждений, для выявления нарушений, конфликтов интересов и других признаков коррупционного поведения. Возможность анализировать и сравнивать различные источники информации — одно из самых больших преимуществ больших данных.

Аналитика больших данных может использовать методы интеллектуального анализа для обнаружения налогового мошенничества и уклонения от уплаты налогов. Дэвид Франкель, финансовый комиссар Нью-Йорка, использовал методы интеллектуального анализа данных для изучения налоговой отчетности предприятий, базирующихся в городе. Следователи использовали большие данные, чтобы найти предприятия, которые не соответствовали обычной схеме уплаты налогов, что является возможным признаком уклонения от уплаты налогов. Новая информация позволила следователям выявить предприятия, которые потенциально использовали схемы уклонения от уплаты налогов. Другими словами, следователи могли бы провести более разумное и эффективное расследование уклонения от уплаты налогов.

Проблемы аналитики больших данных

Несмотря на огромный потенциал больших данных в борьбе с коррупцией и их использование крупными организациями, такими как Европейская комиссия, все же есть некоторые трудности, которые необходимо преодолеть.

Потребность в открытых данных

Большинство государственных учреждений не имеют структуры для обмена данными. Поэтому большинству людей очень трудно найти данные, связанные с бюджетами проектов развития или политическими решениями. Наличие общей основы для открытых данных помогает установить общий стандарт. В результате будет намного легче читать и интерпретировать информацию от разных организаций. Когда данные легче читать, следователи могут задавать более сложные вопросы о том, как были потрачены ресурсы, что значительно упрощает отслеживание случаев коррупции.

Инструменты данных и аналитики должны быть надежными

Нет смысла вкладывать средства в платформы анализа данных, если данные неточные. Новейшие аналитические платформы обладают интеллектуальными возможностями искусственного интеллекта и машинного обучения. Однако эти платформы по-прежнему предназначены для обработки данных, и, если информация неточна, результаты также не будут точными. Это подчеркивает важность национальных учреждений, ответственных за сбор данных, которые будут использовать аналитические платформы.

Инструменты аналитики также требуют сильной команды специалистов по обработке данных, чтобы максимально использовать возможности инструментов. Однако поиск квалифицированных специалистов по анализу данных остается огромной проблемой, поскольку аналитики данных пользуются большим спросом, и многие из них привлекаются в частный сектор с помощью выгодных предложений.

Ключевые выводы

Коррупция всегда преследовала бюрократию и обходилась правительствам в миллионы долларов. Борьба с коррупцией оказалась сложной задачей. Однако аналитика больших данных может изменить ситуацию. Аналитика данных может оценивать терабайты информации, чтобы находить тенденции и выявлять случаи отклонения от нормы, чтобы улучшить расследования коррупции. Однако, несмотря на огромный потенциал аналитики, все еще есть некоторые проблемы, которые необходимо преодолеть, например необходимость стандартизации открытых данных, обеспечение надежности данных и создание сильной аналитической команды.

Добавить комментарий