Big data: возможности использования в юриспруденции
Big data: возможности использования в юриспруденции
По разным оценкам, к 2025 году количество цифровых данных по всему миру составит 163 зеттабайта (163 триллиона гигабайт!). При этом 90% всей информации, которую мы произвели за последние 2 года, это 2.5 квинтиллиона байтов каждый день. Сложно представить, как вся эта информация будет обрабатываться и какой КПД от этого в итоге получит человечество. Путь к накоплению такого гигантского количества данных начался не так давно, а сам феномен получил название Big data («большие данные»).
Первое упоминание о Big data в 1990-х связывают с именем John Mashey – PhD Университета Пенсильвании в области программирования. Популяризаторское введение термина связывают с Клиффордом Линчем, редактором журнала Nature, подготовившим к 3 сентября 2008 года специальный выпуск с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?», в котором были собраны материалы о феномене взрывного роста объёмов и многообразия обрабатываемых данных и технологических перспективах в парадигме вероятного скачка «от количества к качеству» .
Google trends фиксируют активный интерес к этой теме примерно с апреля 2011 года. В McKinsey заметили этот тренд почти сразу и выпустили в том же году отчет по использованию технологии Big data и дали свои прогнозы в отношении ее адаптирования в сфере здравоохранения, государственного управления, персональных данных, продаж и производства в США и ЕС.
Классическими источниками больших данных признают интернет вещей и социальные медиа. Считается также, что большие данные могут происходить из сфер медицины и биоинформатики, из астрономических наблюдений. В качестве примеров источников возникновения больших данных можно привести также непрерывно поступающие данные с измерительных устройств, события от радиочастотных идентификаторов, метеорологические данные, данные дистанционного зондирования Земли, потоки данных о местонахождении абонентов сетей сотовой связи, устройств аудио- и видеорегистрации.
Немного о том, какие техники и методы анализа используются при обработке Big data. Вот список из 26 таких методов (см. здесь и здесь), среди которых:
Машинное обучение;
Искусственные нейронные сети;
Распознавание образов;
Прогнозная аналитика;
Имитационное моделирование;
Пространственный анализ;
Статистический анализ;
Визуализация аналитических данных.
Области применения Big data могут быть самыми разными:
Научные исследования;
Банковский сектор;
Рынок ценных бумаг;
Медиа;
Маркетинг и таргетированная реклама (привет, Facebook);
Образование;
Производство;
Государственный сектор;
Страхование;
Продажи;
Транспорт;
Энергоносители.
Несмотря на то, что термин подразумевает анализ большого количества данных, те же техники и методы могут быть применимы и для обработки куда менее объемных данных (сравните обработку данных, получаемых с телескопа Хаббл с 1990 года, и данные конкретного предприятия, обрабатываемые для повышения удоев молока).
Что касается юриспруденции, то Big data может быть полезна сразу в нескольких направлениях:
Legal Research. Полноценный анализ – обязательная часть работы любого юриста. Для юристов-судебников есть сервис, позволяющий визуализировать найденную информацию по релевантным делам и статистике – home.ravellaw.com .
Case Strategy. Юристы могли бы сэкономить много ресурсов, заранее имея понимание перспектив рассмотрения судебного дела. Технология способна анализировать тысячи похожих дел по ключевым словам и выдавать свои прогнозы даже с учетом личности судьи, который будет рассматривать дело. Этим занимается, например, французский стартап https://predictice.com/. А вот результаты разработчиков из Университета Шеффилда и Пенсильвании в области прогнозирования исходов дел Суда по правам человека – ucl.ac.uk/news/news-articles/1016/241016-AI-predicts-outcomes-human-rights-trials . Вот еще – lexsemble.com
E-discovery: Поиск электронной информации — это процесс обнаружения, сбора и представления сведений, хранящихся на цифровых носителях: электронных писем, презентаций, баз данных и любых других документов, способных выступать доказательствами в судебном разбирательстве. Данная технологии наиболее развита в США и Великобритании в силу прецедентной правовой системы. Наиболее популярные сервисы здесь: relativity.com , symantec.com , exterro.com/e-discovery-software .
Однако не все разделяют мнение о безоговорочной пользе использования Big data в праве. В качественном исследовании Корнельского Университета содержится аргументированный скепсис (lawschool.cornell.edu/research/JLPP/upload/Devins-et-al-final.pdf). Авторы считают, что в то время, как право семантично, Big data использует синтаксические методы (парсинг), то есть просто сопоставляет линейную последовательность. Право абстрактно, ценностно-ориентированно, строит новое и строится на компромиссе. Big data эмпирична, алгоритмична и детерминистична, не создает нового. Авторы считают технологию чуждой системе общего права в принципе. Основные причины кроются в недостаточной объективности и нехватке теоретического базиса. Кроме того, ученые посчитали, что предиктивная функция Big data преувеличена и проблема заложена именно в самой технологии. Big data, будучи системой алгоритмов, по определению не может выйти за рамки своих границ анализа. Так, система может не учитывать такие важные факторы, как раса, пол, вероисповедание, при «вынесении» вердикта. Авторы считают, что использование Big data как инструмента для risk assessment в праве не может быть взято за основу при вынесении решений судом. В общем, очень интересная статья – рекомендую.
В России Big data в праве не используется (я таких сервисов не знаю, по крайней мере). Основная причина – неразвитая система электронного документооборота. Надеюсь, под этим постом выскажется какой-нибудь разработчик и заявит, что скоро такой сервис у нас появится.
Источник https://zakon.ru/blog/2018/09/25/big_data_vozmozhnosti_ispolzovaniya_v_yurisprudencii
Редактор неформального правозащитного объединения юристов и журналистов «Команда 29» Николай Овчинников 23 июня на баркемпе в Кирове рассказал, как мобильные игры на темы права помогают людям не бояться силовиков в реальной жизни и защищать свои права. Интернет-журнал «7×7» публикует расшифровку его лекции.
«Нет веры в человека»
― Самая большая проблема медийных правозащитных организаций в России в том, что зачастую они не верят в человека ― в человека, который готов смотреть, слушать, играть. Большая проблема в том, что по умолчанию считается, что среднестатистический слушатель глупее среднего. Мне кажется, в этой фразе заложена одна из главных «родовых травм» медиа, журналистики и вообще всех проектов в России ― они не верят в человека, [считая, что] если ему еще не исполнилось 25 лет, он не готов потреблять нашу информацию. «Мы пишем такие крутые тексты, а эти ребята их не читают ― наверное, они глупые». С этим стереотипом надо бороться и поскорее, потому что нет никакой зависимости ни от возраста, ни от гендера, ни от места проживания.
Я помогаю делать медиа в «Команде 29» ― это небольшое правозащитное объединение в Санкт-Петербурге, которое помогает тем, кого обвиняют в преступлениях против государства, и защищает право людей на информацию. Кроме юристов у нас есть журналисты. Я пришел в команду в 2015 году и ничего не знал о правозащитной деятельности. И приток людей из других сфер в правозащитные организации ― это очень классно, потому что так нет застоя. Мы пытаемся принести новые компетенции в правозащитный сектор. Мы начали делать свое небольшое издание, рассказываем о том, как живет Россия и как вообще в ней жить, делаем небольшие памятки.
«Есть возможность минимизировать ущерб»
― Проблема российских законов в том, что они безумно сложные. Второе ― это очень страшно. Как мы все знаем теперь (если кто-то не знал до дела [спецкора «Медузы», которому пытались вменить сбыт наркотиков] Ивана Голунова), подбросить наркотики или просто остановить на улице для установления личности, если у вас нет паспорта, могут кого угодно ― даже если вы не замечены в активной политической деятельности, не работаете журналистом, вообще живете тише воды, ниже травы.
И мы стараемся не только защитить людей, но и как-то их успокоить. Мы считаем, что закон в любом случае на стороне человека и даже в самых безвыходных ситуациях есть возможность минимизировать ущерб. Понятно, что у нас нет хороших оправдательных приговоров, их меньше 1%, у нас суды могут дать наказание ниже низшего, и это будет считаться победой, или дать условный срок.
Мы хотим, чтобы люди не только приходили к ним за помощью, но и чтобы они не доходили до того момента, чтобы нужно было бы идти к нам или другим правозащитникам за помощью. На самом деле это куда более важная история.
Зачем делать игры
― Мы могли привлечь кучу классных журналистов-консультантов, могли объединиться с другим медиапроектом, могли рассылать пресс-релизы и работать дальше, как и другие организации. Но мы решили, что лучше сделать свой небольшой сервис и попробовать повзаимодействовать с той аудиторией, которая про правозащитные проекты не читает, не знает и, скорее всего, знать не хочет.
Помимо всего прочего, мы делаем тесты, игры ― мы увидели, что у аудитории, которая не хочет читать тексты или у которой нет на это времени, почему-то есть время на игры. Наш контент становится новостями, и я думаю, что у всех организаций есть возможность делать так же. Например, вы ведете свой маленький проект по спасению леса, и вам кажется, что единственный способ взаимодействия с журналистами ― это рассылка пресс-релизов или приглашений прийти на акцию в соцсетях. На самом деле нет, очень хорошо работают качественные медиапроекты. Они играют долг и, размещенные на сайте, еще долго будут рассказывать эту историю.
Мы говорим о доверии, и большая проблема в том, что люди из организации наподобие нашей иногда не общаются с потенциальными клиентами или читателями. Когда в 2016 году в «Телеграме» появились публичные чаты на много-много человек, мы решили их опробовать. Предложили людям задавать в нашем чате любые вопросы по нашей тематике: доступ к информации, уголовное законодательство. Обнаружилось, что этот формат действительно востребован и это хороший канал связи для тех, кто хочет что-то узнать о защите своих прав, но не знает, к кому обратиться.
Есть одна проблема ― ядерная аудитория «Команды 29» старше 25 лет. Но есть много людей, активно участвующих в политической жизни, занимающихся полезными вещами, и до них наша информация не доходит ― они просто не видят наш контент, или видят, что это какие-то сложные длинные тексты, или не готовы выделять время на длительное чтение.
Как с ними работать? Мы искали разные варианты ― нам хотелось не то чтобы достучаться до них, а принести им какую-то пользу. Потому что мы понимаем, что не можем защитить всех, рассказать обо всем и общаться с каждым. Но есть форматы, которые востребованы, и это игры. Аудитория мобильных игр огромная, и большая ее часть ― люди от 18 до 25 лет, и это благодатная аудитория практически для любого проекта. Например, есть много просоциальных игр: они связаны с общественной, социальной пользой.
Чем помогут игры
― Пример просоциальной игры, которая иллюстрирует состояние чиновничества в условно авторитарном обществе, ― «Papers, Please». Или игра «The Westport Independent» про журналистов в стране, в которой цензура, а ты работаешь в проправительственном издании, и каждый день тебе приходится что-то вымарывать из своих статей, а потом дома смотреть в глаза своим близким.
Мы решили сделать что-то подобное, но проблема в том, что у любой некоммерческой организации нет миллионов долларов, чтобы сделать высокобюджетную игру. Есть выход ― это текстовые квесты: они не требуют больших затрат, практически это только текст и иллюстрации. В них нужно выбирать за персонажа его действия в определенных ситуациях.
Наша игра называется «Гэбня» ― раньше так называли КГБ. По сюжету, к герою (студенту или бизнесмену), который когда-то давно участвовал в митинге, неожиданно приходят «товарищи» из органов ― и герою нужно не попасть в СИЗО, чтобы в результате допросов и обысков он остался на свободе. Это немного утопическая по современным российским меркам история, но она про знание, это поможет понять, как вести себя при обыске, что делать, если следователь хочет с вами поговорить прямо сейчас. Что, кстати, нужно делать в этом случае? Правильно, сначала просить прислать повестку, потом звонить адвокату.
Это не самая сложная разработка, самая сложная часть ― это контент, важно найти человека, который напишет вам хорошую историю, за которой интересно следить. Сейчас мы делаем четыре игры сразу, две из них в активной разработке ― доделываем новые главы «Гэбни», мы рассказываем, что делать, если вы все-таки оказались в СИЗО. Делаем игру, посвященную гендерным вопросам, она будет доступна с сентября.
«Команда 29» ― это правозащитная организация, которая защищает право людей на доступ к информации в судах, а еще пишет памятки о том, как самостоятельно защитить свои права. Например, специально для «7×7» «Команда 29» разработала серию памяток для журналистов: как защитить себя, свои источники, свои данные. Еще они рассказали, какие мессенджеры стоит использовать журналистам для безопасного общения и о том, как хранить данные, чтобы их не украли, ―, а даже если украдут, не смогли прочитать, просмотреть или прослушать.
В Кирове 22 и 23 июня в Поселке программистов прошел баркемп — интеллектуальный лагерь под открытым небом, где участники обсуждают важные темы и обмениваются опытом. Тема 2019 года — «В эпоху [не]доверия», участники обсуждали доверие к власти, медиа, в обществе, фондам, инвестициям. В 2016 году здесь обсуждали инициативное бюджетирование, в 2017-м — право на информацию и открытость органов власти, а в 2018 году говорили о том, как информационные технологии влияют на гражданское общество.