Рюмочная ИПП
Открыть в Telegram
Неофициальная рюмочная Института проблем правоприменения при Европейском университете в Санкт-Петербурге. Больше о нас: http://enforce.spb.ru
Больше2 810
Подписчики
+124 часа
-27 дней
+430 день
Архив постов
2 810
Наша Российская база бухгалтерской отчетности (РББО) победила в номинации «Данные в естественно-научных и гуманитарных исследованиях» универитетской премии Гравитация. РББО — это первый открытый набор данных с более чем 58 млн наблюдений по нефинансовым фирмам за 2011–2024 годы. Мы уже писали здесь о нем, не станем повторяться.
Лучше предупредим популярный вопрос: большинство фирм закончили передавать в ФНС отчетности за 2025 год (срок подачи — до конца марта, но какая-то часть, в том числе исправления, каждый год передается в апреле-мае) — прямо сейчас мы работаем над их обработкой и скоро выпустим обновление.
Скачать РББО можно на Hugginface, Zenodo и в каталоге проекта Если быть точным.
2 810
Дорогого доктора Алексея Кнорре произвели в редакторы The Journal of Quantitative Criminology — поздравляем с ответственным назначением!
2 810
Ссылка на сегодняшнюю трансляцию, начало в 12:15: https://us06web.zoom.us/j/84820021230?pwd=QtnCawlomrWByJcSR09ARffMYvm2DV.1
2 810
Начинаем через полчаса, ссылка на конференцию в зуме: https://us06web.zoom.us/j/89248945264?pwd=snR67NSIUEFb99KmVXf2v6NUElnuso.1
2 810
Когда The Onion еще был смешным, у них была прекрасная шутка про то, что «Парамаунт» собирается снять полнометражный фильм по трейлеру «Железного человека» и что фанаты трейлера беспокоятся, не испортит ли кинокомпания идеальную 90-секундную историю.
Сеогодня мы испытываем похожие чувства: программа нашей секции на конференции CSS выглядит так хорошо (особенно гордимся полными ФИО), что, может быть, надо было ограничиться ее публикацией. Но деваться уже некуда, первые доклады прозвучат уже через несколько часов — приходите разделить с нами этот опыт (регистрация тут, онлайн тоже можно).
2 810
Зачем в законодательстве Российской Федерации словосочетание «Российская Федерация» упоминается 5 миллионов раз
В журнале «Закон», очередной номер которого посвящен качеству законопроектной работы, вышла статья нашего научного сотрудника Дениса Савельева о повторах в текстах российского законодательстве. Эта работа не содержит сложных методик лингвистического исследования, как это было в других статьях ИПП о читаемости. Напротив, она построена таким образом, чтобы максимально просто продемонстрировать: повторы делают юридические тексты нечитаемыми.
Словосочетание «Российская Федерация» повторяется в законах чаще, чем какое-либо другое, — что, с одной стороны, ожидаемо, а с другой, очень странно для непосвященного в тонкости юридического языка: ясно ведь, что в законодательстве России речь идет о России. Автор приходит к выводу, что причины нечитаемости — в отношении к юридическому тексту как к своего рода технической формуле, в которой все переменные должны упоминаться в неизменном виде. Стремление добиться юридической точности формулировок и не допустить потенциально неправильное толкование и применение приводит к избыточным упоминаниям различных субъектов права и других устойчивых выражений, которые в противном случае просто имелись бы в виду.
2 810
Наша секция на Конференции по вычислительным социальным наукам в ЕУ
14–16 мая в Европейском пройдет Конференция по вычислительным социальным наукам. Мы организовали двухдневную секцию, посвященную вычислительным методам в изучении права, — приходите или подключайтесь к трансляции. Для обоих форматов участия необходима регистрация. Вот что будет:
14 мая, четверг
14:15 — 16:40, ауд. 429
▪️Влияние ИИ на российский LegalTech: индивидуальный и индустриальный уровень, Якуненко Екатерина Сергеевна, Яндекс, автор телеграм-канала Делай RAG
▪️ИИ-агент для задач правовой экспертизы и регуляторной политики, Рахмеева Ирина Игоревна, УрГЭУ
▪️Суды окружного уровня влияют на размещение юридических фирм, Сёмин Павел Олегович, ПГНИУ
▪️Правонарушения акционеров и директоров как беловоротничковое преступление, Леденев Виктор Владимирович, ЕУ СПб
15 мая, пятница
12:15 — 17:45, ауд. 429
▪️Платформа Телеграм в современных социальных исследованиях: база данных и примеры применения, Седашов Евгений Александрович, НИУ ВШЭ
▪️Когда диплом не спасает: нелинейные эффекты образования в российском правосудии (на примере ст. 264 УК РФ), Жучкова Светлана Васильевна, Янкевич Семён Васильевич, НИУ ВШЭ
▪️Профессиональный бэкграунд судей как экстралегальный фактор вынесения судебных решений, Капустина Лика Владимировна, НИУ ВШЭ
▪️Влияние антимонопольного правоприменения на вход новых компаний в России, Зварич Андрей Александрович, Ставнийчук Анна Юрьевна, Маркова Ольга Анатольевна, МГУ им. М.В. Ломоносова
▪️Цена преступности, Скугаревский Дмитрий Анатольевич, ЕУ СПб
Программа конференции обширная, там еще много чего интересного: шесть других секций, мастер-классы, открытые лекции, — полный список вот здесь.
2 810
Сделали мрачную визитку для нашего опроса жертв преступлений. С основными графиками, выводами и ссылками. Теперь у данных есть свой дом, который вы всегда нагуглите, если захотите использовать их в своих исследованиях. А нам бы, честно говоря, этого очень хотелось: данные уникальные, потенциал огромный, не говоря уже о том, сколько труда в это вложено. Мы и сами много чего напишем (в работе сейчас сразу несколько статей), но данные заслуживают более широкой жизни. Так что подключайтесь, коллеги! Для вдохновения — ответы на некоторые вопросы, полученные на данных предыдущих волн:
▪️Когда люди обращаются в полицию?
▪️Насколько достоверна официальная статистика о телефонных мошенничествах?
▪️Во сколько российскому обществу обходится преступность?
▪️Как опыт виктимизации влияет на самоощущение безопасности жертвы?
2 810
▪️ Чаще всего люди становятся жертвами киберпреступлений — примерно 2,8% жителей страны в течение года понесли ущерб в результате действий кибермошенников. В 2018 году таких случаев было в два раза меньше.
▪️Онлайн-мошенничества вытесняют «классические» (лицом к лицу): по данным 2018 года, с последними столкнулись 11 человек из тысячи, по новым данным — лишь 2.
▪️Это не значит, что вся преступность уходит в онлайн. Так, на периоде 2018–2024 в два раза участились нападения (им подверглись 1,2% россиян).
Анкета RCVS содержит вопросы о характере преступления, ущербе, близости знакомства с преступником, поведении после инцидента, а также о социодемографическом статусе респондента. Вопросы про соцдем задаются и тем, кто не имел опыта виктимизации, что позволяет сравнивать жертв и не-жертв. Подробное описание опроса вы найдете в препринте. Познакомиться с данными можно на странице опроса. Скачать — в каталогах Harvard Dataverse и Если быть точным. Код для репликации — на гитхабе.
2 810
Результаты третьей волны опроса жертв преступлений
Мы опубликовали данные третьей волны опроса жертв преступлений (RCVS), которая прошла осенью 2024 года. Вот некоторые оценки по результатам исследования:
▪️В течение 12 месяцев, предшествовавших опросу, каждый восьмой россиянин стал жертвой преступления (на горизонте пяти лет — каждый пятый). Это на 45% больше, чем в опросе 2018 года.
▪️Только 39% пострадавших обратились в полицию.
▪️Если считать только случаи с ущербом, уровень виктимизации составит 6% (значимой динамики по сравнению с 2018-м нет). Доля обратившихся к правоохранителям получится выше — 55%.
▪️ Лишь 44% заявлений о преступлениях с ущербом привели к возбуждению административных или уголовных дел.
▪️10% постадавших не рассказали о происшествии никому — ни полиции, ни даже близким.
▪️Уровень повторной виктимизации составил 7,6%. (Да, теперь исследование лонгитюдное: в 2024-м мы впервые опросили участников предыдущей волны.)
Продолжение ниже
2 810
Repost from Если быть точным
⚪️⚪️⚪️Судебный департамент удалил статистику начиная с 2005 года. Мы восстановили архив и опубликовали его в нашем каталоге
На этой неделе Судебный департамент при Верховном суде не опубликовал данные о судимости в России за 2025 год, хотя должен был это сделать по регламенту. В среду с сайта департамента исчезли все отчеты с 2005 года. На этих данных мы уже писали об оправдательных приговорах в российских судах и о делах, приостановленных из-за возможного ухода обвиняемых на фронт.
Через интернет-архив мы скачали данные и опубликовали в нашем каталоге. Там доступны показатели с 2005 года по 1 полугодие 2025-го:
🔸О работе федеральных судов общей юрисдикции и мировых судей
🔸О работе федеральных арбитражных судов с 2014 года
🔸Общая статистика о судимости
Чтобы быстрее узнавать о других важных наборах данных — вступайте в наш чат по данным @tochnochat.
◾️ Чтобы у нас получилось собирать больше датасетов — поддержите нас. Это можно сделать через Boosty или Patreon.
2 810
Repost from Tatyana Cherkashina
Неожиданно попали на торт. Потому что полгода назад также неожиданно попали в юбилейный номер "Экономической социологии".
Мы странные авторы: вместо двух-трёх небольших статей имеем привычку писать одну большую, и "Экономическая социология", возможно, единственный российский социологический журнал, толерантный к большим текстам. Что очень радует!
Хотя тортам предшествовал круглый стол об авторстве в эпоху искусственного интеллекта, академическим журналам в такое время хочется пожелать любопытных, заинтересованных, естественных читателей.
2 810
2 810
Наш открытый корпус текстов российского законодательства RusLawOD получил премию «Открытый доступ к данным в гуманитарных науках» в номинации «Иные гуманитарные науки». Благодарим жюри и организаторов премии — АНО «Информационная культура». И в то же время отмечаем закономерность награды!
Как могла бы награда обойти корпус, который содержит более 300 тысяч документов — с начала современной российской государственности по 2025 год? который помимо текстов, собранных из официального источника, включает их морфосинтаксическую разметку? который подробно описан в препринте и опубликован в репозиториях на github и huggingface? Никак не могла.
Когда мы создавали RusLawOD, нас интересовали в первую очередь качество и читаемость российского законодательства (об этом у нас есть статья). В последнее время мы видим интерес к этим данным со стороны разработчиков экспертных систем на базе больших языковых моделей. Надеемся, что благодаря премии о корпусе узнают и другие исследователи, которым он может быть полезен.
2 810
Закон Бенфорда и судебные данные в предсказании банкротств
Большинство моделей предсказания банкротства опираются на данные бухгалетрских отчетностей, а значит, стоят на допущении о том, что эти отчетности адекватно отражают состояние компании. При этом хорошо известно, что компании могут искажать информацию в отчетности и что одним из стимулов к этому может быть как раз желание скрыть ухудшающееся положение дел. Это значит, что для более точного предсказания были бы полезны дополнительные источники информации. Наши коллеги Дмитрий Скугаревский и Сергей Бондарьков предложили два таких источника: первый — участие компании в судебных разибрательствах — косвенно говорит о положении дел; второй — соответствие чисел в отчетностях закону Бенфорда — теоретически должен схватывать манипуляции (Nigrini 2012).
Исследование на данных о 2 млн российских компаний в 2012–2018 годах показало, что дополнение финансовых переменных судебными действительно сильно повышает качество прогноза. Если, в целях демонстрации, представить, что все российские кредиторы пользуются одной и той же моделью, основанной только на финансовых показателях, то переход на модель, включающую и судебные переменные, увеличил бы их ожидаемую максимальную прибыль в 2018 году на $859 млн.
Показатели сооветствия отчетностей закону Бенфорда против ожиданий оказались практически бесполезными для обнаружения будущих банкротов. Это может быть связано как с общим низким качеством отчетностей и большим числом пропусков в них, так и с тем, что компании в бедственном положении может быть проще вовсе не подавать отчетность в ФНС, чем прибегать к каким-то ухищрениям: штрафы за просрочку подачи документов совсем небольшие. Как бы то ни было, авторы полагают, что неуспех Бенфорда связан с локальной спецификой и что идею стоит опробовать в других юрисдикциях.
Препринт статьи «Non-Accounting Data Improves Bankruptcy Predictions: Evidence from Benford's Law and Litigation» опубликован на SSRN.
***
И для любопытных: страница проекта, авторы которого проверяют, работает ли закон Бенфорда, на самых разных данных: от ВВП стран и населения городов до популярных пасскодов для айфонов.
2 810
Аспиранты, кандидаты (и устремленные магистранты), обратите внимание: 8–16 августа в Астане пройдет школа-конференция, посвященная новым методам в вычислительных социальных науках (CSS). Школа международная (рабочий язык английский), среди спикеров — редактор прошлогоднего хэндбука по CSS Taha Yasseri и пионер дисциплины в России Иван Смирнов. Помимо методического интенсива будет часть, в которой участники школы будут представлять проекты, над которыми работают.
Заявленные курсы:
- Natural Language Processing (NLP) and Artificial Intelligence in Social Sciences - Social Network Analysis (SNA) and Artificial Intelligence in Social Sciences - Experimental Methods and Artificial Intelligence in Social Sciences - Workshop: The Role of Artificial Intelligence in Misinformation — Current Trends, Detection, and MitigationИнформацию о том, как подать заявку, обещают опубликовать скоро. Пока известен только дедлайн для подачи — 31 мая.
2 810
Как криминологи пишут сценарии преступлений
Продолжаем серию постов про изучение киберпреступности. В прошлый раз мы рассказывали о цифровой этнографии киберпреступности, сегодня обратимся к инструменту ситуационной криминологии — анализу сценариев, или «скриптов», преступлений (Crime Script Analysis).
Рассматривать преступления как последовательность действий — сцен или актов — еще в 1990-е годы предложил криминолог Дерек Корниш. Взяв за основу идеи из когнитивных наук («когнитивные скрипты» по Schank, Abelson 1977), Корниш применяет понятие сценария к анализу совершения преступления и показывает, что любое преступление можно представить как описание определенного поведенческого процесса.
Как и в спектакле, в сценарии преступления есть:
• участники (которым отведены роли);
• реквизит (инструменты, софт, документы и пр.);
• и сцена (обстоятельства времени и места).
Корниш разработал процедурную структуру, которая детально фиксирует последовательность действий, предпринятых до (подготовка), во время (само исполнение) и после (сокрытие следов и уход) совершения преступления. Получившаяся схема «актов» должна помочь исследователю выявить возможные точки, вмешательство в которых могло бы предотвратить преступление. Такой подход также помогает понять, какими навыками и ресурсами должны обладать преступники, чтобы успешно провернуть дело.
Другой криминолог Пол Экблом (2012) развил идею Корниша, обратив внимание на то, что не только у преступников, но и у «обычных пользователей» есть свои сценарии действий, направленные, среди прочего, на безопасность: например, «убрать кошелек во внутренний карман рюкзака» или «не переходить по ссылкам в подозрительных письмах». Сценарии злоумышленника и его цели развиваются параллельно, входят в конфликт и конкурируют — такое взаимодействие, определяющее исход ситуации, Экблом назвал столкновением сценариев («script clashes»). Такой анализ может быть полезен, например, в проектировании среды: задача дизайнера или архитектора — сделать так, чтобы окружающая среда помогала сценарию защитника и мешала сценарию преступника (Экблом и Гилл, 2016).
Скрипт-подход взяли на вооружение и для изучения преступлений в цифровой среде (см. обзор Dehghanniri и Borrion, 2019 или Leclerc, Morgenthaler, 2023). Спектр применения инструмента широк, как и сама киберпреступность: ученые реконструируют сценарии мошенничества с банковскими счетами, фишинга, атак на цифровую инфраструктуру компаний, троллинга в интернете и мошенничества в дейтинг-приложениях — и так далее. Для этого исследователи используют данные интервью с преступниками и полицейскими, сообщения и рекламные объявления на специализированных форумах, протоколы судебных заседаний и материалы дел.
Все это не самые доступные источники данных, но главным ограничением подхода является не сложность доступа, а стремительная адаптивность злоумышленников — как к превентивным мерам, так и к меняющейся инфраструктуре. Проще говоря, сценарии постоянно изменяются.
2 810
При этом более активный подход к исследованию связан и с большим количеством рисков. Исследователь может быть подвергнут доксингу, онлайн-харрасменту, кибер-буллингу. Лиза Сигиура, изучавшая сообщества инцелов-женоненавистников, рассказывала, что её подготовка к цифровому полю состояла во многом в зачистке своих соцсетей от персональных данных, провокационных постов и резких феминистских высказываний (хотя при этом более спокойные она решила всё-таки оставить, чтобы совсем не «стирать» собственную личность). Кроме того, информанты могут посягнуть и на кибер-безопасность исследователя. Томас Хольт описывает, как один его респондент из числа интернет-пиратов, остался недоволен вопросами интервью и попытался прислать исследователям файл с вредоносным ПО.
Занимаясь качественными цифровыми исследованиями киберпреступлений, антропологи и социологи вынуждены постоянно искать компромиссы. Во-первых, они выбирают, насколько «включённой» будет их полевая работа, будут ли они «загрязнять» данные своим участием или останутся безмолвными наблюдателями без возможности задавать вопросы своим информантам. Во-вторых, если все же будет выбран «включённый» метод, исследователям придётся решить, насколько открыты они будут к информантам. Какое количество информации о себе они могут им рассказать для установления взаимного доверия, на какие риски в связи с этим они готовы пойти.
2 810
Только лишь луркингом качественные исследования киберпреступности не ограничиваются. Существует также большой пласт «участвующих» методов. Некоторые исследователи могут брать целые интервью по почте или в комментариях. Другие полноценно «включаются» в исследуемое сообщество, поддерживая обсуждения и самостоятельно производя цифровой контент. Так, Николас Гиббс проводил своё исследование продавцов нелегальных анаболических препаратов и их клиентов-спортсменов. Для этого он начал активно вести свою страничку в небезызвестной соцсети, общался там с информантами, ставил им лайки и постил фотографии своих спортивных достижений.
2 810
«Луркинг» и другие виды цифровой этнографии киберпреступлений
Не только преступники, но и исследователи-криминологи давно облюбовали цифровую среду как пространство для работы. Может показаться, что интернет это идеальное место для количественных исследований, а проводимые там качественные исследования совсем не могут соответствовать идеалам чикагской школы социологии или принципам включённого наблюдения, которыми гордятся антропологи. Однако это не так. Наука уже знает множество примеров этнографических исследований частично или полностью проведённых «в цифре».
Все методы качественных исследований киберпреступности можно разделить на две группы, различающиеся по степени вовлечённости исследователя.
Первую группу составляют неучаствующие методы исследования. В них исследователь остается невидимым для информантов, не вступает с ними в контакт и не обозначает своё присутствие, изучая контент, который они производят. В сетевом слэнге для такого поведения существует термин «луркинг» — пассивное пребывание в цифровой среде.
Подобный подход, который ещё называют нереактивным (non-reactive), позволяет избежать влияния исследователя на объект изучения и часто является единственно возможным способом получить доступ к данным. Подобным образом изучали эмоциональную инфраструктуру известного англоязычного хакерского форума Dark0de. Исследователи проанализировали 2000 скриншотов переписок участников этого закрытого форма, которые утекли в сеть. Выяснив, как именно хакеры общаются между собой, они пришли к выводу, что их сообщество, как и их способность совершать какое-либо «коллективное действие» без личного знакомства, держится на гордости и стыде. Гордость производится через похвалу особенно умелого участника форума, что символизирует повышение его статуса. Стыд же выступает в качестве инструмента (само)контроля — страх исключения из сообщества или осуждения заставляет участника соблюдать внутренние нормы.
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
