Системный Блокъ

رفتن به کانال در Telegram

«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: sysblok.ru/join

نمایش بیشتر

روسيا57 857 آموزش17 747...

📈 تحلیل کانال تلگرام Системный Блокъ

کانال Системный Блокъ (@sysblok) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 11 358 مشترک است و جایگاه 17 747 را در دسته آموزش و رتبه 57 857 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 11 358 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 12 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -37 و در ۲۴ ساعت گذشته برابر -2 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 19.63% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 7.68% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 2 230 بازدید دریافت می‌کند. در اولین روز معمولاً 872 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 42 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند блокъ, llm, openai, deepseek, лаборатория تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: sysblok.ru/join”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 13 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته آموزش تبدیل کرده‌اند.

11 358

مشترکین

-224 ساعت

-107 روز

-3730 روز

2 230

نمایش های پست

~ 87224 ساعت

~ 1 04148 ساعت

19.63%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

آرشیو پست ها

11 360

Дорогой дневник: обзор книжных трекеров Социальные сети романтизируют чтение, Дуа Липа ведет книжную рассылку, зарубежные СМИ объявили «clever is the new cool». Кажется, в онлайн-пространстве книжная культура переживает ренессанс — и вместе с ней возвращается мода на читательские дневники. Только теперь они цифровые. Мы разобрались, какие сервисы для книголюбов существуют и чем они отличаются друг от друга. LiveLib — самая популярная русскоязычная платформа: соцсеть с рецензиями, подборками, книжными челленджами и рекомендательным механизмом. Можно ставить себе цель на год — например, прочитать 50 книг — и отслеживать прогресс. Из минусов — устаревший интерфейс и невозможность экспортировать свои списки. BookMix похож на LiveLib, но предлагает два формата записей: короткий отзыв и полноценную рецензию. Есть аналоги книжных клубов — группы по интересам, где можно обсуждать прочитанное. Приложения нет. Книгогид отличается от предыдущих сервисов книжным шазамом: можно ввести запомнившуюся цитату или имя героя — и сервис попробует найти книгу. Правда, эта функция не всегда работает идеально. Еще здесь можно посмотреть, какие книги входят в списки обязательного чтения в разных странах. Bookmory — ближе всего к формату личного дневника: встроенный таймер считает количество страниц за промежуток времени, можно сохранять цитаты, ставить цели и писать заметки. Но рецензий и чужих отзывов здесь нет — только ваше личное пространство. Есть бесплатная версия и премиум-функции. Fable — бесплатное приложение с самой подробной системой оценивания: можно поставить не просто звезды, но и отметить эмоции от книги. Есть книжные клубы и неожиданный бонус — список просмотренных фильмов. Из минусов: только английский язык и нельзя добавить книгу самостоятельно. Но у всех трекеров есть обратная сторона: когда чтение превращается в гонку за метриками, оно рискует стать обременительной обязанностью, а не удовольствием. Более детальный разбор трекеров — в полной версии материала 📖 Время чтения: 9 минут 🤖 «Системный Блокъ» @sysblok

11 360

Феномика, ГМО и роботы: как проектируют завтрашний урожай Если ваше представление о селекции — это школьные таблицы со скрещиванием гороха, у нас для вас новости. Сегодня новые сорта растений и породы животных проектируются с помощью математических моделей, создаются инструментами редактирования генома и выращиваются под наблюдением дронов с мультиспектральными камерами. В статье мы рассказали, как за два века селекция прошла путь от интуитивного отбора к точному инжинирингу и какие технологии изменили эту науку сильнее всего. А самое главное — собрали в карточках 👇 «Системный Блокъ» @sysblok

11 360

🧬 Компьютерные методы в биологии: точка входа Биоинформатика и цифровые инструменты ― уже давно рабочий инструмент биолога. Они помогают расшифровывать геномы, моделировать белки, анализировать данные о биоразнообразии и даже раскрывать преступления. Как же компьютерные методы решают задачи в самых разных областях биологии? Мы собрали большую «карту» — как точку входа в тему. Вот какие разделы в ней есть. 🏛 Антропология Антропология изучает человека во всем многообразии: от эволюции до культуры и языка. Сегодня в ней применяются методы палеогенетики и биоинформатики. Ученые анализируют ДНК современных людей и древних останков, а специальные алгоритмы сравнивают геномы. Это позволяет восстановить пути миграций, выявить смешение популяций и понять, как менялся человек на протяжении тысячелетий. 🔍 Криминалистика Криминалисты раскрывают преступления по уликам: отпечаткам, следам крови, волосам. Сегодня в этой работе важную играют молекулярная биология и биоинформатика. Они позволяют расшифровывать ДНК даже из очень маленьких, поврежденных или смешанных образцов. Сравнивая генетические профили с базами данных, эксперты устанавливают личность подозреваемого, выявляют родственные связи, связывают преступления и даже восстанавливают внешность преступника. 🏥 Медицина и биомедицинские исследования Современная биомедицина использует секвенирование геномов, анализ экспрессии генов, протеомику, метаболомику и генную инженерию. Эти технологии создают терабайты данных. Алгоритмы выявляют в этих данных скрытые связи: генетические причины болезней, молекулярные маркеры для диагностики. Объединяя геномную информацию с клиническими данными, врачи точнее диагностируют, прогнозируют течение болезни и подбирают персонализированную терапию. 🦠 Эпидемиология Эпидемиология изучает, почему возникают болезни и как они распространяются. Современная наука отвечает на эти вопросы с помощью анализа генетических данных. Расшифровывая геном вируса или бактерии, ученые сравнивают образцы и по небольшим мутациям понимают, связаны ли случаи между собой и откуда началась вспышка. Это помогает проследить цепочки передачи инфекции, заметить новые варианты и оценить их опасность. Компьютерные методы работают везде — от древних миграций до лекарств будущего. Про экологию, агрономию, животноводство и остальные направления биологии читайте в полной версии карты. 🤖 «Системный Блокъ» @sysblok

11 360

Как живут книжные клубы онлайн: от дискуссий в зуме до геймификации 📚💻 Дочитанная книга редко заканчивается вместе с последней страницей. Обычно хочется продолжения — обсудить, поспорить, сверить свои впечатления с чужими. Раньше для этого нужно было попасть на встречу офлайн-клуба. Теперь достаточно открыть Telegram или VK. Цифровые книжные клубы устроены иначе, чем привычные «собрались раз в месяц и поговорили». Обсуждение здесь растягивается во времени: кто-то пишет сразу по ходу чтения, кто-то — через несколько дней, и разговор не обрывается, а постепенно нарастает. В этом смысле чтение становится процессом, а не событием. Исследователи называют это digital social reading — социальное чтение в цифровой среде, где интерпретации не исчезают, а накапливаются и переплетаются. При этом формат может быть очень разным. Где-то все собираются синхронно в зуме и обсуждают книгу «вживую» — почти как раньше, только через экран. Где-то диалог полностью асинхронный: чат, комментарии, голосовые, к которым можно вернуться в любой момент. Есть клубы с подпиской и четкой организацией — с модерацией, приглашенными спикерами и даже геймификацией. А есть некоммерческие сообщества, которые держатся на чистом энтузиазме. При всей разнице форм у клубов есть общее: они возвращают чтению социальное измерение, которого многим не хватает в одиночном «скроллинге текста». Как именно устроены сетевые книжные клубы на примере 55 сообществ в Telegram и VK, какие форматы в них доминируют и какие бывают неожиданные гибриды (от коллективного чтения вслух до «геймифицированных» книжных экосистем) — читайте в полной версии статьи. Подготовлено в соавторстве с DH-центром ИТМО. 🤖 «Системный Блокъ» @sysblok

11 360

Digital Humanities Awards и номинации «Системного Блока» 🏆 Цифровые гуманитарные проекты имеют свой небольшой и полуофициальный «Оскар» — это премия DH Awards, вручаемая с 2012 года. В этот раз в ней восемь номинаций: от большой и, пожалуй, главной Best DH Resource (лучший цифровой гуманитарный ресурс) до Best Use of DH for Fun («самое прикольное» использование цифровых гуманитарных методов). Основная цель премии — популяризировать цифровые методы в гуманитарных науках и показать, насколько разными могут быть проекты в этой сфере, поскольку награды не зависят ни от языка, ни от географии, ни от темы проекта. В прошлом году победителями DH Awards стали наши спецпроекты «Классное чтение» и «Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа». В этом году «Системный Блокъ» снова номинирован. 🎉 Номинации СБъ «Системный Блокъ» участвует с четырьмя материалами в двух номинациях. В номинации DH Short Publication (короткая публикация про DH) выдвинуты статьи Марии Подрядчиковой «Под капотом у языкового корпуса: как нейросети и NLP-библиотеки используются в НКРЯ» и Дмитрия Пронина «Скриптор умер, да здравствует автор! — есть ли место человеческому тексту в эпоху больших языковых моделей?». В номинации DH Training Materials (обучающие материалы по DH) — рубрика о визуализации данных и статья «Как скачать весь Telegram: автоматизация выгрузки каналов с помощью Python» (в эпоху блокировок тема стала только актуальнее!). 👉👈 Просьба Если вам нравятся наши статьи и блоги, пожалуйста, проголосуйте за них до 17 апреля. Победители премии определяются простым голосованием. Спасибо, что читаете и поддерживаете ❤️ 🤖 «Системный Блокъ» @sysblok

11 360

«Один человек сможет построить компанию в миллиард долларов»: интервью с технооптимистом Иваном Ямщиковым Иван Ямщиков известен русскоязычному читателю как автор проекта «Нейронная оборона» — относительно раннего (2016 год) примера успешного со-творчества людей и генеративных нейросетей. Тогда Иван был сотрудником «Яндекса», после занимал должность ИИ-евангелиста компании ABBYY, а сегодня он — профессор, преподаватель и руководитель целого ИИ-института в Баварии (и одновременно ИИ-предприниматель). Сам себя он определяет как «радикальный технооптимист». В интервью «Системному Блоку» Иван Ямщиков рассказал о том, что могут LLM и чего не могут, к чему может привести внедрение ИИ в ближайшие годы, как придется перестраивать образование и что значит быть технооптимистом. Делимся в карточках самыми интересными цитатами из интервью. 🤖 «Системный Блокъ» @sysblok

11 360

Хиты Тейлор Свифт — как мини-романы на 2–3 минуты? Мы привыкли думать, что популярные песни — это слова и эмоции под музыку. Но многие хиты сегодня устроены как мини-фильмы или рассказы с микро-сюжетом. Исследователи научили алгоритм находить в текстах песен (от рок-баллад до треков Тейлор Свифт) героев, события и целые сюжетные арки. И выяснили, что со временем сторителлинга в популярной музыке становится все больше. Собрали для вас карточки о том, как нейросети «читают» песни как истории — листайте 👇🎵 А если хотите узнать про это исследование подробнее — вот полная версия статьи» полной версии статьи. 🤖 «Системный Блокъ» @sysblok

11 360

Женщина для галочки: дата-исследование о принципе Смурфетты в российском кино Помните, как звали смурфиков из известного мультфильма? Ловкач, Благоразумник, Растяпа, Ворчун… У гномов мужского пола имя всегда отсылает к их главному качеству. А единственная представительница женского пола из сотни жителей деревни — просто Смурфетта. Ее имя ничего не значит, а лишь указывает на половую принадлежность. Это буквально «женщина для галочки». Что такое принцип Смурфетты? Принцип Смурфетты — это ситуация, когда среди мужских персонажей фильма есть только одна героиня. Ее образ — это стереотипное представление женщины. Ее роль — быть спутницей для мужчин или объектом их внимания, а не субъектом истории со своими целями, мотивацией, характером. Термин придумала американская эссеистка Ката Поллитт. В 1991 году она написала колонку «Hers; The Smurfette Principle» для New York Times. В поисках кассеты для своей трехлетней дочери она пришла к выводу, что в большинстве случаев главные герои — мальчики, и кино нацелено на них. Женщина выступает фоном. Смурфетты в российском кино Обычно о принципе Смурфетты говорят в контексте голливудского кино. «Системный Блокъ» вместе с экспертами изучил, работает ли принцип Смурфетты в российском кинематографе. Для исследования мы собрали датасет почти из 10 000 русскоязычных фильмов за последние 50 лет. Мы смотрели на первых семерых актеров в списке ролей — именно там обычно оказываются главные персонажи. 📊 Что получилось? — примерно каждый четвертый фильм (25,46%) — это классический кейс «Смурфетты», одна женщина на толпу мужчин — еще 13,73% фильмов вообще обходятся без женщин в основном составе Для сравнения, фильмов без мужчин — всего лишь 3,46%. Фильмов с одним мужчиной — 12%. Дисбаланс очевиден. При этом за полвека ситуация почти не меняется. Ни советское кино, ни 1990-е, ни 2000-е не показывают тренда к улучшению. Причем дело не только в боевиках и вестернах (хотя с ними всё хуже всего). Такой перекос встречается в драмах, комедиях, семейном кино и даже романтических фильмах. Проблема не в жанре, а в самой логике того, кого кино по умолчанию считает «нормой». 🔗 Как в список попали «Смешарики» и почему эксперты спорили из-за фильмов Балабанова — читайте в полной версии исследования. Там же можно найти инфографику и полную статистику. «Системный Блокъ» @sysblok

11 360

Японский интернет выглядит, как будто сейчас 2000-е. И это не баг, а фича Если вы когда-нибудь оказывались в японском интернете, то замечали, что сайты часто выглядят так, будто их сделали двадцать лет назад. Мы решили узнать, почему японцы сохраняют этот стиль. Легаси-система? Нет, легаси-культура! Только в 2024 году завершилась кампания по отказу от дискет в госорганах Японии. А вот факсы там активно используют до сих пор. Японцы считают, что не стоит менять технологию, которая работает понятно, надежно и предсказуемо. То же касается и их сайтов — в нежелании менять их есть не только инертность, но и специфика японской культуры. Для западного пользователя японские сайты (Yahoo!Japan, Rakuten), сделанные в стилистике интернета 2000х, визуально шумны. Но японцы видят эти сайты по-другому — это уже проверено научно. Японец видит мир иначе Исследование японских и американских психологов 2001 года показало, что японские участники экспериментов чаще учитывают контекст и фон при восприятии изображения. Было выявлено, что взрослые японцы, по сравнению с американцами, больше внимания уделяют визуальному контексту и сильнее связывают объекты с фоном, что демонстрирует целостный, а не аналитический подход к восприятию. Такое внимание переносится и в цифровую среду, поэтому на сайтах повторяются инструкции, дублируются шаги, а подтверждения на те или иные действия запрашиваются несколько раз. Дизайн японских сайтов ориентирован не на эстетику, а на стабильность, ответственность и минимизацию риска, что отражает социальные приоритеты. Конечно, сайты меняются, но происходит это постепенно и с сохранением знакомых паттернов. Мы собрали несколько примеров, чтобы вы могли увидеть этот подход в действии. Заглянуть в японский интернет и оценить его необычную эстетику можно в полной версии статьи. «Системный Блокъ» @sysblok

11 360

Как пользоваться NotebookLM от Google Подготовиться к экзамену, изучить новую тему, создать базу знаний… Если вам становится не по себе от этого списка — открывайте гайд «Системного Блока», где мы рассказываем про NotebookLM — ИИ-инструмент, который поможет вам в решении рабочих, учебных и исследовательских задач. Еще один блокнот — или нечто большее? Google описывает NotebookLM как «ИИ-помощник в исследованиях». Как начать им пользоваться? Для каждого нового проекта нужно создать блокнот, в который загружаются статьи, отчеты, заметки, видео. Теперь вы можете задавать вопросы к этим материалам, и все ответы будут генерироваться на их основе. Основное взаимодействие происходит через чат, как и в других ИИ-ассистентах. NotebookLM работает на языковых моделях Google — Gemini Pro и Gemini Pro Flash. В основе лежит RAG-архитектура (Retrieval-Augmented Generation) — технология, которая сначала извлекает релевантные фрагменты из ваших документов, а затем генерирует ответ на их основе. Подробнее о RAG мы рассказывали в глоссарии. Дополнительные функции NotebookLM • генерация подкастов по вашим материалам • создание mind maps (интеллект-карт) • формирование карточек для запоминания • сохранение важных ответов в виде заметок, которые можно объединять Поддерживаемые форматы NotebookLM работает с PDF, Google Docs, презентациями, аудио-, видео- и текстовыми файлами, веб-ссылками (включая транскрипты видео с YouTube). Кому это будет полезно NotebookLM пригодится всем, кто работает с большими объёмами информации: • исследователям и аспирантам для анализа научной литературы • преподавателям для подготовки учебных материалов и курсов • студентам для работы с лекциями и подготовки к экзаменам • журналистам для обработки интервью, документов и справочных материалов • информационным работникам • аналитикам, консультантам, всем, кто ежедневно работает с документами В гайде мы даем пошаговую инструкцию для эффективной работы NotebookLM и разбираем задачу поиска информации в исследовательской литературе. 🤖 «Системный Блокъ» @sysblok

11 360

Селекция: как завтрашний урожай проектируется уже сегодня Если ваше представление о селекции — это школьные таблицы со скрещиванием гороха, то у нас для вас новости. Сегодня селекционеры работают не с конкретными растениями или животными, а с компьютерными моделями и генетическими картами. В новом материале разбираемся, как технологии помогли селекционерам перейти от интуитивного отбора к эре предсказательного моделирования и автоматизированного создания новых сортов и пород. Первые селекционеры История селекции начинается с древности — тогда это было делом интуиции. Древний человек отбирал самого послушного волчонка, самое плодовитое растение или овцу с самой густой шерстью. Это была селекция на глазок: медленная и неточная, методом проб и ошибок. Чтобы увидеть результат, приходилось ждать годы — до нового урожая или следующего поколения животных. В таком виде селекция существовала тысячелетиями, однако такой подход не позволял отбирать сложные признаки, которые невозможно определить «на глаз»: как предсказать, какое растение переживет засуху или у какого животного будет самое нежное мясо? Научный прорыв Революция в биологии случилась благодаря точным вычислениям. В середине XIX века монах-садовод Грегор Мендель, скрещивая горох, открыл универсальные законы, объясняющие принципы наследования. Он показал, что признаки наследуются не случайно, а по четким правилам, которые можно описать формулами. Согласно Менделю, невидимые наследственные факторы, которые мы называем генами, передаются от родителей потомкам, определяя конкретные черты организма. Стоит заметить, что понятие гена как элементарной единицы наследственности было введено в науку значительно позже открытий Менделя. Это сделал в начале XX века Вильгельм Йоханнсен, предложивший три фундаментальных термина: «ген», «генотип» (совокупность всех генов организма) и «фенотип» (совокупность всех его наблюдаемых признаков). В XX веке абстрактный ген превратился в реальный объект для изучения. Ученые доказали, что гены расположены в хромосомах (Томас Морган), выяснили, что носителем наследственной информации является ДНК (Освальд Эвери), а затем расшифровали ее двойную спиральную структуру (Джеймс Уотсон и Фрэнсис Крик). Чтение генетической инструкции Следующий прорыв произошел на рубеже XX–XXI веков благодаря геномной революции — переходу от изучения отдельных генов к анализу полных геномов. Ее основой стало секвенирование — технология прочтения последовательности нуклеотидов (A, T, G, C) в ДНК. Но как быть, если признак контролируется не одним геном или несколькими генами, а сотнями тысяч одновременно? В этом селекционерам помогает геномная селекция (Genomic Selection, GS). Ее ключевая идея в том, что влияние на сложный признак (вроде урожайности) распределено по всему геному. Поэтому вместо поиска отдельных генов метод одновременно анализирует множество молекулярных маркеров, равномерно покрывающих все хромосомы. Этот метод, впервые предложенный в 2001 году, активно используется до сих пор и постоянно совершенствуется с развитием алгоритмов искусственного интеллекта. Современная селекция завершила переход от интуиции к точному инжинирингу. Теперь новые сорта и породы проектируются цифровыми методами (геномная селекция), создаются инструментами генного редактирования (CRISPR) и выращиваются с помощью роботизированных систем. Завтрашний урожай рождается сегодня на стыке биологии, информатики и робототехники. В полной версии статьи предлагаем разобраться в механизмах селекции, узнать о новейших методах в этой области и наконец понять, почему отправной точкой для научных открытий стал именно горох.

11 360

Пьющих просьба не беспокоить: особый язык объявлений о сдаче квартир На сайтах с недвижимостью на страницах объявлений обычно есть раздел, где владельцы в свободной форме описывают жилье и указывают требования к арендаторам: от конкретных («без животных») до абстрактных («только адекватным»). Мы обработали 15 тыс. объявлений с помощью LLM, чтобы выяснить, какие условия встречаются чаще всего, а какие способны удивить. Что анализировали? Мы нашли открытый датасет Avito Demand Prediction Challenge с Kaggle и отобрали 14 557 объявлений по фильтрам: «Квартиры, Сдам, На длительный срок». Главное — там была колонка description с нужным текстом. Что получили? Мы задали модели промпт с инструкцией извлечь данные по пунктам: национальность, качества характера, состав жильцов, можно ли с детьми или с животными. Проверив результаты вручную, мы убедились, что модель хорошо показала себя по первым двум пунктам, по остальным — средние результаты. Ожидаемо, про национальность/гражданство/происхождение жильцов чаще всего писали, что ищут русских (450 упоминаний), славян (241), граждан РФ (51) или российских (14) граждан, местных (5), с пропиской (13), русскоязычных (2) или даже православных (2). Типичны запреты для «кавказцев и азиатов». Изредка встречаются объявления «для любых» (7) или «нерусских» (5). Модель выделила массу распространенных требований: • Объективные: чистоплотность (120), отсутствие вредных привычек (88), аккуратность (74), не курить (22). • Абстрактные: порядочность (754), добросовестность (16) и многие другие. • Были и совсем смешные формулировки. Например, модель выделила дословно фразу “пьющих просьба не беспокоить…”, будто жильцы не должны беспокоить каких-то других пьющих. По другим основным параметрам можно заметить, что мужчинам-одиночкам, людям с маленькими детьми и животными сложнее снять квартиру, чем семейным парам и женщинам без детей и животных. О том, влияет ли на ваши шансы штамп в паспорте и можно ли с животными, если их “немного”, читайте в полной статье. 🤖 «Системный Блокъ» @sysblok

11 360

Цифровой алкотестер: как нейросеть вычисляет опьянение по голосу Пара фраз — и машина поймет: за руль нельзя. Ученые уже учат нейросети отличать пьяную речь по нескольким фразам. Звучит как фантастика? Уже нет. Разбираемся, как это работает и при чем тут немецкие скороговорки. 🍾 Как речь выдает опьянение Машины, которые определяют опьянение и блокируют запуск, — это уже не фантастика, а сегодняшний день. С 2019 года в Евросоюзе все новые автомобили выпускаются с расчетом на установку «алкозамка». Что, если машина сможет определять опьянение без всякой трубки, просто слушая голос? Алкоголь неизбежно меняет речь, ведь говорение — это сложнейшая работа сотни мышц, синхронизированных мозгом. Голос меняется — это заметно даже на слух, а уж алгоритмы диагностики давно это умеют. Осталось перенести эту технологию в автомобиль. 🍾 Корпус пьяной речи Еще в 2011 году на научном конкурсе Interspeech 2011: Speaker State Challenge исследователи задумались об алгоритме, который был бы способен претворить эту идею в жизнь, и создали датасет Alcohol Language Corpus (ALC). Ученые зафиксировали, что у выпивших (особенно женщин) часто повышалась тональность голоса. Но обобщить другие акустические особенности тогда не удалось. Позже итальянские ученые продолжили исследования, применив нейросети. Они использовали тот же датасет ALC, сосредоточившись на скороговорках, которые оказались особенно чувствительны к алкоголю. Затем они перешли к созданию модели, способной игнорировать уникальность каждого голоса. 🍾 Как устроен нейросетевой алкотестер DANN — это архитектура нейросети, которая учится выделять инвариантные признаки, то есть такие, которые не зависят от особенностей данных. Например, такая модель будет игнорировать разные стили речи и индивидуальные черты говорящих — вместо этого она сосредоточится именно на том, чтобы выявить факт употребления алкоголя. • Один блок извлекает из входных аудиозаписей общие признаки опьянения (тон, ритм). • Второй блок классифицирует речь как трезвую или нетрезвую. • Третий блок (контролер) пытается угадать личность говорящего. Если это удается, первый блок «штрафуется», чтобы алгоритм отфильтровывал индивидуальные особенности и фокусировался только на изменениях от алкоголя. Модель обучили на 75% данных ALC и протестировали на оставшихся записях. Она показала точность почти 71% на новых голосах, став важным шагом к созданию универсального голосового алкотестера. О том, как формировался корпус пьяной речи и других деталях исследований, читайте в полной статье. 🤖 «Системный Блокъ» @sysblok

11 360

От формулы к черному ящику: мы перестали понимать мир? Используя в вычислениях ту или иную формулу, мы часто не понимаем ее смысла. Да и зачем, если все формулы уже выведены и готовы к использованию? С развитием нейросетей мы шагнули еще дальше от понимания вычислительного процесса, променяв осмысление на эффективность и скорость. Нейросети выдают пользователю результат, основываясь на закономерностях, которые мы даже не можем сформулировать. «Это прогресс или капитуляция перед сложностью мира?» — об этом рассуждает в своем блоге Дмитрий Пронин. «Как?» и «почему?» На протяжении истории человечеству часто приходилось отказываться от привычного понимания мира и двигаться в сторону всё более сложных абстракций. Так, в античности придумали иррациональные числа для описания длины квадрата и идею нуля как мысленного эквивалента «ничего», а для торговли понадобились отрицательные числа. Эти абстракции были сложны для восприятия, но они предлагали объяснение тому, что раньше было непонятным. «Как?» без «почему?» В дальнейшем получили развитие численные методы. Когда точной формулы нет, можно найти приблизительный ответ через серию вычислений и перебор вариантов. Численные методы уже не помогали объяснить устройство мира, но зато позволяли обрабатывать все большие объемы информации. Появление компьютеров сделало их применение намного эффективнее: машины быстро выполняют вычисления, которые хорошо поддаются алгоритмизации. Правильные ответы без «как?» и «почему?» Следующим шагом стали статистические методы и выросшее из них машинное обучение. Они позволили нам предсказывать закономерности, которые проявляются на больших массивах наблюдений. Эти методы эффективно работают с такими материалами, как изображения и естественный язык. Но понимания стало еще меньше: теперь мы не понимаем не только почему система ведет себя так или иначе, как это было при использовании численных решений без аналитической формулы, но и на какой закономерности строится решение. 🙈 Мы совсем перестали понимать мир? Численные и вероятностные подходы — это не замена теории и не отказ от научной строгости. Скорее, они закрывают практические потребности там, где создать стройную теорию (пока) не получилось, но есть много данных для выведения закономерностей Например, анализ текстов или картинок. Подробнее о том, как наука работает с такими задачами, читайте в блоге Дмитрия Пронина. 🤖 «Системный Блокъ» @sysblok

11 360

Конфликт Пентагона и Anthropic, протест против OpenAI, увольнение главы разработки Qwen Рассказываем, что произошло в мире ИИ за последнее время. Пентагон против Anthropic Ранее мы писали о конфликте Министерства обороны США с компанией Anthropic. Камнем преткновения стали два вопроса: применение ИИ для массовой слежки за гражданами США и автономное управление оружием. 26 февраля Anthropic заявила о готовности к сотрудничеству с государством в оборонной сфере, однако обозначила жесткие ограничения: массовая слежка за американскими гражданами неприемлема (при этом слежка за иностранными гражданами допустима), а текущие ИИ-системы еще недостаточно надежны для автономного управления оружием. Пентагон предложил формальный компромисс без изменений по сути, однако Anthropic на него не согласилась. На следующий день президент Трамп поручил федеральным ведомствам прекратить использование продуктов Anthropic. Вслед за этим глава Пентагона Хегсет инициировал процедуру признания Anthropic «ненадежным поставщиком», фактически отрезав компанию от сотрудничества с любой организацией, связанной с Министерством обороны. В тот же день о партнерстве с Пентагоном объявила OpenAI. По словам ее гендиректора Сэма Альтмана, договор включал ровно те ограничения, которых добивалась Anthropic. Однако сторонние юристы указали, что соглашение допускает использование ИИ фактически в «любых законных целях», а что считать законным — во многом определяет сам Пентагон. Расхождение между публичными заявлениями Альтмана и реальным содержанием договора вызвало волну отмены подписок на ChatGPT и переход пользователей на Claude, который на некоторое время поднялся до второго места в американском App Store. 4 марта в сеть утекло внутреннее сообщение гендиректора Anthropic Дарио Амодеи сотрудникам компании. В нем он назвал публичные заявления OpenAI «откровенной ложью», но на следующий день Амодеи принес публичные извинения, заявив, что компания не причастна к утечке, а само письмо было написано после срыва переговоров с Пентагоном — в состоянии аффекта. По его словам, текст не отражает его взвешенной позиции по текущему положению дел.

Почему это важно? Исход конфликта — первый публичный ответ на вопрос, который раньше обсуждался лишь в академических кругах: что происходит, когда принципы ответственной разработки ИИ сталкиваются с государственной властью? Отныне любое разногласие с Пентагоном грозит не просто потерей контракта, а попыткой уничтожить компанию.

Глава команды Qwen покинул Alibaba Линь Цзюньян, технический руководитель команды Qwen с 2023 года, разрабатывающей одну из самых популярных открытых LLM, объявил об уходе. Вместе с ним ушли руководитель направления дообучения Юй Бовэнь и еще несколько участников команды. Qwen — семейство языковых и мультимодальных моделей холдинга Alibaba (владелец AliExpress, Taobao и других крупных маркетплейсов), одно из самых популярных в мире с открытыми весами. Модели Qwen используются как в американских, так и в российских компаниях, например, в Яндексе и Т-Банке. Официальные причины ухода главы компании не названы, однако несколько источников указывают на реструктуризацию: из автономного стартапа Qwen превратился в подразделение под прямым управлением Tongyi Lab. Реакция сообщества оказалась бурной, коллеги называли уход «концом эпохи». Акции Alibaba в Гонконге упали на 5,3%.

Почему это важно? Успех Qwen во многом строился на модели «стартапа внутри корпорации»: автономная команда, короткие циклы разработки, быстрый выход в открытый доступ. Корпоративная реорганизация нередко подавляет именно ту культуру, которая и обеспечивала успех проекта. Если реструктуризация приведет к тому, что модели Qwen перестанут выходить в открытый доступ, это существенно замедлит развитие open-source моделей в целом.

🤖 «Системный Блокъ» @sysblok

11 360

Как нас обманывают двойные оси Вы когда-нибудь видели график, на котором слева — ось выручки в миллионах рублей, а справа — количества клиентов? Или, например, температура в градусах и осадки в миллиметрах? Это график с двойными осями Y — он позволяет сравнивать два показателя, но часто приводит нас к неверным выводам. В новом материале рассказываем о проблемах, которые возникают при использовании двойных осей и о том, как их избежать. Так, графики с двойными осями могут использоваться, чтобы создать у читателя иллюзию корреляции — взаимосвязи между показателями. Например, график на нашей карточке иллюстрирует корреляцию между популярностью имени Stevie и и стоимостью акций Amazon. Человеческое сознание автоматически сравнивает формы линий. Мы видим на графике «одинаковый рост», отмечаем синхронность линий, и нам кажется, что они связаны. Однако на самом деле это просто иллюзия. Независимый масштаб двух осей делает сравнение кривых некорректным, нарушаются принципы графического восприятия. Так люди считывают зависимость показателей, которой на самом деле нет. Чтобы узнать об альтернативных способах представления информации, читайте полную версию статьи. 🤖 «Системный Блокъ» @sysblok

11 360

За пределами видимости: как женские имена остаются в тени школьной программы 8 марта — не про букеты и шоколад, а в первую очередь про права женщин. Например, право быть услышанной. В школьной программе по литературе женщинам отведено всего 2% — и мы решили проверить, всегда ли так было. Рассказываем, почему вы не помните писательниц из школы (и дело не в вашей памяти) Как менялась школьная программа? В зависимости от эпохи в школьную программу входили разные женщины-писательницы. Например, женская часть программы 1932 года сегодня вряд ли будет восприниматься как “классика”: там есть комедии императрицы Екатерины II и стихи малоизвестных ныне поэтесс Павловой и Соловьевой. В программах 30 годов находим и первое, хотя и кратковременное, появление Анны Ахматовой, чье имя вернется в школу только спустя полвека. Ближе к середине XX века на первый план выходят незнакомые современному читателю имена и непривычные жанры: на первый план выходят фольклорные исполнительницы Марфа Крюкова и Ирина Федосова, в список также попадает Маргарита Алигер с поэмой «Зоя» о Зое Космодемьянской. В дальнейшем наблюдается настоящий «расцвет» женской литературы в программе, хотя и с четкой идеологической направленностью: в 1970–1980 школьники проходят три повести Марии Прилежаевой о Ленине и стихотворение Веры Инбер, посвященное его смерти. С 1980–1990 годы в списки триумфально возвращается Анна Ахматова и программа значительно меняется. В 1991 году включают больше десятка женщин, хотя в последующие годы стабильно остаются только Ахматова и Цветаева. Затем в 2023 году обязательными авторками становятся еще несколько женщин, среди которых Юнна Мориц, единственная наша современница в школьной программе, со стихотворениями «Большой секрет для маленькой компании» и «Ёжик резиновый». Что мы узнали? Женщин в русской литературе заметно меньше, чем мужчин, но школьная программа усиливает этот разрыв в 2–4 раза, создавая впечатление, будто писательниц почти нет, хотя это не соответствует действительности. В полной статье предполагаем, с чем это может быть связано, а также раскрываем детали исследования. 🤖 «Системный Блокъ» @sysblok

11 360

Как сделать свой DH-проект: от идеи к реализации Проекты в области Digital Humanities могут отличаться друг от друга по форме, содержанию, посылу и множеству других пунктов, но главное, что эти исследования или веб-инструменты решают задачи из сферы гуманитарных наук с использованием цифровых технологий. Так что мы сделали целую страницу (и уже чуть-чуть вам о ней рассказывали!), чтобы стало яснее, как сделать что-то подобное самостоятельно. К какому бы результату вы ни стремились — от графика с таймлайном жизни русских писателей XVIII века до цифровой выставки о наследии Сибири, одно из ключевых решений — визуальное оформление проекта. Мы поговорили о визуальном решении с создателями виртуального музея Sakharov.space:

Что самое важное в визуальном представлении проекта, основанном на данных из гуманитарных наук? Найти центральную метафору, которая станет стержнем проекта. Для Sakharov.space это была лестница как символ пути и восхождения. Второе — трансформировать огромный массив данных в живую историю. Сотни фото, документов, аудио и видео мы уместили в нарратив с разной глубиной погружения — от семи минут через видео до часа в архивах. Можно ли сделать дизайн проекта одновременно эффектным и эффективным? Да! Мы создали 3D-скульптуру Сахарова по архивным фото и оживили ее, как в старом кино. Результат: 1,5 миллиона визитов, среднее время на сайте – 15 минут. Более половины посетителей составила молодежь до 35 лет — ключевой KPI клиента.

Ключевые шаги на других этапах создания DH-проекта мы обсудили с командами цифрового архива «Прожито» @prozhito, корпуса почтовых открыток «Пишу тебе» @pishuteberu и семантического издания Чехова Chekhov.Digital. Переходите к нашему гайду, чтобы прочитать их комментарии. 🤖 «Системный Блокъ» @sysblok

11 360

Английский vs Корейский в K-pop K-pop покоряет мир, и его тексты тоже меняются, подстраиваясь под международную аудиторию. На основе корпуса из 290 песен корейских исполнителей расскажем о новых стратегиях использования английской лексики в песнях и о возникших гендерных различиях в лексике. Вот они слева направо Путь на мировой рынок для K-pop открыло выступление BTS на American Music Awards и победа на Billboard Music Awards в 2017 году. Начиная с этого времени, в песнях K-pop групп стало значительно больше английских слов. Чтобы отследить эту динамику, в ходе исследования тексты группировали по годам. Особое внимание было уделено последнему слову в строке, типично являющимся в корейском сказуемым или определением. Что выяснилось? С 2020 года строки стали значительно чаще заканчиваться на английском. В 2022 году английский в этой позиции впервые обогнал корейский. Особенно тренд усилился в 2023: уже больше половины строк завершались на английском. Boys and girls Корейские музыкальные коллективы, как правило, делятся на мужские и женские; смешанные составы встречаются редко. Корпус включает 161 песню, исполненную женщиной или женской группой, 129 песен, исполненных мужчиной или мужской группой, и одну песню смешанного коллектива. Анализ частотности слов показал, что слово «boy» встречается 105 раз и чаще употребляется в текстах женских коллективов, а «girl» — 102 раза, и преобладает в песнях мужских исполнителей. Согласно графику, слово «love» значительно чаще используется мужскими коллективами (268 употреблений против 93 у женских), в то время как корейское слово «사랑», означающее «любовь» чаще встречается в текстах женских групп. Так, в песнях мужских коллективов заметно более выраженное предпочтение к использованию английских заимствований, в то время как у женских это предпочтение выражено слабее. Полный анализ тенденции к англизации текстов K-pop, включая другие примеры, найдете в полной версии статьи. Время чтения: 7 минут 🤖 «Системный Блокъ» @sysblok

11 360

Как превратить коллекцию гравюр Пушкинского музея в онтологию Как найти «зиму» в коллекции гравюр, если на изображении нет ни снега, ни льда? Традиционные методы вроде поиска по ключевым словам здесь бессильны. В этом случае онтология ICON помогает превратить коллекцию в «умные данные», способные отвечать на сложные искусствоведческие вопросы. Что такое онтологии — и зачем они нужны? Онтология в компьютерных науках — это способ моделирования и представления данных, их описание и формализация. Онтологии используются не только в теоретических исследованиях, как в случае с коллекцией Пушкинского музея. Они также помогают и в таких сферах, как • обработка данных на естественном языке • оптимизация производственных процессов • и даже выявление потенциальных киберугроз Кстати, больше узнать об онтологиях — и о том, как создавать их самостоятельно, — можно из нашего глоссария. Какие вопросы можно задать онтологии гравюр Пушкинского музея? Например, вопрос «На каких изображениях распознается оливковая ветвь?», потому что онтология поможет собрать все произведения с определенным символом. Это очень полезно, потому что исследователь — в отличие от поиска коллекции — не может просмотреть 100 000 гравюр вручную. Кроме того, онтология может выявить скрытые паттерны. Ей можно задать вопрос: «Связан ли выбор мифологических сюжетов с местом обучения художника?» Онтология сопоставит место учебы сотен мастеров с иконографией их работ и выдаст корреляцию, чтобы вы точно знали, кто и где чаще рисовал Венеру, а кто – Вакха. Наконец, «как всё-таки найти зиму без снега и льда»? Онтология связывает аллегорию зимы с такими мотивами, как «меховая шапка», «восседать на облаке», «голая ветвь». Дальше, например, фигура в центре распознается как «Эол» (бог ветров) или «Борей» (бог северных ветров). Благодаря таким мотивам можно понять, что на картине изображена зима, даже если мы не видим ни снега, ни льда. Любое другое визуальное воплощение будет описываться так же, как и зима, то есть как композиция из фигуры и ее атрибутов. О том, как онтология производит распознавание и использует классическую теорию интерпретации Эрвина Панофски, вы узнаете из полной версии материала на сайте. Время чтения: 6 минут 🤖 «Системный Блокъ» @sysblok