Data is data
Открыть в Telegram
Канал о данных, фактах, визуализации. Немного математики, историй с лёгкими оттенками machine и deep learning. Для связи пишите https://t.me/blackskif
Больше3 010
Подписчики
Нет данных24 часа
-37 дней
+330 день
Архив постов
3 010
в пробном дистанционном голосовании власти Москвы продвигают повесточку в стиле "а вы перестали пить коньяк по утрам?". Даже не сомневаюсь, что потом это будет использовано.
3 010
что точно не надо делать в опросах: запугивать респондентов в самом начале. #сбербанк, покайся.
3 010
Математик (PhD btw) и велолюбитель Анна Кайзенхоф из Австрии выиграла олимпийскую велогонку. У неё нет тренера, команды и на сборы она не ездила. Тренировалась сама, еду и воду считала сама, велосипед подбирала и настраивала сама. В начале гонки она сразу рванула вперёд в группе из четырёх человек. Профи из Голландии и США подумали, что они всё равно сожрут любых одиночек, потому что команда априори сильнее и может тащить лидера, сохраняя ему энергию. Короче так и произошло. Однако они неправильно посчитали сколько оторвалось и скольких они нагнали, а радио на олимпиаде нет. Поэтому на финише все очень удивились увидев там Анну. Мораль проста: считайте аккуратней и верьте в себя. https://youtu.be/g4kdk9QAJXg
3 010
в восемь лет закончить школу это само по себе круто. поступить в МГУ тоже здорово (психфак). Однако университет это не только знания, но и футбол на газоне, приводы в милицию, лабы до полуночи и первая любовь. Этого в девять лет не постичь. https://ria.ru/20210727/ekzameny-1743105352.html
3 010
Using latent space regression to analyze and leverage compositionality in GANs
Новый подход в Attribute Editing: используя разные части из набора изображений, сгенерировать объект, который будет их общей композицией. Можно генерировать лица, машины, здания и др.
Tech details: авторы предлагают использовать метод регрессии (в виду feedforward networks) для преобразования фич изображения в латентное пространство претренированного GAN. Отличие от похожих методов инверсии в том, что обычно используют подход итеративной оптимизации (Image Processing Using Multi-Code GAN Prior, Analyzing and Improving the Image Quality of StyleGAN), а регрессия показывает большую точность.
#papers
3 010
AI всё больше и больше про развлечения, и всё дальше и дальше от SkyNet. Взято с канала https://t.me/eiaioi
3 010
у Visual Studio интересный патч-ноут в последнем релизе. void *memset(void *str, int c, size_t n) используют, чтобы память очищать в C/C++. У Microsoft он неправильно работал в предпоследней версии.
3 010
Ан-2 взлетает с места на гибридной силовой установке. Понятно, что пустой, но тем не менее.
https://youtu.be/sI32NIvjvic
3 010
в Питере реставраторы поленились, а я узнал что твёрдый знак и буква ять это не одно и тоже.
3 010
интересная попытка Intel сделать ускоритель для NN. не для трейна понятно, но всё же. такую штуку можно и в сервак воткнуть. есть конвертер моделей с Keras
3 010
тесты роскосмоса показали, что модуль Наука управляем. Его будут стыковать вместо одного из Пирс-ов, поэтому один придётся завтра утопить в океане. Что намечено в расписании МКС на завтра (перенесено с сегодня). Дополнительно саму МКС развернут в пространстве стыковочным узлом навстречу Науке.
3 010
модуль Наука наконец добрался до орбиты. Это один из самых больших блоков МКС будет. Пожелаем ему удачной стыковки.
3 010
Попросили прокомментировать вот эту статью про 29 млн заболевших по ID из лживого латышского листка.
Слабые места статьи:
1. совершенно непонятно почему авторы решили, что нумерация начинается с 0
2. непонятно, почему авторы решили, что пропусков в номерах нет. Я в своё время парсил инстаграм. Там у всех пользователей тоже номера подряд. Но. Так как пользователи в разных регионах обслуживаются разными кластерами, то Инста нарезает региональным серверам какие-то диапазоны ID, чтобы они глобально ненароком не пересеклись из-за latency в сети. Пропуски там есть. Более того порядок тоже нарушается в зависимости от скорости наполнения. Задача имхо аналогичная.
3. самое слабое место: Пациентов, у которых диагноз не подтвердился, из регистра удаляют, отмечает источник — а порядковый номер освобождается и потом присваивается новому заболевшему. Никто и никогда не будет переиспользовать ID. Это дико неудобно в реализации, а новых номеров завались и тележка. Авторам это очевидно нужно для обоснования отсутствия пробелов.
4. всего на графике у них 51 точка, по которым проводится сплайн. Я сам считал. Понятно, что у них мало сторонников, но даткой они разжились жиденько, что совершенно не соответствует заявленным 29 млн. Поддержка уличная у них 0.5%, значит переболевших сторонников около 195 000 должно быть, +/- 90 000. 2% конверсии дадут минимум 2000 в датасете. Их очевидно нет.
в реальности скорей всего там ETL не раз сбоил между регионами, что-то добавлялось, что-то удалялось. Частично номера идут подряд и коррелируют с датами, но вот экстраполировать, как они сделали может только лживый латышский листок, он же иностранный агент.
3 010
попросили прокомментировать вот этот пост лживого латышского листка про 29 млн заболевших из реестра по ID.
1.
3 010
У борьбы с коррупцией есть негативная обратная связь: чем больше ты выявляешь и наказываешь, тем больше кажется размах явления и "всё пропало".
3 010
типы ветряков и мощности. Как видно в море размещать ветряки в разы выгодней по отдаче, чем на суше. Там правда морская вода, которая всё разъедает и брызги, которые как наждак по лопастям. Вышеперечисленное требует серьёзной защиты для электрики.
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
