Data is data
رفتن به کانال در Telegram
Канал о данных, фактах, визуализации. Немного математики, историй с лёгкими оттенками machine и deep learning. Для связи пишите https://t.me/blackskif
نمایش بیشتر3 012
مشترکین
+124 ساعت
اطلاعاتی وجود ندارد7 روز
-430 روز
آرشیو پست ها
3 011
% женщин в региональных парламентах индийских штатов. Максимум там примерно 29%, около трети. А минимум там 0%. Индия всё ещё остаётся традиционной страной, несмотря на Индиру Ганди и Нирмалу Ситхараман (министр обороны сейчас).
3 011
Города с населением более 500 человек. Места на планете ещё много, но не везде легко жить.
3 011
Для начинающих и не только Machine Learning. Большая подборка датки на самые разные темы. Спойлер: ImageNet вошёл, CIFAR, MNIST и Титаник нет. Качать бесплатно без смс тут: https://clc.to/traintestrepeat
3 011
Оценки Хауса и Друзей. Если вы хотите посмотреть свой любимый сериал в циферках, то вам сюда: https://clc.to/imdbratings
3 011
Сценаристы "Игры престолов" не единственные, кто уронил топовый сериал под конец. На графиках оценки IMDB по сезонам. Клиника, Декстер. Много их. А вот "Ходячие мертвецы" (Walking Dead) совершили камбек под конец, оттолкнувшись от дна. Я кстати не смотрел, учил Deep Learning.
3 011
Мир на пороге больших перемен. Мировая торговля на минимумах 2017 года. И всё это вокруг Китая. Когда Трамп объявил первые санкции против Пекина (очевидно за Крым, хе-хе, или за украину), китайцы резко подняли стоки в США. Этому соответствует резкий рост экспорта и двойная вершина на графике экспорта Китая. Теперь по идее коммунисты должны упасть в экспорте на величину седловины. И самое прекрасное для всех, что Китай резко сократил импорт. Для России и прочих сырьевых стран вроде Австралии это очень плохо. Цены упадут на всё и пояса придётся подтянуть огого как. Второй большой риск здесь в том, что доллары сегодня напечатаны под объём мировой опять же торговли. Если она упадёт, на рынках будет их значительный избыток и значит инфляция в долларах может стать существенной. Т.е. сбережения в баксах обесценятся, а США решит вопрос со своим долгом автоматически. Будем наблюдать (с).
3 011
У Аптека.ру какой-то жуткий кейс про продажу некоторого препарата через интернет. На выходе из воронки продаж стоимость маркетинга на одного покупателя переваливает за 6000 рублей при наличии 700 000 человек на входе.
3 011
Вопреки ожиданиям Uber-подобные сервисы в США не снизили количество личных автомобилей. Более того, они существенно добавили цифр к траффику на дорогах. Выяснилось, что доступность такси вызвало переключение с автобусов и "пойти пешком" в сторону автомобилей. Т.е. шеринговая экономика работает не так, как предполагали урбанисты. В Москве на мой взгляд происходит нечто подобное. 50 000 такси (официально) + 15 000 кашерингов просто добавляют загрузки к дороге, а кашеринг ещё и парковочные места у жителей отжимает. Это конечно нужно доказывать и копаться в данных. А для начала их нужно собрать. Впрочем у авторов доклада тоже были проблемы с убером. Подробности тут: https://clc.to/carsharingeco
3 011
два маршрута в США на каждый день с 1го января по 31 декабря, чтобы вокруг была постоянная температура в 20 градусов.
3 011
Нейронные сети не обязательно учить BackProp-ом. Для каких-то задач вполне сгодятся генетические алгоритмы. От учителя правда никуда не деться. В видео сетка познаёт, как водить машинку по лабиринту. По просмотру у меня несколько мыслей: машинка не получает свой вектор скорости на вход, какой-то аналог LSTM нужен. Второе: очень похоже, что сетка выучивает конкретный лабиринт, а не учиться водить машину. Возможно так можно приближать сложные кривые не сплайнами. https://youtu.be/wL7tSgUpy8w
3 011
В пайплане для лечения диабета много кандидатов, но как обычно мало какие лекарства выходят из третьей фазы исследований на подачу в минздравы / FDA. Настараживает так же крайне маленькое количество молекул в фазе-1. Это значит, что через 5-7 лет будет почти ноль новых лекарств, потому что шансы кандидатов на первой фазе примерно 1%.
3 011
каждый четвёртый доллар здравоохранения в США тратится на лечение диабета. И всё равно у них там полно нелеченных пациентов. Отсутствие лечения это отказ почек, ампутация, инсульт и слепота. По нам даже собрать такие данные было бы счастьем.
3 011
Цены на нефть чистые и с поправкой на инфляцию (в ценах 2019 года, красеньким). Проблема нефтяных контрактов в том, что это не просто купил-продал, как какой-нибудь каучук, а инвестиционный инструмент. Поэтому мы имеем, что имеем.
3 011
По поводу имён компания Меркатор собрала интересный датасет по регистрациям в Москве и области. Он такой, конечно, смещённый скорей всего. Хотя, из него, видно, почему нашего президента зовут Владимир. Или какие-то странности с Танечками. Можно поиграться, забавно. Ссылка будет ниже.
3 011
ВКонтакте по среднему времени проведённому на сайте обошёл порносайты и проиграл только YouTube. Скажи на кого похожи твои метрики, и я скажу кто ты :)
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
