Роман с данными

前往频道在 Telegram

Все о данных, ML, AI Founder LLM Arena. Ex-Founder TrainingData.Pro Окончил ВМК МГУ, 8 лет занимаюсь сбором и разметкой данных Контакты: @roman_kucev

显示更多

俄罗斯176 160 技术与应用26 613

2 674

订阅者

无数据24 小时

+47 天

-3630 天

1 154

帖子浏览量

~ 58124 小时

~ 63148 小时

43.19%

参与率

无数据

每日帖子数

Ads index

beta

数据加载中...

相似频道

无数据

有任何问题？请刷新页面或联系我们的客服。

标签云

无数据

有任何问题？请刷新页面或联系我们的客服。

进出提及

---

吸引订阅者

七月 '26

+18

在0个频道中

六月 '26

+44

在2个频道中

Get PRO

五月 '26

+47

在4个频道中

Get PRO

四月 '26

+58

在1个频道中

Get PRO

三月 '26

+74

在1个频道中

Get PRO

二月 '26

+101

在5个频道中

Get PRO

一月 '26

+66

在1个频道中

Get PRO

十二月 '25

+84

在2个频道中

Get PRO

十一月 '25

+112

在3个频道中

Get PRO

十月 '25

+135

在3个频道中

Get PRO

九月 '25

+276

在10个频道中

Get PRO

八月 '25

+167

在1个频道中

Get PRO

七月 '25

+85

在7个频道中

Get PRO

六月 '25

+131

在1个频道中

Get PRO

五月 '25

+109

在2个频道中

Get PRO

四月 '25

+145

在7个频道中

Get PRO

三月 '25

+84

在0个频道中

Get PRO

二月 '25

+111

在4个频道中

Get PRO

一月 '25

+154

在3个频道中

Get PRO

十二月 '24

+71

在3个频道中

Get PRO

十一月 '24

+69

在0个频道中

Get PRO

十月 '24

+72

在0个频道中

Get PRO

九月 '24

+55

在3个频道中

Get PRO

八月 '24

+253

在5个频道中

Get PRO

七月 '240

在0个频道中

Get PRO

六月 '240

在0个频道中

Get PRO

五月 '240

在0个频道中

Get PRO

四月 '240

在0个频道中

Get PRO

三月 '240

在0个频道中

Get PRO

二月 '240

在0个频道中

Get PRO

一月 '240

在0个频道中

Get PRO

十二月 '230

在0个频道中

Get PRO

十一月 '230

在12个频道中

Get PRO

十月 '230

在2个频道中

Get PRO

九月 '23

+113

在0个频道中

Get PRO

八月 '23

+64

在0个频道中

Get PRO

七月 '23

+37

在0个频道中

Get PRO

六月 '23

+219

在0个频道中

Get PRO

五月 '230

在0个频道中

Get PRO

四月 '230

在0个频道中

Get PRO

三月 '230

在0个频道中

Get PRO

二月 '230

在0个频道中

Get PRO

一月 '23

在0个频道中

Get PRO

十二月 '22

+10

在0个频道中

Get PRO

十一月 '22

+25

在0个频道中

Get PRO

十月 '22

+24

在0个频道中

Get PRO

九月 '22

+465

在0个频道中

日期	订阅者增长	提及	频道
13 七月	+3
12 七月	0
11 七月	0
10 七月	+3
09 七月	+3
08 七月	0
07 七月	0
06 七月	0
05 七月	+3
04 七月	0
03 七月	+3
02 七月	+3
01 七月	0

频道帖子

Так, я не дурак 😀 Yupp сжег 33 ляма баксов и закрылся 😬😬😬

Что произошло: мы запустились в июне прошлого года, чтобы построить двусторонний маркетплейс для оценки AI-моделей: дать пользователям доступ к нескольким моделям и использовать это реальное взаимодействие, чтобы помогать AI-лабораториям оценивать свои модели. Мы привлекли более 1,3 млн пользователей и несколько лабораторий в качестве платящих клиентов, но не смогли достичь достаточно сильного product–market fit. Тем временем рынок быстро изменился. Модели становятся гораздо более способными, а пользовательские сценарии смещаются в сторону агентных систем: моделей, подключенных к инструментам, памяти и внешним сервисам, а не отдельных чат-ботов. В таком мире краудсорсинговая оценка моделей на уровне чат-ботов становится все менее критичной.

2	Ездил апреле в США в SF - там все обсуждали harness Приехал на Саусхаб - снова harness, агенты, AI, автоматизация. Если вы вдруг еще не знаете что такое harness, почему это нужно и важно - рекомендую почитать AI-DISRUPT PDLC	1 482
3	+9 没有文字...	1 674
4	+9 没有文字...	1 163
5	+9 没有文字...	620
6	+9 没有文字...	539
7	+9 没有文字...	619
8	Лечу на Southub отмечать свой 31-й день рождения 🥳 Рейс задержали на 2 часа, нашел время зайти в галерею. Год был крайне интересный и насыщенный: - 2 поездки в США - 2 купленных мотоцикла (да, кризис 30-ти такой) - 2 месяца в Гоголь Скул на программе, которая сильно поменяла отношение к миру - 2 поездки POLUBVI - 2-е место у llmarena.ru на Gen AI Awards - 20+ конференций - х2 каждый месяц растет vsellm.ru последние пол года Вместо умных мыслей и выводов - запечатленные моменты	651
9	Через 5 минут начинаем! Ссылка для подключения: https://dion.vc/event/datafest-b Инструкция по подключению	237
10	Всем привет! Я уже много лет подряд организую на DataFest секцию Data Collection & Labeling — про данные, разметку, контроль качества и всё то, без чего AI на самом деле не работает. Все говорят, что “LLM заменят разметку”, но по факту разметка не умирает — она превращается в новую инженерную дисциплину вокруг данных, качества и автоматизации. В этом году я постарался собрать максимально прикладную программу: без воды, с реальными кейсами от сильных команд. Пятница — офлайн в Лемана Тех 12:10 — Контроль качества CV-разметки (Яндекс) 12:40 — LegalEval: бенчмарк + Kaggle (Физтех) 13:10 — Как LLM снижает шум в разметке изображений (Яндекс) 13:40 — RL-инструмент для анализа контекстов (Яндекс) Воскресенье — онлайн 12:00 — Как угодить заказчикам и почему этого мало (Тбанк) 12:30 — Аналитика платформы разметки (Тбанк) 13:00 — AI-разметчик и контроль качества авторазметки (Тбанк) Если вы работаете с ML, LLM, CV, датасетами или AI-продуктами — заглядывайте. Мне кажется, получилась живая и полезная секция про то, как сегодня реально устроено производство данных для AI.	1 106
11	🚜 Разметка данных — это новый трактор для экономики знаний Есть ощущение, что мы сейчас смотрим на очень большой сдвиг, но пока не до конца его осознаём. Раньше, чтобы человечество стало продуктивнее, нужно было, чтобы миллионы людей сами учились лучше пахать землю, лучше работать руками, лучше делать одно и то же действие. Потом кто-то умный придумал трактор. И внезапно стало не нужно, чтобы каждый фермер умел проектировать двигатель, собирать коробку передач и разбираться в металлургии. Достаточно было, чтобы небольшая группа инженеров где-то в одном месте придумала и произвела трактор. А дальше миллионы людей по всему миру просто научились им управлять — и их продуктивность выросла в десятки раз. Мне кажется, с ИИ сейчас происходит примерно то же самое. Раньше, чтобы человек научился программировать, анализировать данные, писать юридические документы, делать научные исследования или решать сложные инженерные задачи, ему нужно было самому пройти долгий путь: • Годы обучения. • Универ. • Практика. • Ошибки. • Книги. • Менторы. • Опыт. То есть знание распространялось через обучение каждого отдельного человека. А теперь появляется новая схема. Не нужно 5 миллионов PhD, чтобы 5 миллионов людей могли решать сложные задачи. Достаточно найти 15–20 очень сильных экспертов, профессоров, олимпиадников, инженеров, врачей, юристов, аналитиков — и посадить их размечать самые сложные frontier-задачи для OpenAI, Anthropic, Google или других лабораторий. Они показывают модели: • как думать; • как рассуждать; • где ошибка; • какой ответ лучше; • как выглядит хорошее решение; • как выглядит плохое решение; • как эксперт принимает решение в сложной ситуации. И дальше происходит магия. Их знания не остаются внутри этих 15–20 людей. Они дистиллируются в модель. А потом эта модель попадает к миллионам пользователей по всему миру. То есть разметка данных становится не просто “ручной работой для датасетов”. Она становится трубой, через которую знания лучших людей планеты перетекают в массовый продукт. Раньше знание масштабировалось через образование. Теперь знание масштабируется через разметку данных и обучение моделей. Это очень сильный сдвиг, а вы как считаете? VseLLM \| LLM Arena \| AI Roman	1 292

查看所有帖子