Роман с данными
前往频道在 Telegram
Все о данных, ML, AI Founder LLM Arena. Ex-Founder TrainingData.Pro Окончил ВМК МГУ, 8 лет занимаюсь сбором и разметкой данных Контакты: @roman_kucev
显示更多2 706
订阅者
-124 小时
-47 天
+230 天
吸引订阅者
六月 '26
六月 '26
+29
在2个频道中
五月 '26
+47
在4个频道中
Get PRO
四月 '26
+58
在1个频道中
Get PRO
三月 '26
+74
在1个频道中
Get PRO
二月 '26
+101
在5个频道中
Get PRO
一月 '26
+66
在1个频道中
Get PRO
十二月 '25
+84
在2个频道中
Get PRO
十一月 '25
+112
在3个频道中
Get PRO
十月 '25
+135
在3个频道中
Get PRO
九月 '25
+276
在10个频道中
Get PRO
八月 '25
+167
在1个频道中
Get PRO
七月 '25
+85
在7个频道中
Get PRO
六月 '25
+131
在1个频道中
Get PRO
五月 '25
+109
在2个频道中
Get PRO
四月 '25
+145
在7个频道中
Get PRO
三月 '25
+84
在0个频道中
Get PRO
二月 '25
+111
在4个频道中
Get PRO
一月 '25
+154
在3个频道中
Get PRO
十二月 '24
+71
在3个频道中
Get PRO
十一月 '24
+69
在0个频道中
Get PRO
十月 '24
+72
在0个频道中
Get PRO
九月 '24
+55
在3个频道中
Get PRO
八月 '24
+253
在5个频道中
Get PRO
七月 '240
在0个频道中
Get PRO
六月 '240
在0个频道中
Get PRO
五月 '240
在0个频道中
Get PRO
四月 '240
在0个频道中
Get PRO
三月 '240
在0个频道中
Get PRO
二月 '240
在0个频道中
Get PRO
一月 '240
在0个频道中
Get PRO
十二月 '230
在0个频道中
Get PRO
十一月 '230
在12个频道中
Get PRO
十月 '230
在2个频道中
Get PRO
九月 '23
+113
在0个频道中
Get PRO
八月 '23
+64
在0个频道中
Get PRO
七月 '23
+37
在0个频道中
Get PRO
六月 '23
+219
在0个频道中
Get PRO
五月 '230
在0个频道中
Get PRO
四月 '230
在0个频道中
Get PRO
三月 '230
在0个频道中
Get PRO
二月 '230
在0个频道中
Get PRO
一月 '23
+3
在0个频道中
Get PRO
十二月 '22
+10
在0个频道中
Get PRO
十一月 '22
+25
在0个频道中
Get PRO
十月 '22
+24
在0个频道中
Get PRO
九月 '22
+465
在0个频道中
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 15 六月 | +2 | |||
| 14 六月 | 0 | |||
| 13 六月 | +1 | |||
| 12 六月 | 0 | |||
| 11 六月 | +2 | |||
| 10 六月 | +6 | |||
| 09 六月 | +4 | |||
| 08 六月 | +3 | |||
| 07 六月 | +2 | |||
| 06 六月 | +3 | |||
| 05 六月 | +1 | |||
| 04 六月 | +1 | |||
| 03 六月 | +3 | |||
| 02 六月 | 0 | |||
| 01 六月 | +1 |
频道帖子
| 2 | 没有文字... | 449 |
| 3 | 没有文字... | 392 |
| 4 | 没有文字... | 377 |
| 5 | 没有文字... | 426 |
| 6 | Лечу на Southub отмечать свой 31-й день рождения 🥳
Рейс задержали на 2 часа, нашел время зайти в галерею.
Год был крайне интересный и насыщенный:
- 2 поездки в США
- 2 купленных мотоцикла (да, кризис 30-ти такой)
- 2 месяца в Гоголь Скул на программе, которая сильно поменяла отношение к миру
- 2 поездки POLUBVI
- 2-е место у llmarena.ru на Gen AI Awards
- 20+ конференций
- х2 каждый месяц растет vsellm.ru последние пол года
Вместо умных мыслей и выводов - запечатленные моменты | 454 |
| 7 | Через 5 минут начинаем!
Ссылка для подключения: https://dion.vc/event/datafest-b
Инструкция по подключению | 237 |
| 8 | Всем привет!
Я уже много лет подряд организую на DataFest секцию Data Collection & Labeling — про данные, разметку, контроль качества и всё то, без чего AI на самом деле не работает.
Все говорят, что “LLM заменят разметку”, но по факту разметка не умирает — она превращается в новую инженерную дисциплину вокруг данных, качества и автоматизации.
В этом году я постарался собрать максимально прикладную программу: без воды, с реальными кейсами от сильных команд.
Пятница — офлайн в Лемана Тех
12:10 — Контроль качества CV-разметки (Яндекс)
12:40 — LegalEval: бенчмарк + Kaggle (Физтех)
13:10 — Как LLM снижает шум в разметке изображений (Яндекс)
13:40 — RL-инструмент для анализа контекстов (Яндекс)
Воскресенье — онлайн
12:00 — Как угодить заказчикам и почему этого мало (Тбанк)
12:30 — Аналитика платформы разметки (Тбанк)
13:00 — AI-разметчик и контроль качества авторазметки (Тбанк)
Если вы работаете с ML, LLM, CV, датасетами или AI-продуктами — заглядывайте. Мне кажется, получилась живая и полезная секция про то, как сегодня реально устроено производство данных для AI. | 1 106 |
| 9 | 🚜 Разметка данных — это новый трактор для экономики знаний
Есть ощущение, что мы сейчас смотрим на очень большой сдвиг, но пока не до конца его осознаём.
Раньше, чтобы человечество стало продуктивнее, нужно было, чтобы миллионы людей сами учились лучше пахать землю, лучше работать руками, лучше делать одно и то же действие.
Потом кто-то умный придумал трактор.
И внезапно стало не нужно, чтобы каждый фермер умел проектировать двигатель, собирать коробку передач и разбираться в металлургии.
Достаточно было, чтобы небольшая группа инженеров где-то в одном месте придумала и произвела трактор.
А дальше миллионы людей по всему миру просто научились им управлять — и их продуктивность выросла в десятки раз.
Мне кажется, с ИИ сейчас происходит примерно то же самое.
Раньше, чтобы человек научился программировать, анализировать данные, писать юридические документы, делать научные исследования или решать сложные инженерные задачи, ему нужно было самому пройти долгий путь:
• Годы обучения.
• Универ.
• Практика.
• Ошибки.
• Книги.
• Менторы.
• Опыт.
То есть знание распространялось через обучение каждого отдельного человека.
А теперь появляется новая схема.
Не нужно 5 миллионов PhD, чтобы 5 миллионов людей могли решать сложные задачи.
Достаточно найти 15–20 очень сильных экспертов, профессоров, олимпиадников, инженеров, врачей, юристов, аналитиков — и посадить их размечать самые сложные frontier-задачи для OpenAI, Anthropic, Google или других лабораторий.
Они показывают модели:
• как думать;
• как рассуждать;
• где ошибка;
• какой ответ лучше;
• как выглядит хорошее решение;
• как выглядит плохое решение;
• как эксперт принимает решение в сложной ситуации.
И дальше происходит магия.
Их знания не остаются внутри этих 15–20 людей.
Они дистиллируются в модель.
А потом эта модель попадает к миллионам пользователей по всему миру.
То есть разметка данных становится не просто “ручной работой для датасетов”.
Она становится трубой, через которую знания лучших людей планеты перетекают в массовый продукт.
Раньше знание масштабировалось через образование.
Теперь знание масштабируется через разметку данных и обучение моделей.
Это очень сильный сдвиг, а вы как считаете?
VseLLM | LLM Arena | AI Roman | 1 292 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
