Роман с данными
Відкрити в Telegram
Все о данных, ML, AI Founder LLM Arena. Ex-Founder TrainingData.Pro Окончил ВМК МГУ, 8 лет занимаюсь сбором и разметкой данных Контакты: @roman_kucev
Показати більше2 706
Підписники
-124 години
-47 днів
+230 день
Триває завантаження даних...
Схожі канали
Немає даних
Виникли проблеми? Будь ласка, оновіть сторінку або зверніться до нашого support-менеджера.
Хмара тегів
Немає даних
Виникли проблеми? Будь ласка, оновіть сторінку або зверніться до нашого support-менеджера.
Вхідні та вихідні згадування
---
---
---
---
---
---
Залучення підписників
червень '26
червень '26
+29
в 2 каналах
травень '26
+47
в 4 каналах
Get PRO
квітень '26
+58
в 1 каналах
Get PRO
березень '26
+74
в 1 каналах
Get PRO
лютий '26
+101
в 5 каналах
Get PRO
січень '26
+66
в 1 каналах
Get PRO
грудень '25
+84
в 2 каналах
Get PRO
листопад '25
+112
в 3 каналах
Get PRO
жовтень '25
+135
в 3 каналах
Get PRO
вересень '25
+276
в 10 каналах
Get PRO
серпень '25
+167
в 1 каналах
Get PRO
липень '25
+85
в 7 каналах
Get PRO
червень '25
+131
в 1 каналах
Get PRO
травень '25
+109
в 2 каналах
Get PRO
квітень '25
+145
в 7 каналах
Get PRO
березень '25
+84
в 0 каналах
Get PRO
лютий '25
+111
в 4 каналах
Get PRO
січень '25
+154
в 3 каналах
Get PRO
грудень '24
+71
в 3 каналах
Get PRO
листопад '24
+69
в 0 каналах
Get PRO
жовтень '24
+72
в 0 каналах
Get PRO
вересень '24
+55
в 3 каналах
Get PRO
серпень '24
+253
в 5 каналах
Get PRO
липень '240
в 0 каналах
Get PRO
червень '240
в 0 каналах
Get PRO
травень '240
в 0 каналах
Get PRO
квітень '240
в 0 каналах
Get PRO
березень '240
в 0 каналах
Get PRO
лютий '240
в 0 каналах
Get PRO
січень '240
в 0 каналах
Get PRO
грудень '230
в 0 каналах
Get PRO
листопад '230
в 12 каналах
Get PRO
жовтень '230
в 2 каналах
Get PRO
вересень '23
+113
в 0 каналах
Get PRO
серпень '23
+64
в 0 каналах
Get PRO
липень '23
+37
в 0 каналах
Get PRO
червень '23
+219
в 0 каналах
Get PRO
травень '230
в 0 каналах
Get PRO
квітень '230
в 0 каналах
Get PRO
березень '230
в 0 каналах
Get PRO
лютий '230
в 0 каналах
Get PRO
січень '23
+3
в 0 каналах
Get PRO
грудень '22
+10
в 0 каналах
Get PRO
листопад '22
+25
в 0 каналах
Get PRO
жовтень '22
+24
в 0 каналах
Get PRO
вересень '22
+465
в 0 каналах
| Дата | Залучення підписників | Згадування | Канали | |
| 15 червня | +2 | |||
| 14 червня | 0 | |||
| 13 червня | +1 | |||
| 12 червня | 0 | |||
| 11 червня | +2 | |||
| 10 червня | +6 | |||
| 09 червня | +4 | |||
| 08 червня | +3 | |||
| 07 червня | +2 | |||
| 06 червня | +3 | |||
| 05 червня | +1 | |||
| 04 червня | +1 | |||
| 03 червня | +3 | |||
| 02 червня | 0 | |||
| 01 червня | +1 |
Дописи каналу
| 2 | Немає тексту... | 449 |
| 3 | Немає тексту... | 392 |
| 4 | Немає тексту... | 377 |
| 5 | Немає тексту... | 426 |
| 6 | Лечу на Southub отмечать свой 31-й день рождения 🥳
Рейс задержали на 2 часа, нашел время зайти в галерею.
Год был крайне интересный и насыщенный:
- 2 поездки в США
- 2 купленных мотоцикла (да, кризис 30-ти такой)
- 2 месяца в Гоголь Скул на программе, которая сильно поменяла отношение к миру
- 2 поездки POLUBVI
- 2-е место у llmarena.ru на Gen AI Awards
- 20+ конференций
- х2 каждый месяц растет vsellm.ru последние пол года
Вместо умных мыслей и выводов - запечатленные моменты | 454 |
| 7 | Через 5 минут начинаем!
Ссылка для подключения: https://dion.vc/event/datafest-b
Инструкция по подключению | 237 |
| 8 | Всем привет!
Я уже много лет подряд организую на DataFest секцию Data Collection & Labeling — про данные, разметку, контроль качества и всё то, без чего AI на самом деле не работает.
Все говорят, что “LLM заменят разметку”, но по факту разметка не умирает — она превращается в новую инженерную дисциплину вокруг данных, качества и автоматизации.
В этом году я постарался собрать максимально прикладную программу: без воды, с реальными кейсами от сильных команд.
Пятница — офлайн в Лемана Тех
12:10 — Контроль качества CV-разметки (Яндекс)
12:40 — LegalEval: бенчмарк + Kaggle (Физтех)
13:10 — Как LLM снижает шум в разметке изображений (Яндекс)
13:40 — RL-инструмент для анализа контекстов (Яндекс)
Воскресенье — онлайн
12:00 — Как угодить заказчикам и почему этого мало (Тбанк)
12:30 — Аналитика платформы разметки (Тбанк)
13:00 — AI-разметчик и контроль качества авторазметки (Тбанк)
Если вы работаете с ML, LLM, CV, датасетами или AI-продуктами — заглядывайте. Мне кажется, получилась живая и полезная секция про то, как сегодня реально устроено производство данных для AI. | 1 106 |
| 9 | 🚜 Разметка данных — это новый трактор для экономики знаний
Есть ощущение, что мы сейчас смотрим на очень большой сдвиг, но пока не до конца его осознаём.
Раньше, чтобы человечество стало продуктивнее, нужно было, чтобы миллионы людей сами учились лучше пахать землю, лучше работать руками, лучше делать одно и то же действие.
Потом кто-то умный придумал трактор.
И внезапно стало не нужно, чтобы каждый фермер умел проектировать двигатель, собирать коробку передач и разбираться в металлургии.
Достаточно было, чтобы небольшая группа инженеров где-то в одном месте придумала и произвела трактор.
А дальше миллионы людей по всему миру просто научились им управлять — и их продуктивность выросла в десятки раз.
Мне кажется, с ИИ сейчас происходит примерно то же самое.
Раньше, чтобы человек научился программировать, анализировать данные, писать юридические документы, делать научные исследования или решать сложные инженерные задачи, ему нужно было самому пройти долгий путь:
• Годы обучения.
• Универ.
• Практика.
• Ошибки.
• Книги.
• Менторы.
• Опыт.
То есть знание распространялось через обучение каждого отдельного человека.
А теперь появляется новая схема.
Не нужно 5 миллионов PhD, чтобы 5 миллионов людей могли решать сложные задачи.
Достаточно найти 15–20 очень сильных экспертов, профессоров, олимпиадников, инженеров, врачей, юристов, аналитиков — и посадить их размечать самые сложные frontier-задачи для OpenAI, Anthropic, Google или других лабораторий.
Они показывают модели:
• как думать;
• как рассуждать;
• где ошибка;
• какой ответ лучше;
• как выглядит хорошее решение;
• как выглядит плохое решение;
• как эксперт принимает решение в сложной ситуации.
И дальше происходит магия.
Их знания не остаются внутри этих 15–20 людей.
Они дистиллируются в модель.
А потом эта модель попадает к миллионам пользователей по всему миру.
То есть разметка данных становится не просто “ручной работой для датасетов”.
Она становится трубой, через которую знания лучших людей планеты перетекают в массовый продукт.
Раньше знание масштабировалось через образование.
Теперь знание масштабируется через разметку данных и обучение моделей.
Это очень сильный сдвиг, а вы как считаете?
VseLLM | LLM Arena | AI Roman | 1 292 |
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
