Data Scientist | IT
رفتن به کانال در Telegram
Добро пожаловать в клуб. Полезные материалы из мира DS & ML на регулярной основе. По всем вопросам: @godinmedia
نمایش بیشتر1 940
مشترکین
-224 ساعت
-47 روز
-1130 روز
در حال بارگیری داده...
کانالهای مشابه
ابر برچسبها
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '260
در 0 کانالها
مه '26
+3
در 0 کانالها
Get PRO
آوریل '26
+5
در 0 کانالها
Get PRO
مارس '26
+7
در 0 کانالها
Get PRO
فوریه '26
+6
در 0 کانالها
Get PRO
ژانویه '26
+6
در 0 کانالها
Get PRO
دسامبر '25
+17
در 0 کانالها
Get PRO
نوامبر '25
+2
در 0 کانالها
Get PRO
اکتبر '25
+5
در 0 کانالها
Get PRO
سپتامبر '25
+8
در 0 کانالها
Get PRO
اوت '25
+8
در 0 کانالها
Get PRO
ژوئیه '25
+8
در 0 کانالها
Get PRO
ژوئن '25
+3
در 0 کانالها
Get PRO
مه '25
+8
در 0 کانالها
Get PRO
آوریل '25
+4
در 0 کانالها
Get PRO
مارس '25
+3
در 0 کانالها
Get PRO
فوریه '25
+3
در 0 کانالها
Get PRO
ژانویه '25
+5
در 0 کانالها
Get PRO
دسامبر '24
+1
در 1 کانالها
Get PRO
نوامبر '24
+11
در 0 کانالها
Get PRO
اکتبر '24
+7
در 0 کانالها
Get PRO
سپتامبر '24
+367
در 0 کانالها
Get PRO
اوت '24
+365
در 0 کانالها
Get PRO
ژوئیه '24
+11
در 0 کانالها
Get PRO
ژوئن '24
+20
در 0 کانالها
Get PRO
مه '24
+11
در 0 کانالها
Get PRO
آوریل '24
+10
در 0 کانالها
Get PRO
مارس '24
+12
در 0 کانالها
Get PRO
فوریه '24
+13
در 1 کانالها
Get PRO
ژانویه '24
+5
در 0 کانالها
Get PRO
دسامبر '23
+12
در 0 کانالها
Get PRO
نوامبر '23
+18
در 0 کانالها
Get PRO
اکتبر '23
+27
در 2 کانالها
Get PRO
سپتامبر '23
+129
در 0 کانالها
Get PRO
اوت '23
+377
در 0 کانالها
Get PRO
ژوئیه '23
+428
در 0 کانالها
Get PRO
ژوئن '23
+215
در 0 کانالها
Get PRO
مه '23
+122
در 0 کانالها
Get PRO
آوریل '23
+551
در 0 کانالها
Get PRO
مارس '23
+241
در 0 کانالها
Get PRO
فوریه '23
+399
در 0 کانالها
Get PRO
ژانویه '23
+484
در 0 کانالها
Get PRO
دسامبر '22
+59
در 0 کانالها
Get PRO
نوامبر '22
+341
در 0 کانالها
Get PRO
اکتبر '22
+166
در 0 کانالها
Get PRO
سپتامبر '22
+988
در 0 کانالها
Get PRO
اوت '22
+520
در 0 کانالها
Get PRO
ژوئیه '22
+1 094
در 0 کانالها
Get PRO
ژوئن '22
+133
در 0 کانالها
Get PRO
مه '22
+2 526
در 0 کانالها
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 04 ژوئن | 0 | |||
| 03 ژوئن | 0 | |||
| 02 ژوئن | 0 | |||
| 01 ژوئن | 0 |
پستهای کانال
Семантический компьютер на 64 нейронах и обучение на шуме
#почитать
В предыдущей статье о машинном обучении как алхимии я говорил о том, что можно найти новые решения, не используя GPU или дорогие видеокарты. В этой статье я расскажу, о том, как я экспериментировал с continual learning и композициональностью мышления на микронейросетях, и причем здесь философ Лев Выготский.✅Читать статью
| 2 | Как развернуть OpenClaw и не слить ему все свои данные
#почитать
OpenClaw (ex. Moltbook и Clawdbot) мощно взорвал начало года. Все бросились устанавливать себе агента, и я понимаю, почему получился такой хайп. Ведь это первый в мире опен сорсный персональный AI-ассистент, которого можно подключить к мессенджеру, почте, календарю и практически чему угодно еще и он будет управлять моей личной жизнью. Ему можно поручить покупку билетов в кино, бронь столика в любимом кафе или внести важную встречу в календарь.
Другая сторона хайпа — вопросы к безопасности агента, здесь шумихи не меньше. То исследователи Gen Threat Labsнашли 18 000 открытых инстансов OpenClaw, к которым можно подключиться и управлять уже не своей, а чужой личной жизнью. То Касперский пишет, что каталог «навыков» агента стал рассадником вредоносного кода. Или вспомнить историю о том, что OpenClaw сливал данные своих пользователей через Moltbook (соцсеть для нейронок).
И что теперь, совсем нельзя пользоваться этим агентом? Я считаю, что пользоваться можно, но осторожно и лучше в облаке. Расскажу, как это сделать безопасно.
✅Читать статью | 101 |
| 3 | Anthropic против OpenAI: два разных подхода к «быстрому режиму»
#почитать
Anthropic и OpenAI почти одновременно запустили «быстрый режим» для своих моделей — и за одинаковым названием скрываются принципиально разные подходы к ускорению инференса.
В одном случае это реальная модель с уменьшенным батчингом, в другом — отдельная, более компактная версия на специализированных чипах Cerebras.
Разбираемся, что именно стоит за цифрами «2.5×» и «1000 токенов в секунду», где компромисс по качеству и что это значит для разработчиков на практике.
✅Читать статью | 117 |
| 4 | Я обучил модель на 10 000 код-ревью, чтобы отсеять мусор. Она начала предсказывать увольнения
#почитать
Я хотел решить простую инженерную задачу: отсеять «шум» в комментариях на код-ревью. Обучил модель на 10 000 примеров, получил точность 87%. Потом открыл список ошибок. Оказалось, модель научилась предсказывать увольнения сотрудников за два месяца до того, как они принесут заявление. Рассказываю, как «пустые» комментарии выдают выгорание и почему данные иногда знают о нас больше, чем мы сами.
✅Читать статью | 150 |
| 5 | 152-ФЗ на практике: как найти и контролировать ПДн в базах данных 🔎
Персональные данные сегодня есть практически в каждой корпоративной системе: CRM, ERP, DWH, BI, служебных таблицах и выгрузках.
Но в большинстве компаний отсутствует прозрачность: где именно хранятся персональные данные, кто имеет к ним доступ, сколько существует «теневых» копий, используются ли эти данные вообще и какие риски это создает для бизнеса.
📆 26 мая в 11:00 МСК приглашаем на бесплатный онлайн-вебинар: «Управление персональными данными: как выстроить контроль в базах данных и снизить риски по 152-ФЗ»
На вебинаре разберем:
📊 что 152-ФЗ говорит про ПДн в СУБД и DWH
📊 как автоматически находить и классифицировать ПДн
📊 как выявлять лишние копии и неиспользуемые данные
📊 зачем нужен мониторинг использования ПДн
📊 как выстроить системный процесс контроля
📊 как снизить нагрузку на ИБ- и data-команды за счет автоматизации
Также покажем практический сценарий мониторинга ПДн в СУБД — от сканирования базы до автоматических рекомендаций по снижению рисков.
👥 Вебинар будет полезен руководителям ИБ, архитекторам и руководителям DWH / BI, администраторам СУБД.
🎁 Бонус участникам — чек-лист по контролю персональных данных в СУБД и DWH.
🔗 Регистрация по ссылке | 158 |
| 6 | От чат-бота к AI агенту: собираем локальную систему на LibreChat, Langflow и MCP
#почитать
В прошлой статье мы строили локальную систему для транскрибации аудио, а сегодня пойдём дальше и соберём локальную агентную AI-систему — без облаков и с контролем над данными.
В этой статье я покажу, как собрать связку из трёх ключевых компонентов:
1. LibreChat — UI для работы с LLM
2. Langflow — low-code платформа и визуальный редактор
3. MCP — стандарт для подключения инструментов
Статья построена по принципу «по нарастающей», где каждый новый уровень — это рабочий инструмент. Можно остановиться на любом этапе, а можно пройти все и тогда получите связку UI + инструменты + централизованная логика (и дальше ее можно развивать под свои сценарии).
✅Читать статью | 119 |
| 7 | 🌐Python Pydantic Tutorial: Complete Data Validation Course
#посмотреть
In this video, we'll be learning how to use Pydantic, Python's most popular data validation library. Pydantic uses type hints to validate data at runtime, ensuring that the data coming into your application meets your expectations. We'll cover everything from basic model creation and field validation to custom validators, type coercion, nested models, and model configurations. We'll also see why Pydantic is so widely used in libraries like FastAPI, data processing pipelines, and AI tools. If you've ever struggled with messy manual validation code or data that isn't the right type or format, Pydantic will make your life much easier.
✅Смотреть на Ютубе ⏱️3 часа | 119 |
| 8 | 🦾 Препарируем рекомендательные системы методами машинного обучения
На открытом уроке разберём, как работают рекомендательные системы и какие подходы используются в машинном обучении. Покажем, как формируется рекомендация и как реализовать один из методов на практике с помощью Python.
Вы не просто послушаете теорию, а соберёте свою первую рекомендательную модель.
👨💻🛠👨🏻💻 Урок подойдёт тем, кто начинает путь в машинном обучении и хочет разобраться в одной из самых востребованных задач.
Встречаемся 20 мая в 18:00 МСК в преддверии старта курса «Машинное обучение. Специализация».
➡️ Принять участие бесплатно: https://vk.cc/cXUqAm
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576 | 121 |
| 9 | Повторяй промт дважды — и нейросеть станет умнее. Это реально работает
#почитать
Ещё раз: повторяй свой промт дважды (и даже трижды) — и нейросеть станет умнее. Это реально работает!
✅Читать статью | 111 |
| 10 | Лес под прицелом нейросетей: сравниваем модели для выявления рубок со спутника
#почитать
Ханты-Мансийский автономный округ (ХМАО) – это не только 50% российской нефти, но и 530 тыс. кв. км лесов. Развитие инфраструктуры месторождений и интенсивные заготовки требуют жесткого контроля вырубок. С 2014 года здесь ведут мониторинг по снимкам со спутников, собрав базу из 15000 записей, включающих информацию о выявленных лесных рубках, но есть проблема: ручное дешифрирование происходит слишком долго и дорого.
✅Читать статью | 143 |
| 11 | Динамический полиморфизм для свободных функций: еще одна практика из С++ для машинного обучения
#почитать
Я Кирилл Колодяжный, разработчик систем хранения данных в YADRO и ML-энтузиаст. Продолжаю рассказывать о паттернах С++, которые легко адаптировать под задачи машинного обучения. В этой части поговорим о динамическом полиморфизме — технологии, которая помогает объединить интерфейс для запуска вычислений с разными условиями. Ссылку на первую часть найдете в конце статьи.
✅Читать статью | 168 |
| 12 | RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний
#почитать
RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.
✅Читать статью | 186 |
| 13 | Как ML-модели решают, какой процент по кредиту вы получите
#почитать
Почему два человека с одинаковым доходом и кредитной историей могут платить совершенно разный процент по одному и тому же кредиту? В этой статье мы заглянем под капот банковских систем ценообразования, разберем реальные кейсы дискриминации от Ally Bank и Test-Achats, и наглядно покажем, как деревья решений и градиентный бустинг используются для предсказания вашей платежеспособности — и как они могут ошибаться.
✅Читать статью | 176 |
| 14 | Новый инструмент на основе ML для анализа дыхания растений
#почитать
По всему миру сельское хозяйство сталкивается с ростом потребности в продуктах питания и ограниченностью водных ресурсов. Эффективность выращивания культур во многом зависит от того, насколько точно удаётся описывать и предсказывать процессы, определяющие фотосинтез и потерю воды у растений. Одну из ключевых ролей здесь играют устьица, микроскопические поры на поверхности листьев, которые регулируют поступление CO₂ и испарение влаги.
В 2025 году исследователи из Иллинойсского университета в Урбане-Шампейне представили систему Stomata In-Sight, которая объединяет конфокальную микроскопию, газообменные измерения и автоматизированный анализ изображений на основе ML. Такой подход позволяет получать количественные оценки геометрии устьиц в условиях контролируемой среды и сопоставлять их с измеряемой проводимостью и фотосинтезом. Это важно не только для физиологии растений, но и для прикладных задач, связанных с эффективностью использования воды и устойчивостью урожая при засухе. В этой статье я расскажу о самом исследовании и о том, как устроена Stomata In-Sight.
✅Читать статью | 165 |
| 15 | Нейросимвольный ИИ: архитектура семантической нейросети. Как научить LLM считать
#почитать
LLM ошибаются в элементарной математике. Корпорации тратят миллиарды, но в конечном счете вынуждены прикручивать калькуляторы к вычислительным машинам невероятной мощи. Все попытки исправить через Chain-of-Thought, fine-tuning на задачах счёта, увеличение контекста не сработали.
Я провёл серию экспериментов чтобы понять почему, и пришел к выводу, что нейросети просто не предназначены для дискретной арифметики. Их предназначение непрерывные трансформации.
В этой статье описывается реализация новой архитектуры нейросетей, объединяющая точность символьного ИИ и способность к обобщению LLM. Код как всегда прилагается.
✅Читать статью | 0 |
| 16 | Как устроен Codex
#почитать
Подробный разбор того, как команда OpenAI Codex создаёт своего кодового агента, как его используют другие команды, как он влияет на инженерные практики создателей ChatGPT и что это может значить для будущего разработки ПО.
Чтобы в этом разобраться, я поговорил с тремя сотрудниками OpenAI:
Тибо Соттио (Thibault Sottiaux) — руководитель Codex.
Шао-Цянь Ма (Shao-Qian (SQ) Mah) — исследователь в команде Codex, обучающий модели, на которых тот работает.
Эмма Тан (Emma Tang) — руководитель data-инфраструктуры; она не входит в команду Codex, но её команда активно им пользуется.
✅Читать статью | 0 |
| 17 | Зачем роботам погонщик
#почитать
У любой сложной технической системы есть граница, на которой модель больше не совпадает с реальностью. Если вы видели систему со всеми зелёными метриками, но интуиция подсказывала, что дежурство будет тяжёлым, вы знаете это состояние. В распределительных центрах эту границу видят не в логах и дашбордах, а на полу склада. Когда алгоритм уже всё просчитал, а физический мир внёс свои правки.
Эта статья не про роботов как технологию и не про автоматизацию как цель. Она про роль, которая появляется, когда автоматизация становится массовой. Про человека, который стоит между WMS, роботами и реальным складом. И про то, почему без этой роли, даже если формально всё работает, автоматизация со временем деградирует.
✅Читать статью | 0 |
| 18 | 12 бит против 8 бит в камере для проведения металлографических исследований при помощи оптического микроскопа
#почитать
В лаборатории к инвертированному оптическому микроскопу Zeiss Axio Observer 3 подключена промышленная камера The Imaging Source DFK 33UX265 для выполнения металлографических задач: анализ зерна, неметаллических включений, поиска дефектов структуры. Мне стало интересно, как она устроена и что есть у нее "под капотом". Когда мы проводим анализ, то не задумываемся о постобработки, а под "капотом" любой камеры есть много интересных режимов. Я ухватился за 12-битный монохромный Bayer-формат (часто обозначаемый как 12-bit Bayer Packed) — это формат RAW-данных, при котором с сенсора с фильтром Байера считывается 12 бит информации на пиксель без цветовой интерполяции. Это обеспечивает более высокий динамический диапазон (4096 уровней яркости) по сравнению с 8-битным форматом (256 уровней), сохраняя «сырые» данные.
Большинство программ, связанных с металловедением принимают картинку в 8 бит. И я хотел бы разобраться в вопросе, а так ли нужен при оценке и автоматизации режим 12 бит.
✅Читать статью | 0 |
| 19 | Дрейф данных в машинном обучении
#почитать
Дрейф данных (Drift Data) — это ситуация, когда статистические свойства входных данных для модели машинного обучения изменяются со временем. При дрейфе данных взаимосвязи между признаками и самой целевой переменной перестают быть действительными. Это может привести к низкой производительности модели, неточным прогнозам и даже к сбоям.
✅Читать статью | 0 |
| 20 | ⏺ | 0 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
