Data Secrets

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @veron_28 https://telega.in/c/data_secrets

نمایش بیشتر

Network:AI Insider روسيا19 218روسی19 878فناوری و برنامه‌ها2 712

پست‌های تبلیغاتی

31 729

مشترکین

+724 ساعت

+2777 روز

+1 01730 روز

8 252

نمایش های پست

~ 5 78224 ساعت

~ 6 36948 ساعت

26.01%

نرخ مشارکت

18.2%24 ساعت

20.1%48 ساعت

443

یادکردها

27 روز

830 روز

~ 7

پست های در روز

~ 101

واکنش ها

~ 10

نظرات

~ 169

بازنشرها

مشترکین
پوشش پست
ER - نسبت تعامل

در حال بارگیری داده...

02:26

Video unavailableShow in Telegram

Вышел Claude Engineer 2.0 – теперь с агентами Еще один программист из коробки к вашим услугам: система на основе Claude 3.5 может редактировать файлы, исполнять код (и на основе этого редактировать динамически), дебажить проект. За каждое действие, что интересно, отвечает отдельный агент. Ну и вишенка на торте: проект опенсорсный. Код лежит здесь.

نمایش همه...

IMG_2155.MP449.67 MB

👍 18🔥 7❤ 3

Photo unavailableShow in Telegram

Ну количество пальцев нужное. А в чем собственно проблема?

نمایش همه...

😁 83💅 9✍ 7👍 1

Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram
Photo unavailableShow in Telegram

Грязный секрет scikit learn заключается в том, что на самом деле predict_proba возвращает НЕ вероятности Десять лет в документации Scikit-learn было написано, что эта функция якобы возвращает вероятности (а это не так). Только несколько дней назад разработчики наконец исправили соответствующую страницу. Давайте разбираться, что же на самом деле возвращает эта загадочная функция. Спойлер: если собираетесь участвовать в нашем свежем ML-соревновании, то для вас пост особенно полезен. Читайте полное описание задачи и регистрируйтесь вот тут.

نمایش همه...

🤯 51👍 17🔥 6🤔 3❤ 2

Photo unavailableShow in Telegram

Как автоматизировать любой ETL-процесс? Излечение данных из различных источников, преобразование и приведение к единому виду, очистка пропусков, ошибок и выбросов, загрузка в другую среду... Все это этапы ETL-процесса, с ними встречался каждый из нас. Если источник один и случай разовый, ETL можно автоматизировать с помощью Python. Но когда у вас много различных сорсов данных и пайплайнов, поддерживать кучу скриптов становится сложно и трудозатратно. Есть другой, более удобный вариант: использовать специальные программы. Например, Loginom. Этой платформой пользуются Альфа Капитал, ВСК, Инвитро и другой российский бизнес. Она действительно очень удобная: ➡️В Loginom интуитивный интерфейс с графическим конструктором, в котором можно в формате low-code формировать сложные процессы ETL. ➡️Широкий спектр инструментов для любого этапа обработки информации и масштабируемость, которая позволяет работать как с небольшими данными, так и с настоящей Big Data. ➡️И, конечно, безопасность. Данные хорошо защищены благодаря возможностям контроля доступа и шифрования. В общем, если искали современный инструмент, который будет отвечать всем хотелкам ваших процессов, то Loginom – верный выбор. Узнать подробнее о продукте можно по ссылке.

نمایش همه...

🤨 9👍 2❤ 2😐 1

Photo unavailableShow in Telegram

Microsoft и Apple в последние дни в статейном ударе. Подборка свежих интересных папир от них: ➡️ SpreadsheetLLM. Первое место в разделе Daily Papers на HF cегодня. Модель для работы с электронными таблицами. Основным достижением стал энкодер, который помогает эффективно скармливать LLM-ке таблицу в сжатом виде. С помощью такого энкодера можно обрабатывать большие таблицы, а перформанс при этом на 25,6 % выше стандарта GPT4. ➡️ MUSCLE. Топ-4 в Daily Papers. Вы замечали, что когда обновляются LLM, они могут начинать отвечать бредово на вопросы, с которыми легко справлялась предыдущая версия? Это потому что разработчики фокусируются на общем перформансе, а не на совместимости. Эта работа предлагает решение в виде: а) новой метрики, которая оценивает вот такую совместимость; б) стратегии обучения со "встроенной" моделью совместимости, которая не дает новой версии регрессировать относительно предыдущей. ➡️ Arena Learning. Что-то на GANском. Модель X (послабее, та, которую мы хотим затюнить) конкурирует в ответах с какой-нибудь SOTA, а третья модель (тоже какая-нибудь сильная) выступает в роли судьи и выбирает победителя. Каждый такой "диалог" – это данные для RL для обучения модели X, то есть предложенная схема это ничто иное как замена дорогого и долгого RLHF. Обновляем статейный бэклог 🕺

نمایش همه...

❤ 27👍 7 3❤‍🔥 1🔥 1🗿 1

00:39

Video unavailableShow in Telegram

⚙️ Там вышла интересная библиотека gpu.cpp для проведения GPU-вычислений на С++. По сути, это набор удобных инструментов, которые помогают легким движением руки добавить код на GPU в проекты. Поддерживаются модули Nvidia, Intel, AMD. Ожидается, что сборки с gpu.cpp будут выполняться не более двух секунд даже на среднем железе. Либа опенсурсная, код лежит тут.

نمایش همه...

shadertui.mp42.50 MB

👍 35❤ 5⚡ 3🔥 3

Photo unavailableShow in Telegram

В далеком 2019 году чемпион мира по Go Ли Седоль проиграл алгоритму AlphaGo. Прошло 5 лет, и теперь Ли читает лекции об опасностях ИИ В 2019 Седоль так и не смог справиться с горечью поражения машине, и закончил свою карьеру из-за AlphaGo. "Весь мой мир тогда рухнул" – сказал 41-летний кореец в своем свежем интервью с New York Times. Сейчас он занимается тем, что читает лекции школьникам и студентам о потенциальных опасностях ИИ. Он говорит, что из-за ИИ мировая система ценностей поворачивает не туда, и советует молодым людям осваивать только те профессии, которые труднее всего автоматизировать. Вот такая история. Кстати, шахматисты Гарри Каспаров и Магнус Карлсен тоже проигрывали AlphaGo, но оказались менее обидчивыми. Они, наоборот, утверждают, что AlphaGo не только не вредит шахматам, но и очень полезен.

نمایش همه...

😁 83👍 16❤ 10😐 1👀 1 1

Photo unavailableShow in Telegram

⚡️ Xiaomi открывает новую фабрику вообще без людей. Xiaomi Smart Factory первая такая в своем роде, она будет находиться в Чанпине. Завод будет работать круглосуточно, скорость сборки составит один смартфон в секунду (86к/сутки!). Контроль качества полностью ляжет на ИИ. С – смелость

نمایش همه...

🔥 66🤯 29👍 9😁 3❤ 1

Photo unavailableShow in Telegram

Кстати про llama3: там TogetherAI выпустили классный кодовый туториал по файнтюнингу В примере они дотюнили Llama-3-8B для математических задач и в итоге увеличили точность с 47% до 65%, а это почти что GPT-4o. Туториал пошаговый, весь код уже готов, останется только загрузить свои данные. Вот за что мы любим опенсорс

نمایش همه...

🔥 40👍 11😁 5❤ 4🗿 1

00:27

Video unavailableShow in Telegram

На видео любитель запускает Llama3 8B на домашнем кластере, состоящем из iPhone 15 Pro Max, iPad Pro, MacBook Pro, NVIDIA GeForce 3080 и 2x NVIDIA Titan X Pascal. Весь код тут, включая код для iOS, так что можно повторить 😏

نمایش همه...

IMG_2144.MP45.22 MB

🤯 66🔥 19❤ 4🏆 2

یک طرح متفاوت انتخاب کنید

طرح فعلی شما تنها برای 5 کانال تجزیه و تحلیل را مجاز می کند. برای بیشتر، لطفا یک طرح دیگر انتخاب کنید.