en
Feedback
Machinelearning

Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Show more

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 295 152 subscribers, ranking 332 in the Technologies & Applications category and 1 278 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 295 152 subscribers.

According to the latest data from 25 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 406 over the last 30 days and by -274 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 7.97%. Within the first 24 hours after publication, content typically collects 5.53% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 23 518 views. Within the first day, a publication typically gains 16 322 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 183.
  • Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Thanks to the high frequency of updates (latest data received on 26 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

295 152
Subscribers
-27424 hours
-1 5477 days
-6 40630 days
Posts Archive
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumi
+2
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumina-T2X - новое семейство диффузионных моделей, способных преобразовывать текст в: изображения, динамичные видео с любым разрешением и длительностью, 3D модели и речь с минимальными вычислительными затратами.. В основе Lumina-T2X лежит большой диффузионный Flow-based трансформер (Flag-DiT), который поддерживает до 7 миллиардов параметров и длины контекста в 128 000 токенов. ▪Github: https://github.com/alpha-vllm/lumina-t2xPaper: https://arxiv.org/abs/2405.05945Demo: https://lumina.sylin.host/ @ai_machinelearning_big_data

🔦 IC-Light: Imposing Consistent Light 💡 IC-Light - это новый интересный проект для реалистичного управления освещением. Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. ▪Github: https://github.com/lllyasviel/IC-LightJupyter: https://github.com/camenduru/IC-Light-jupyterDemo: https://huggingface.co/spaces/lllyasviel/IC-Light @ai_machinelearning_big_data

⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threa
⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threat Intelligence, которое позволит клиентам «получать ценную информацию и защищать корпоративную IT-инфраструктуру от угроз быстрее, чем когда-либо прежде», используя аналитические данные подразделения кибербезопасности Mandiant, службы анализа угроз VirusTotal в сочетании с возможностями ИИ-модели Gemini AI. «Бесспорно, что сегодня Google обеспечивает два наиболее важных столпа анализа угроз в отрасли — VirusTotal и Mandiant. Интеграция обоих в единое предложение, дополненное ИИ и анализом угроз Google, предлагает командам безопасности новые средства для использования актуальных сведений об угрозах для лучшей защиты своих организаций», — отметил Дэйв Грубер (Dave Gruber), главный аналитик Enterprise Strategy Group. Google отметила, что основным преимуществом Threat Intelligence является предоставление специалистам по безопасности ускоренной аналитики за счёт использования генеративного ИИ. Задействованная в решении большая языковая модель Gemini 1.5 Pro, по словам Google, сокращает время, необходимое для анализа вредоносного ПО и раскрытия его исходного кода. Компания отметила, что вышедшей в феврале версии Gemini 1.5 Pro потребовалось всего 34 секунды, чтобы проанализировать код вируса WannaCry, программы-вымогателя, с помощью которой хакеры в 2017 году атаковали множество компаний по всему миру. Также Gemini позволяет ускорить сбор информации о хакерской группе, её целях, тактике взлома и связанных с ней деталях. Кроме того, Gemini обеспечивает обобщение отчётов об угрозах на естественном языке в Threat Intelligence, что позволяет компаниям оценить, как потенциальные атаки могут на них повлиять, и расставить приоритеты, на чём следует сосредоточиться. 📎 Подробнее 🟡 Демонстрация @ai_machinelearning_big_data

⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент Y
+7
⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом. Self-decoder кодирует глобальные кэши значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention. Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут. ▪Github: https://github.com/microsoft/unilm/tree/master/YOCOABS: https://arxiv.org/abs/2405.05254 @ai_machinelearning_big_data

🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, но
🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул. Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение поможет разработке новых лекарств. Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям. https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ @ai_machinelearning_big_data

🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для
+2
🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для быстрой интеграции YandexGPT в python-приложение. Попутно показали, что модель даёт похожий на ChatGPT результат по метрикам, но при этом её дешевле использовать в своих проектах. Пользуйтесь ) ▪️ Habr: https://habr.com/ru/articles/812979/ @ai_machinelearning_big_data

🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распозна
+7
🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распознавания их, предназначенная для разработанный специально для локального распознавания речи, сгенерированной искусственным интеллектом. Инструмент прост в настройке и работает молниеносно. Audioseal обеспечивает самые современные характеристики распознавания как естественной, так и синтетической речи, обеспечивает незначительное изменение качества сигнала и устойчив ко многим типам редактирования аудио. Audioseal значительно превосходит существующие модели по скорости обнаружения.
pip install audioseal
Github: https://github.com/facebookresearch/audiosealPaper: https://arxiv.org/abs/2401.17264Colab: https://colab.research.google.com/github/facebookresearch/audioseal/blob/master/examples/colab.ipynbHF: https://huggingface.co/facebook/audioseal #audio @ai_machinelearning_big_data

🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуаль
🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода Все модели Granite Code выпущены под лицензией Apache 2.0. Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь. Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода. - Размер моделей варьируется от 3B до 34B параметров - Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования ▪Github: https://github.com/ibm-granite/granite-code-modelsPaper: https://arxiv.org/abs/2405.04324HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330 #llm #codegeneration @ai_machinelearning_big_data

➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы
➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/ @ai_machinelearning_big_data

Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс,
Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам: - находить ошибки и оптимизировать код - генерировать посты в Телеграме - создавать заголовки для рекламы - делегировать рутинные задачи нейронке Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ предоставляется сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a

💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, которы
+3
💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3. В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API. Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена. ▪ Почитать подробнее можно здесь #openai @ai_machinelearning_big_data

🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM
🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие. В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.

pip install trustllm
GitHubArxivDocsProject @ai_machinelearning_big_data

🔥Machine learning Interview Questions Вопросы и ответы с собеседований. Большая, подборка вопросов и ответов с собеседований по ML, Data Science,Ai, статистике, теории вероятностей python, SQL. ML100 вопросов c собесов по машинному обучению 2024Сборник ответов с собесов по машинному обучению от FAANG, Snapchat, LinkedIn.Facebook. Вопросы по машинному обучению 2024 годGoogle руководство по прохождению собеса в 2024 годуПодготовка к собеседованию по ML: ответы на основные вопросы14 типичных вопросов с собеседования по MLВопросы для собеседования на позицию ML-инженераРешения вступительных испытаний в ШАДРешения вступительных испытаний в ШАД архивAI Interviews at Apple, OpenAI, Bloomberg & JP Morgan – What to ExpectApple Machine Learning Engineer (MLE) Interview GuideJunior ML-инженер | Выпуск 1 | СобеседованиеУспешное собеседование в Яндекс Как я проходил собеседования на Machine Learning Engineer NLP100 вопросов и ответов для интервью по NLPТоп-50 вопросов собеседований NLP Вопросы по NLP 2024 года DSМатериалы для подготовки к интервью data scienceВопросы/ответы DS100 вопросов для подготовки к собесу Data ScienceВременные ряды. Топ 50 вопросов Python100 вопросов для подготовки к собесу Python50 вопросов по PyTorch45 Вопросов с собеседований Pandas400 самых популярных вопросов-ответов для Python-разработчика. 100 вопросов видеоLeetCode Pandas AI30 вопросов промпт инжинирингу 15 вопросов по LLM и AI27 Вопросов по Chatgpt MathВопросы с собеседований по статистикеВопросы по теории вероятностиLeetCode: разные решения с кодомTop 75 Statistics Interview Questions40 вопросов по статистике с собеседований на должность Data ScientistStatistics Interview Questions & Answers for Data Scientists SQLЗадачи с собеседований SQL @ai_machinelearning_big_data

⚡️OpenDevin OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО. OpenDevin стремится повторить, улучшить и усовершенствовать Devin. Запуск OpenDevin с помощью Docker:

# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace

docker run \
    --pull=always \
    -e SANDBOX_USER_ID=$(id -u) \
    -e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
    -v $WORKSPACE_BASE:/opt/workspace_base \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -p 3000:3000 \
    --add-host host.docker.internal=host-gateway \
    ghcr.io/opendevin/opendevin:0.5
GitHubСтраничка OpenDevin @ai_machinelearning_big_data

Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров,
Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг. Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами. Зарегистрироваться на Pytup! 💛

⚡️ Quivr — "Obsidian" с ИИ Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT. Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq. Даёт возможность легко делится своей базой знаний через публичную ссылку. Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте. 🖥 GitHub 🟡 Страничка Quivr @ai_machinelearning_big_data

📌 The Possibilities of AI [Entire Talk] - Sam Altman (OpenAI) 3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте. Сложно остановиться и перестать пересматривать некоторые моменты. Вот 6 ключевых мыслей: 🟡"Мне все равно, сожжём ли мы 500 миллионов долларов или 50 миллиардов... мы создадим AGI, и это будет того стоить". 🟡"В краткосрочной перспективе все меняется меньше, чем мы думаем. В долгосрочной перспективе все изменится сильнее, чем мы думаем". 🟡"GPT-5 будет намного умнее GPT-4 в общем смысле. И я думаю, что серьезность этого утверждения недооценивается". 🟡"Глобальный доступ к вычислениям — это право человека, и наша задача — понять, как обеспечить много людей этой возможностью". 🟡"Не ко всему можно заранее подготовиться. Вы учитесь управлять стартапом во время управления стартапом". 🟡"ChatGPT в лучшем случае вызывает легкое недоумение. GPT-4 — самая тупая модель из всех, чем вы сможете пользоваться скоро... намного". ▶️ Вот этот разговор в Стэнфорде @ai_machinelearning_big_data

🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это перв
+2
🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face. Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM. StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла ! Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных. ▪Blog: https://huggingface.co/blog/sc2-instructModel: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50kCode: https://github.com/bigcode-project/starcoder2-self-align @ai_machinelearning_big_data

⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежа
⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%. Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут. Github @ai_machinelearning_big_data

⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно
⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно становятся все совершеннее в генерации кода . Значительный достигнут для C#, Go, Python 🐍 Вместе с версией 7B они также выпустили обновленную базовую модель 2B. Наслаждайтесь! • 7B: https://huggingface.co/google/codegemma-1.1-7b-it2B: https://huggingface.co/google/codegemma-1.1-2bReport: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf @ai_machinelearning_big_data