uz
Feedback
Machinelearning

Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 295 277 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 333-o'rinni va Rossiya mintaqasida 1 275-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 295 277 obunachiga ega bo‘ldi.

24 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 346 ga, so‘nggi 24 soatda esa -267 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 7.94% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.71% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 23 454 marta ko‘riladi; birinchi sutkada odatda 16 873 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 183 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Yuqori yangilanish chastotasi (oxirgi ma’lumot 25 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

295 277
Obunachilar
-26724 soatlar
-1 5017 kunlar
-6 34630 kunlar
Postlar arxiv
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumi
+2
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumina-T2X - новое семейство диффузионных моделей, способных преобразовывать текст в: изображения, динамичные видео с любым разрешением и длительностью, 3D модели и речь с минимальными вычислительными затратами.. В основе Lumina-T2X лежит большой диффузионный Flow-based трансформер (Flag-DiT), который поддерживает до 7 миллиардов параметров и длины контекста в 128 000 токенов. ▪Github: https://github.com/alpha-vllm/lumina-t2xPaper: https://arxiv.org/abs/2405.05945Demo: https://lumina.sylin.host/ @ai_machinelearning_big_data

🔦 IC-Light: Imposing Consistent Light 💡 IC-Light - это новый интересный проект для реалистичного управления освещением. Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. ▪Github: https://github.com/lllyasviel/IC-LightJupyter: https://github.com/camenduru/IC-Light-jupyterDemo: https://huggingface.co/spaces/lllyasviel/IC-Light @ai_machinelearning_big_data

⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threa
⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threat Intelligence, которое позволит клиентам «получать ценную информацию и защищать корпоративную IT-инфраструктуру от угроз быстрее, чем когда-либо прежде», используя аналитические данные подразделения кибербезопасности Mandiant, службы анализа угроз VirusTotal в сочетании с возможностями ИИ-модели Gemini AI. «Бесспорно, что сегодня Google обеспечивает два наиболее важных столпа анализа угроз в отрасли — VirusTotal и Mandiant. Интеграция обоих в единое предложение, дополненное ИИ и анализом угроз Google, предлагает командам безопасности новые средства для использования актуальных сведений об угрозах для лучшей защиты своих организаций», — отметил Дэйв Грубер (Dave Gruber), главный аналитик Enterprise Strategy Group. Google отметила, что основным преимуществом Threat Intelligence является предоставление специалистам по безопасности ускоренной аналитики за счёт использования генеративного ИИ. Задействованная в решении большая языковая модель Gemini 1.5 Pro, по словам Google, сокращает время, необходимое для анализа вредоносного ПО и раскрытия его исходного кода. Компания отметила, что вышедшей в феврале версии Gemini 1.5 Pro потребовалось всего 34 секунды, чтобы проанализировать код вируса WannaCry, программы-вымогателя, с помощью которой хакеры в 2017 году атаковали множество компаний по всему миру. Также Gemini позволяет ускорить сбор информации о хакерской группе, её целях, тактике взлома и связанных с ней деталях. Кроме того, Gemini обеспечивает обобщение отчётов об угрозах на естественном языке в Threat Intelligence, что позволяет компаниям оценить, как потенциальные атаки могут на них повлиять, и расставить приоритеты, на чём следует сосредоточиться. 📎 Подробнее 🟡 Демонстрация @ai_machinelearning_big_data

⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент Y
+7
⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом. Self-decoder кодирует глобальные кэши значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention. Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут. ▪Github: https://github.com/microsoft/unilm/tree/master/YOCOABS: https://arxiv.org/abs/2405.05254 @ai_machinelearning_big_data

🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, но
🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул. Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение поможет разработке новых лекарств. Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям. https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ @ai_machinelearning_big_data

🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для
+2
🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для быстрой интеграции YandexGPT в python-приложение. Попутно показали, что модель даёт похожий на ChatGPT результат по метрикам, но при этом её дешевле использовать в своих проектах. Пользуйтесь ) ▪️ Habr: https://habr.com/ru/articles/812979/ @ai_machinelearning_big_data

🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распозна
+7
🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распознавания их, предназначенная для разработанный специально для локального распознавания речи, сгенерированной искусственным интеллектом. Инструмент прост в настройке и работает молниеносно. Audioseal обеспечивает самые современные характеристики распознавания как естественной, так и синтетической речи, обеспечивает незначительное изменение качества сигнала и устойчив ко многим типам редактирования аудио. Audioseal значительно превосходит существующие модели по скорости обнаружения.
pip install audioseal
Github: https://github.com/facebookresearch/audiosealPaper: https://arxiv.org/abs/2401.17264Colab: https://colab.research.google.com/github/facebookresearch/audioseal/blob/master/examples/colab.ipynbHF: https://huggingface.co/facebook/audioseal #audio @ai_machinelearning_big_data

🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуаль
🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода Все модели Granite Code выпущены под лицензией Apache 2.0. Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь. Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода. - Размер моделей варьируется от 3B до 34B параметров - Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования ▪Github: https://github.com/ibm-granite/granite-code-modelsPaper: https://arxiv.org/abs/2405.04324HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330 #llm #codegeneration @ai_machinelearning_big_data

➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы
➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/ @ai_machinelearning_big_data

Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс,
Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам: - находить ошибки и оптимизировать код - генерировать посты в Телеграме - создавать заголовки для рекламы - делегировать рутинные задачи нейронке Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ предоставляется сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a

💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, которы
+3
💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3. В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API. Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена. ▪ Почитать подробнее можно здесь #openai @ai_machinelearning_big_data

🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM
🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие. В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.

pip install trustllm
GitHubArxivDocsProject @ai_machinelearning_big_data

🔥Machine learning Interview Questions Вопросы и ответы с собеседований. Большая, подборка вопросов и ответов с собеседований по ML, Data Science,Ai, статистике, теории вероятностей python, SQL. ML100 вопросов c собесов по машинному обучению 2024Сборник ответов с собесов по машинному обучению от FAANG, Snapchat, LinkedIn.Facebook. Вопросы по машинному обучению 2024 годGoogle руководство по прохождению собеса в 2024 годуПодготовка к собеседованию по ML: ответы на основные вопросы14 типичных вопросов с собеседования по MLВопросы для собеседования на позицию ML-инженераРешения вступительных испытаний в ШАДРешения вступительных испытаний в ШАД архивAI Interviews at Apple, OpenAI, Bloomberg & JP Morgan – What to ExpectApple Machine Learning Engineer (MLE) Interview GuideJunior ML-инженер | Выпуск 1 | СобеседованиеУспешное собеседование в Яндекс Как я проходил собеседования на Machine Learning Engineer NLP100 вопросов и ответов для интервью по NLPТоп-50 вопросов собеседований NLP Вопросы по NLP 2024 года DSМатериалы для подготовки к интервью data scienceВопросы/ответы DS100 вопросов для подготовки к собесу Data ScienceВременные ряды. Топ 50 вопросов Python100 вопросов для подготовки к собесу Python50 вопросов по PyTorch45 Вопросов с собеседований Pandas400 самых популярных вопросов-ответов для Python-разработчика. 100 вопросов видеоLeetCode Pandas AI30 вопросов промпт инжинирингу 15 вопросов по LLM и AI27 Вопросов по Chatgpt MathВопросы с собеседований по статистикеВопросы по теории вероятностиLeetCode: разные решения с кодомTop 75 Statistics Interview Questions40 вопросов по статистике с собеседований на должность Data ScientistStatistics Interview Questions & Answers for Data Scientists SQLЗадачи с собеседований SQL @ai_machinelearning_big_data

⚡️OpenDevin OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО. OpenDevin стремится повторить, улучшить и усовершенствовать Devin. Запуск OpenDevin с помощью Docker:

# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace

docker run \
    --pull=always \
    -e SANDBOX_USER_ID=$(id -u) \
    -e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
    -v $WORKSPACE_BASE:/opt/workspace_base \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -p 3000:3000 \
    --add-host host.docker.internal=host-gateway \
    ghcr.io/opendevin/opendevin:0.5
GitHubСтраничка OpenDevin @ai_machinelearning_big_data

Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров,
Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг. Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами. Зарегистрироваться на Pytup! 💛

⚡️ Quivr — "Obsidian" с ИИ Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT. Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq. Даёт возможность легко делится своей базой знаний через публичную ссылку. Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте. 🖥 GitHub 🟡 Страничка Quivr @ai_machinelearning_big_data

📌 The Possibilities of AI [Entire Talk] - Sam Altman (OpenAI) 3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте. Сложно остановиться и перестать пересматривать некоторые моменты. Вот 6 ключевых мыслей: 🟡"Мне все равно, сожжём ли мы 500 миллионов долларов или 50 миллиардов... мы создадим AGI, и это будет того стоить". 🟡"В краткосрочной перспективе все меняется меньше, чем мы думаем. В долгосрочной перспективе все изменится сильнее, чем мы думаем". 🟡"GPT-5 будет намного умнее GPT-4 в общем смысле. И я думаю, что серьезность этого утверждения недооценивается". 🟡"Глобальный доступ к вычислениям — это право человека, и наша задача — понять, как обеспечить много людей этой возможностью". 🟡"Не ко всему можно заранее подготовиться. Вы учитесь управлять стартапом во время управления стартапом". 🟡"ChatGPT в лучшем случае вызывает легкое недоумение. GPT-4 — самая тупая модель из всех, чем вы сможете пользоваться скоро... намного". ▶️ Вот этот разговор в Стэнфорде @ai_machinelearning_big_data

🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это перв
+2
🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face. Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM. StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла ! Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных. ▪Blog: https://huggingface.co/blog/sc2-instructModel: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50kCode: https://github.com/bigcode-project/starcoder2-self-align @ai_machinelearning_big_data

⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежа
⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%. Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут. Github @ai_machinelearning_big_data

⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно
⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно становятся все совершеннее в генерации кода . Значительный достигнут для C#, Go, Python 🐍 Вместе с версией 7B они также выпустили обновленную базовую модель 2B. Наслаждайтесь! • 7B: https://huggingface.co/google/codegemma-1.1-7b-it2B: https://huggingface.co/google/codegemma-1.1-2bReport: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf @ai_machinelearning_big_data