Machinelearning

رفتن به کانال در Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

نمایش بیشتر

شبکه:Machinelearning روسيا1 278 فناوری و برنامه‌ها332...

📈 تحلیل کانال تلگرام Machinelearning

کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 295 152 مشترک است و جایگاه 332 را در دسته فناوری و برنامه‌ها و رتبه 1 278 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 295 152 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 25 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -6 406 و در ۲۴ ساعت گذشته برابر -274 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 7.97% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.53% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 23 518 بازدید دریافت می‌کند. در اولین روز معمولاً 16 322 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 183 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 26 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

295 152

مشترکین

-27424 ساعت

-1 5477 روز

-6 40630 روز

23 518

نمایش های پست

~ 16 32224 ساعت

~ 18 36848 ساعت

7.97%

نرخ مشارکت

~ 5

پست های در روز

Ads index

beta

آرشیو پست ها

295 156

💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumina-T2X - новое семейство диффузионных моделей, способных преобразовывать текст в: изображения, динамичные видео с любым разрешением и длительностью, 3D модели и речь с минимальными вычислительными затратами.. В основе Lumina-T2X лежит большой диффузионный Flow-based трансформер (Flag-DiT), который поддерживает до 7 миллиардов параметров и длины контекста в 128 000 токенов. ▪Github: https://github.com/alpha-vllm/lumina-t2x ▪Paper: https://arxiv.org/abs/2405.05945 ▪Demo: https://lumina.sylin.host/ @ai_machinelearning_big_data

295 156

🔦 IC-Light: Imposing Consistent Light 💡 IC-Light - это новый интересный проект для реалистичного управления освещением. Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. ▪Github: https://github.com/lllyasviel/IC-Light ▪Jupyter: https://github.com/camenduru/IC-Light-jupyter ▪Demo: https://huggingface.co/spaces/lllyasviel/IC-Light @ai_machinelearning_big_data

295 156

⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threat Intelligence, которое позволит клиентам «получать ценную информацию и защищать корпоративную IT-инфраструктуру от угроз быстрее, чем когда-либо прежде», используя аналитические данные подразделения кибербезопасности Mandiant, службы анализа угроз VirusTotal в сочетании с возможностями ИИ-модели Gemini AI. «Бесспорно, что сегодня Google обеспечивает два наиболее важных столпа анализа угроз в отрасли — VirusTotal и Mandiant. Интеграция обоих в единое предложение, дополненное ИИ и анализом угроз Google, предлагает командам безопасности новые средства для использования актуальных сведений об угрозах для лучшей защиты своих организаций», — отметил Дэйв Грубер (Dave Gruber), главный аналитик Enterprise Strategy Group. Google отметила, что основным преимуществом Threat Intelligence является предоставление специалистам по безопасности ускоренной аналитики за счёт использования генеративного ИИ. Задействованная в решении большая языковая модель Gemini 1.5 Pro, по словам Google, сокращает время, необходимое для анализа вредоносного ПО и раскрытия его исходного кода. Компания отметила, что вышедшей в феврале версии Gemini 1.5 Pro потребовалось всего 34 секунды, чтобы проанализировать код вируса WannaCry, программы-вымогателя, с помощью которой хакеры в 2017 году атаковали множество компаний по всему миру. Также Gemini позволяет ускорить сбор информации о хакерской группе, её целях, тактике взлома и связанных с ней деталях. Кроме того, Gemini обеспечивает обобщение отчётов об угрозах на естественном языке в Threat Intelligence, что позволяет компаниям оценить, как потенциальные атаки могут на них повлиять, и расставить приоритеты, на чём следует сосредоточиться. 📎 Подробнее 🟡 Демонстрация @ai_machinelearning_big_data

295 156

⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом. Self-decoder кодирует глобальные кэши значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention. Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут. ▪Github: https://github.com/microsoft/unilm/tree/master/YOCO ▪ABS: https://arxiv.org/abs/2405.05254 @ai_machinelearning_big_data

295 156

🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул. Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение поможет разработке новых лекарств. Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям. https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ @ai_machinelearning_big_data

295 156

🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для быстрой интеграции YandexGPT в python-приложение. Попутно показали, что модель даёт похожий на ChatGPT результат по метрикам, но при этом её дешевле использовать в своих проектах. Пользуйтесь ) ▪️ Habr: https://habr.com/ru/articles/812979/ @ai_machinelearning_big_data

295 156

🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распознавания их, предназначенная для разработанный специально для локального распознавания речи, сгенерированной искусственным интеллектом. Инструмент прост в настройке и работает молниеносно. Audioseal обеспечивает самые современные характеристики распознавания как естественной, так и синтетической речи, обеспечивает незначительное изменение качества сигнала и устойчив ко многим типам редактирования аудио. Audioseal значительно превосходит существующие модели по скорости обнаружения.

pip install audioseal

▪Github: https://github.com/facebookresearch/audioseal ▪Paper: https://arxiv.org/abs/2401.17264 ▪Colab: https://colab.research.google.com/github/facebookresearch/audioseal/blob/master/examples/colab.ipynb ▪HF: https://huggingface.co/facebook/audioseal #audio @ai_machinelearning_big_data

295 156

🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода Все модели Granite Code выпущены под лицензией Apache 2.0. Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь. Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода. - Размер моделей варьируется от 3B до 34B параметров - Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования ▪Github: https://github.com/ibm-granite/granite-code-models ▪Paper: https://arxiv.org/abs/2405.04324 ▪HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330 #llm #codegeneration @ai_machinelearning_big_data

295 156

➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/ @ai_machinelearning_big_data

295 156

Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам: - находить ошибки и оптимизировать код - генерировать посты в Телеграме - создавать заголовки для рекламы - делегировать рутинные задачи нейронке Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ предоставляется сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a

295 156

💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3. В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API. Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена. ▪ Почитать подробнее можно здесь #openai @ai_machinelearning_big_data

295 156

🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие. В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.


pip install trustllm

▪GitHub ▪Arxiv ▪Docs ▪Project @ai_machinelearning_big_data

295 156

295 156

⚡️OpenDevin OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО. OpenDevin стремится повторить, улучшить и усовершенствовать Devin. Запуск OpenDevin с помощью Docker:


# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace


docker run \
    --pull=always \
    -e SANDBOX_USER_ID=$(id -u) \
    -e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
    -v $WORKSPACE_BASE:/opt/workspace_base \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -p 3000:3000 \
    --add-host host.docker.internal=host-gateway \
    ghcr.io/opendevin/opendevin:0.5

▪GitHub ▪Страничка OpenDevin @ai_machinelearning_big_data

295 156

Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг. Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами. Зарегистрироваться на Pytup! 💛

295 156

⚡️ Quivr — "Obsidian" с ИИ Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT. Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq. Даёт возможность легко делится своей базой знаний через публичную ссылку. Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте. 🖥 GitHub 🟡 Страничка Quivr @ai_machinelearning_big_data

295 156

📌 The Possibilities of AI [Entire Talk] - Sam Altman (OpenAI) 3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте. Сложно остановиться и перестать пересматривать некоторые моменты. Вот 6 ключевых мыслей: 🟡"Мне все равно, сожжём ли мы 500 миллионов долларов или 50 миллиардов... мы создадим AGI, и это будет того стоить". 🟡"В краткосрочной перспективе все меняется меньше, чем мы думаем. В долгосрочной перспективе все изменится сильнее, чем мы думаем". 🟡"GPT-5 будет намного умнее GPT-4 в общем смысле. И я думаю, что серьезность этого утверждения недооценивается". 🟡"Глобальный доступ к вычислениям — это право человека, и наша задача — понять, как обеспечить много людей этой возможностью". 🟡"Не ко всему можно заранее подготовиться. Вы учитесь управлять стартапом во время управления стартапом". 🟡"ChatGPT в лучшем случае вызывает легкое недоумение. GPT-4 — самая тупая модель из всех, чем вы сможете пользоваться скоро... намного". ▶️ Вот этот разговор в Стэнфорде @ai_machinelearning_big_data

295 156

🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face. Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM. StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла ! Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных. ▪Blog: https://huggingface.co/blog/sc2-instruct ▪Model: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1 ▪Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50k ▪Code: https://github.com/bigcode-project/starcoder2-self-align @ai_machinelearning_big_data

295 156

⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%. Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут. ▪ Github @ai_machinelearning_big_data

295 156

⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно становятся все совершеннее в генерации кода . Значительный достигнут для C#, Go, Python 🐍 Вместе с версией 7B они также выпустили обновленную базовую модель 2B. Наслаждайтесь! • 7B: https://huggingface.co/google/codegemma-1.1-7b-it • 2B: https://huggingface.co/google/codegemma-1.1-2b • Report: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf @ai_machinelearning_big_data