fa
Feedback
Machinelearning

Machinelearning

رفتن به کانال در Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

نمایش بیشتر

📈 تحلیل کانال تلگرام Machinelearning

کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 295 152 مشترک است و جایگاه 332 را در دسته فناوری و برنامه‌ها و رتبه 1 278 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 295 152 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 25 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -6 406 و در ۲۴ ساعت گذشته برابر -274 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 7.97% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.53% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 23 518 بازدید دریافت می‌کند. در اولین روز معمولاً 16 322 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 183 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 26 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

295 152
مشترکین
-27424 ساعت
-1 5477 روز
-6 40630 روز
آرشیو پست ها
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumi
+2
💡 Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers Lumina-T2X - новое семейство диффузионных моделей, способных преобразовывать текст в: изображения, динамичные видео с любым разрешением и длительностью, 3D модели и речь с минимальными вычислительными затратами.. В основе Lumina-T2X лежит большой диффузионный Flow-based трансформер (Flag-DiT), который поддерживает до 7 миллиардов параметров и длины контекста в 128 000 токенов. ▪Github: https://github.com/alpha-vllm/lumina-t2xPaper: https://arxiv.org/abs/2405.05945Demo: https://lumina.sylin.host/ @ai_machinelearning_big_data

🔦 IC-Light: Imposing Consistent Light 💡 IC-Light - это новый интересный проект для реалистичного управления освещением. Внутри два типа моделей: модель изменения освещения с из тектовых промптов и модель изменения подсветки фона изображений. ▪Github: https://github.com/lllyasviel/IC-LightJupyter: https://github.com/camenduru/IC-Light-jupyterDemo: https://huggingface.co/spaces/lllyasviel/IC-Light @ai_machinelearning_big_data

⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threa
⚡️ Google Threat Intelligence — AI-решение в сфере кибербеза Google представила новое решение в сфере кибербезопасности Threat Intelligence, которое позволит клиентам «получать ценную информацию и защищать корпоративную IT-инфраструктуру от угроз быстрее, чем когда-либо прежде», используя аналитические данные подразделения кибербезопасности Mandiant, службы анализа угроз VirusTotal в сочетании с возможностями ИИ-модели Gemini AI. «Бесспорно, что сегодня Google обеспечивает два наиболее важных столпа анализа угроз в отрасли — VirusTotal и Mandiant. Интеграция обоих в единое предложение, дополненное ИИ и анализом угроз Google, предлагает командам безопасности новые средства для использования актуальных сведений об угрозах для лучшей защиты своих организаций», — отметил Дэйв Грубер (Dave Gruber), главный аналитик Enterprise Strategy Group. Google отметила, что основным преимуществом Threat Intelligence является предоставление специалистам по безопасности ускоренной аналитики за счёт использования генеративного ИИ. Задействованная в решении большая языковая модель Gemini 1.5 Pro, по словам Google, сокращает время, необходимое для анализа вредоносного ПО и раскрытия его исходного кода. Компания отметила, что вышедшей в феврале версии Gemini 1.5 Pro потребовалось всего 34 секунды, чтобы проанализировать код вируса WannaCry, программы-вымогателя, с помощью которой хакеры в 2017 году атаковали множество компаний по всему миру. Также Gemini позволяет ускорить сбор информации о хакерской группе, её целях, тактике взлома и связанных с ней деталях. Кроме того, Gemini обеспечивает обобщение отчётов об угрозах на естественном языке в Threat Intelligence, что позволяет компаниям оценить, как потенциальные атаки могут на них повлиять, и расставить приоритеты, на чём следует сосредоточиться. 📎 Подробнее 🟡 Демонстрация @ai_machinelearning_big_data

⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент Y
+7
⚡️ You Only Cache Once: Decoder-Decoder Architectures for Large Language Models Microsoft только что представили инструмент You Only Cache Once: Decoder-Decoder : архитектура Decoder-Decoder для больших языковых моделей YOCO существенно снижает потребление памяти GPU и состоит из двух компонентов - cross decoder'а, объединенного с self-decoder'ом. Self-decoder кодирует глобальные кэши значений ключей (KV), которые повторно используются cross decoder'ом с механизмом cross-attention. Результаты экспериментов показывают, что YOCO достигает более высокой производительности по сравнению с архитектурой Трансформеров при различных настройках масштабирования размера модели и количества обучающих токенов, подробнее тут. ▪Github: https://github.com/microsoft/unilm/tree/master/YOCOABS: https://arxiv.org/abs/2405.05254 @ai_machinelearning_big_data

🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, но
🧬 AlphaFold 3 predicts the structure and interactions of all of life’s molecules Google DeepMind представили Alpha Fold3, новую модель искусственного интеллекта, которая предсказывает структуру и взаимодействия молекул. Благодаря точному прогнозированию структуры белков, ДНК, РНК и многого другого, а также того, как они взаимодействуют, наше понимание биологического мира может выйти на новый уровень, а в практическом применение поможет разработке новых лекарств. Эта революционная модель, может предсказывать структуру и взаимодействия всех молекул жизни с беспрецедентной точностью. На основе входного списка молекул Alpha Fold3 генерирует их общую трехмерную структуру, показывая, как они сочетаются друг с другом. Программа моделирует крупные биомолекулы, такие как белки, ДНК и РНК, а также небольшие молекулы, также известные как лиганды. Кроме того, Alpha Fold3 может моделировать химические модификации этих молекул, которые контролируют здоровое функционирование клеток, нарушение которых может привести к различным заболеваниям. https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ @ai_machinelearning_big_data

🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для
+2
🚀 На Хабре вышел гайд о том, как внедрять YandexGPT API в свои продукты Команда AllSee показала, как они реализовали SDK для быстрой интеграции YandexGPT в python-приложение. Попутно показали, что модель даёт похожий на ChatGPT результат по метрикам, но при этом её дешевле использовать в своих проектах. Пользуйтесь ) ▪️ Habr: https://habr.com/ru/articles/812979/ @ai_machinelearning_big_data

🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распозна
+7
🔉 AudioSeal is the state of art audio watermarking model Audio Seal - это SOTA для добавления метаданных на аудио и распознавания их, предназначенная для разработанный специально для локального распознавания речи, сгенерированной искусственным интеллектом. Инструмент прост в настройке и работает молниеносно. Audioseal обеспечивает самые современные характеристики распознавания как естественной, так и синтетической речи, обеспечивает незначительное изменение качества сигнала и устойчив ко многим типам редактирования аудио. Audioseal значительно превосходит существующие модели по скорости обнаружения.
pip install audioseal
Github: https://github.com/facebookresearch/audiosealPaper: https://arxiv.org/abs/2401.17264Colab: https://colab.research.google.com/github/facebookresearch/audioseal/blob/master/examples/colab.ipynbHF: https://huggingface.co/facebook/audioseal #audio @ai_machinelearning_big_data

🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуаль
🌟 Introduction to Granite Code Models IBM выпустили Granite Code Models: семейство моделей Open Foundation для интеллектуального анализа и генерации кода Все модели Granite Code выпущены под лицензией Apache 2.0. Модели Granite превосходят модели с открытым исходным кодом по всем параметрам. На рисунке показано, как Granite-8B-CodeBase превосходит Mistral-7B, LLama-3-8B и другие модели с открытым исходным кодом в трех задачах кодинга. Полные оценки можно найти здесь. Модели отлично справляются с задачами генерации кода, исправления багов объяснения кода, генерации документации к кода. - Размер моделей варьируется от 3B до 34B параметров - Обученных на 3-4 тыс. токенах, полученных из 116 языков программирования ▪Github: https://github.com/ibm-granite/granite-code-modelsPaper: https://arxiv.org/abs/2405.04324HF: https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330 #llm #codegeneration @ai_machinelearning_big_data

➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы
➡ Новости: теперь вы можете публиковать свои модели прямо из Keras API с Kaggle или hugging! Вот руководство по началу работы на любой из платформ → https://developers.googleblog.com/en/publish-your-keras-models-on-kaggle-and-hugging-face/ @ai_machinelearning_big_data

Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс,
Эффективный метод быстрого освоения ChatGPT. Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени. Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам: - находить ошибки и оптимизировать код - генерировать посты в Телеграме - создавать заголовки для рекламы - делегировать рутинные задачи нейронке Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей. Бесплатный доступ предоставляется сразу после регистрации. Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8K921a

💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, которы
+3
💥 New tools to help researchers study content authenticity by OpenAi OpenAi запускает для тестов новый классификатор, который поможет идентифицировать контент, созданный DALLE 3. В этом году они уже начали добавлять метаданные CPAN ко всем изображениям, созданным и отредактированным DALE 3, в ChatGPT и OpenAI API. Они также планируют интегрировать метаданные C2PA для Sora, когда модель будет выпущена. ▪ Почитать подробнее можно здесь #openai @ai_machinelearning_big_data

🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM
🌟 TrustLLM для оценивания ответов LLM TrustLLM — инструмент на Python для комплексного исследования ответов от LLM. TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие. В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.

pip install trustllm
GitHubArxivDocsProject @ai_machinelearning_big_data

🔥Machine learning Interview Questions Вопросы и ответы с собеседований. Большая, подборка вопросов и ответов с собеседований по ML, Data Science,Ai, статистике, теории вероятностей python, SQL. ML100 вопросов c собесов по машинному обучению 2024Сборник ответов с собесов по машинному обучению от FAANG, Snapchat, LinkedIn.Facebook. Вопросы по машинному обучению 2024 годGoogle руководство по прохождению собеса в 2024 годуПодготовка к собеседованию по ML: ответы на основные вопросы14 типичных вопросов с собеседования по MLВопросы для собеседования на позицию ML-инженераРешения вступительных испытаний в ШАДРешения вступительных испытаний в ШАД архивAI Interviews at Apple, OpenAI, Bloomberg & JP Morgan – What to ExpectApple Machine Learning Engineer (MLE) Interview GuideJunior ML-инженер | Выпуск 1 | СобеседованиеУспешное собеседование в Яндекс Как я проходил собеседования на Machine Learning Engineer NLP100 вопросов и ответов для интервью по NLPТоп-50 вопросов собеседований NLP Вопросы по NLP 2024 года DSМатериалы для подготовки к интервью data scienceВопросы/ответы DS100 вопросов для подготовки к собесу Data ScienceВременные ряды. Топ 50 вопросов Python100 вопросов для подготовки к собесу Python50 вопросов по PyTorch45 Вопросов с собеседований Pandas400 самых популярных вопросов-ответов для Python-разработчика. 100 вопросов видеоLeetCode Pandas AI30 вопросов промпт инжинирингу 15 вопросов по LLM и AI27 Вопросов по Chatgpt MathВопросы с собеседований по статистикеВопросы по теории вероятностиLeetCode: разные решения с кодомTop 75 Statistics Interview Questions40 вопросов по статистике с собеседований на должность Data ScientistStatistics Interview Questions & Answers for Data Scientists SQLЗадачи с собеседований SQL @ai_machinelearning_big_data

⚡️OpenDevin OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО. OpenDevin стремится повторить, улучшить и усовершенствовать Devin. Запуск OpenDevin с помощью Docker:

# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace

docker run \
    --pull=always \
    -e SANDBOX_USER_ID=$(id -u) \
    -e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
    -v $WORKSPACE_BASE:/opt/workspace_base \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -p 3000:3000 \
    --add-host host.docker.internal=host-gateway \
    ghcr.io/opendevin/opendevin:0.5
GitHubСтраничка OpenDevin @ai_machinelearning_big_data

Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров,
Pytup в Нижнем Новгороде 1 июня Вас ждёт большая конференция по Python-разработке Pytup. В программе — выступления спикеров, новости языка, актуальные кейсы экспертов и, конечно, нетворкинг. Узнаете, как создать платформу для обработки данных в вашей IT-компании или микросервис обработки геометрических данных. А ещё послушаете крутые доклады, получите ответы на вопросы и пообщаетесь со спикерами и коллегами. Зарегистрироваться на Pytup! 💛

⚡️ Quivr — "Obsidian" с ИИ Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT. Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq. Даёт возможность легко делится своей базой знаний через публичную ссылку. Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте. 🖥 GitHub 🟡 Страничка Quivr @ai_machinelearning_big_data

📌 The Possibilities of AI [Entire Talk] - Sam Altman (OpenAI) 3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте. Сложно остановиться и перестать пересматривать некоторые моменты. Вот 6 ключевых мыслей: 🟡"Мне все равно, сожжём ли мы 500 миллионов долларов или 50 миллиардов... мы создадим AGI, и это будет того стоить". 🟡"В краткосрочной перспективе все меняется меньше, чем мы думаем. В долгосрочной перспективе все изменится сильнее, чем мы думаем". 🟡"GPT-5 будет намного умнее GPT-4 в общем смысле. И я думаю, что серьезность этого утверждения недооценивается". 🟡"Глобальный доступ к вычислениям — это право человека, и наша задача — понять, как обеспечить много людей этой возможностью". 🟡"Не ко всему можно заранее подготовиться. Вы учитесь управлять стартапом во время управления стартапом". 🟡"ChatGPT в лучшем случае вызывает легкое недоумение. GPT-4 — самая тупая модель из всех, чем вы сможете пользоваться скоро... намного". ▶️ Вот этот разговор в Стэнфорде @ai_machinelearning_big_data

🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это перв
+2
🧑‍💻 StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face. Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM. StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла ! Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных. ▪Blog: https://huggingface.co/blog/sc2-instructModel: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50kCode: https://github.com/bigcode-project/starcoder2-self-align @ai_machinelearning_big_data

⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежа
⚡️ Finetuning for Text Classification Если вы ищете чем занятсья на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%. Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут. Github @ai_machinelearning_big_data

⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно
⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥 СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥 Модели постепенно становятся все совершеннее в генерации кода . Значительный достигнут для C#, Go, Python 🐍 Вместе с версией 7B они также выпустили обновленную базовую модель 2B. Наслаждайтесь! • 7B: https://huggingface.co/google/codegemma-1.1-7b-it2B: https://huggingface.co/google/codegemma-1.1-2bReport: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf @ai_machinelearning_big_data