AI4Dev — AI for Development

Открыть в Telegram

Что надо знать, чтобы остаться востребованным ИТ специалистом в мире с LLM? • Обзоры продуктов, фреймворков и способы взаимодействия с LLM для разработки софта • Реальные кейсы, pet и бизнес проекты с LLM • Публичные лекции В будущее берут не всех!

Больше

Россия110 264 Технологии и приложения18 560

5 242

Подписчики

+124 часа

+157 дней

+7430 день

1 117

Просмотры поста

~ 75324 часа

~ 82448 часов

21.30%

Коэффициент вовлеченности

Нет данных

Постов в день

Ads index

beta

Архив постов

5 242

Сообщения о совершенствовании архитектур базовых моделей ИИ публикуются довольно часто и мы нередко задаемся вопросом об их перспективности. Ведь авторы и обозреватели нередко заявляют о радикальных преимуществах новых алгоритмов функционирования и скором вытеснении старых добрых трансформеров. Но несмотря на реальные преимущества тех или иных решений, они в целом пока не дают видимого экономического преимущества, добавляя единицы процентов к производительности моделей. Большинство новаторских моделей с трудом продвигаются в индустрию из академических исследований. Но вот недавняя публикация компании Inception сразу задела меня, заинтересовала многих с кем я говорил, и в надежде, что свершившееся заинтересует и многих читателей канала, публикую заметку по материалам упомянутой и последовавших за этим публикаций. Более того на нашем канале запланирована моя следующая лекция, посвященная детальному анализу предложенной авторами технологии и релизу готовых моделей на ее основе. Для начала о команде. Она впечатляет : "Нас основали профессора из Стэнфорда, Калифорнийского университета в Лос-Анджелесе и Корнелла — пионеры в области диффузионного моделирования и краеугольных технологий ИИ, включая Flash Attention, Decision Transformers и Direct Preference Optimization. В нашу инженерную команду входят ветераны из Google DeepMind, Microsoft, Meta, OpenAI и NVIDIA." Так в чем корень технологии? На настоящий момент известно два основных подхода к базовому принципу генеративного ИИ - это авторегрессионная модель и диффузионная модель. Позволю себе провести аналогию с двумя техниками работы скульптора, "генерирующего" свое произведение. Есть техника лепки, когда кусочек за кусочком добавляются к уже вылепленному, а есть техника высечения, когда из бесформенного в начале куска материала путем отделения кусок за куском формируется "генерируется" произведение. Так вот первая техника - это прямая аналогия работы авторегрессионных моделей GPT, а вторая техника - аналогия работы диффузионной модели. И что же сделали в Inception? Они соединили эти две технологии и сделали Diffusion LLM. теперь текст генерируется не токен за токеном, а фильтруется как из хаоса слов по группам токенов. Эффект в скорости составляет десятки раз! Наилучшие результаты по качеству получаются при генерации программного кода, поэтому свои первые модели разработчики ориентировали на работу с кодом. Так что встречайте и пробуйте (уже есть Playground) Mercury Coder Small и Mercury Coder Mini. https://www.inceptionlabs.ai/news

5 242

Сейчас есть множество разных AI-платформ для разработки, но какую выбрать для своих задач или для проектной команды? Разберемся вместе с Александром Медведевым — fullstack-разработчиком компании Just AI. В эфире: 🟣сравним ключевые AI-платформы; 🟣посмотрим на сценарии их использования; 🟣обсудим преимущества использования AI-платформ по сравнению с прямым обращением к LLM; 🟣поговорим о трендах развития инструментов на базе AI в разработке. ⏰ Запускаем трансляцию в полдень 14 марта (пятница). Подключайтесь и задавайте вопросы Александру! Их можно оставить в чате на YouTube или в комментариях к этому посту.

5 242

В этот четверг, 13 марта, в 16:00 доктор технических наук Владимир Крылов расскажет, зачем искусственный интеллект науке. Лектор предложит авторскую интерпретацию внутренних причин появления ИИ как результата научной деятельности человека, основываясь на теории Лавлока и принципе свободной энергии Фристона. В эфире рассмотрим: 🟠акселерацию процессов проникновения методов ИИ в науку; 🟠возможности управления контролируемыми галлюцинациями, которые лежат в основе познания мира; 🟠новые ИИ-инструменты исследований и их влияние на работу научных сотрудников и на современные формализации структуры науки. Подключайтесь и задавайте вопросы лектору! Их можно оставить в чате на YouTube или в комментариях к этому посту.

5 242

Как эволюционировали технологии распознавания речи? Рассказывает Виктор Загускин — ML-руководитель платформы речевых технологий в MTS AI. В эфире разбираем: 🟠переход от классических подходов (HMM, Kaldi) к end-to-end моделям (CTC, RNN-T, Whisper, TDT); 🟠вызовы сценариев поточного распознавания, диаризации и интерактивного общения; 🟠перспективы полнодуплексных LLM и мультимодального взаимодействия. Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 242

"Почему люди создают ИИ?" — новая лекция доктора технических наук Владимира Крылова. Разбираем: 🟠принципы свободной энергии Фристона; 🟠серендипность и экзаптацию как механизмы эволюции жизни и технологий; 🟠ИИ как необходимый элемент системы гомеостаза нашей планеты. Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 242

Как внедрить искусственный интеллект в ваш веб-проект? Миша Ларченко покажет три способа интеграции ИИ-моделей с помощью JavaScript. Вы узнаете, какой вариант лучше всего подойдет для ваших задач и как избежать подводных камней при работе с нейросетями в браузере. ⚡️Миша Ларченко — опытный fullstack-разработчик, специализирующийся на backend и frontend с разными фреймворками. Работает с базами данных, облачными сервисами и архитектурами, увлекается блокчейном и LLM. Ведет одноименный YouTube-блог. Запись трансляции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 242

Ведущие европейские разработчики LLM Mistral выпустили "Mistral OCR" - модель, которая может поспособствовать развитию RAG-пайплайнов. По заявлениям производителя это самая мощная модель для распознавания документов, при этом она может работать локально... но к сожалению не Open Source. Умеет распознавать мультимодальные (текст, таблицы, pdf, презентации, формулы типа LaTeX и изображения) документы. Есть API, т.е. интегрируется в любые пайплайны (например в RAG). Точность на русском (и еще на десятке языков) языке выше 99%, т.е. выше, чем у Google Doс AI, Azure OCR или Gemini. Локальное развертывание: можно использовать на собственных серверах для защиты чувствительной информации (повторюсь, но не open source). Высокая скорость обработки: до 2000 страниц в минуту на одном узле + batch inference. Уже можно попробовать бесплатно в Le Chat, попробовать API на платформе Mistral (La Plateforme). Подробнее на сайте Mistral.

5 242

Anthropic выпустила инструмент Claude Code — агента разработчика, который работает терминале. Он умеет разбираться во всем коде (code base) и помогает кодить быстрее через команды на обычном языке. Кажется это первый агент-разработчик напрямую от производителей LLM? Ключевые возможности: • Пишет код, исправляет баги • Отвечает на вопросы об архитектуре и логике кода • Запускает и исправляет тесты • Работает с git: история, конфликты, коммиты и PR Особенности: • Работает прямо в терминале • Понимает контекст всего проекта • Выполняет реальные действия с кодом • Прямое API-соединение без промежуточных серверов Пока в бета-версии как research preview. Установка через npm: npm install -g @anthropic-ai/claude-code Анонсируют, что пригодится для изучения незнакомого кода, автоматизации git-операций и интеллектуального редактирования. UPD Пока только waitlist, так что ждем

5 242

Как эволюционировали технологии распознавания речи? Завтра, 26 февраля, в 12:00 об этом расскажет Виктор Загускин — ML-руководитель платформы речевых технологий в MTS AI. В эфире обсудим: 🟣переход от классических подходов (HMM, Kaldi) к end-to-end моделям (CTC, RNN-T, Whisper, TDT); 🟣вызовы сценариев поточного распознавания, диаризации и интерактивного общения; 🟣перспективы полнодуплексных LLM и мультимодального взаимодействия. Подключайтесь и задавайте вопросы Виктору! Их можно оставить в чате на YouTube или в комментариях к этому посту.

5 242

В дополнение к моей последней лекции

5 242

https://www.perplexity.ai/page/ai-cheats-when-losing-bpsaBgUXQPy9xftRjZv8hA

5 242

В этот четверг, 20 февраля, в 12:00 доктор технических наук Владимир Крылов расскажет, почему люди создают искусственный интеллект. Зачем тратить столько ресурсов, работая над все более совершенными моделями, которые способны решать проблемы ментальными способами? На лекции рассмотрим: 🟠принципы свободной энергии Фристона; 🟠серендипность и экзаптацию как механизмы эволюции жизни и технологий; 🟠ИИ как необходимый элемент системы гомеостаза нашей планеты. Подключайтесь и задавайте вопросы спикеру! Их можно оставить в чате на YouTube или в комментариях к этому посту.

5 242

Как внедрить искусственный интеллект в ваш веб-проект? Сегодня в 13:00 Миша Ларченко покажет три способа интеграции ИИ-моделей с помощью JavaScript, разберет их плюсы и минусы, а также расскажет, какие ограничения могут возникнуть. Вы узнаете, какой вариант лучше всего подойдет для ваших задач и как избежать подводных камней при работе с нейросетями в браузере. Миша Ларченко — опытный Fullstack-разработчик, специализирующийся на backend и frontend с разными фреймворками. Работает с базами данных, облачными сервисами и архитектурами, увлекается блокчейном и LLM. Автор одноименного YouTube-блога. Подключайтесь и задавайте вопросы спикеру! Их можно оставить в чате на YouTube или в комментариях к этому посту.

5 242

Роман Куцев — founder LLM Arena, автор канала @roma_data и выпускник ВМК МГУ — у нас в гостях! В этом видео Роман рассказал о своем детище — открытой краудсорсинговой платформе для оценки моделей на русском языке. Эта платформа позволяет любому пользователю тестировать и сравнивать LLM бесплатно. В видео узнаете: 🟣 Как работает бенчмарк LLM Arena? 🟣 Как формируется рейтинг на аренах? Насколько он справедлив? 🟣 Чем LLM Arena лучше для русскоговорящего пользователя, чем LMSYS Chatbot Arena? 🟣 Как не дать моделям обвести себя вокруг пальца? 🟣 Как подобрать лучшую модель для своих задач? Сейчас на платформе доступны 49 российских и зарубежных ИИ-моделей, можете опробовать их хоть прямо сейчас! А Роман готов ответить на ваши вопросы в комментариях⬇️

5 242

Мы перевели статью "Windsurf vs Cursor IDE: выбираем AI-редактор кода?” и запостили ее на Хабре, она довольно подробная с картинками. Автор разбирает основные фичи двух самых популярных AI IDE. Рекомендуем так же заглянуть в комментарии, там много интересного: и про использование бесплатных IDE и локальных моделей vs Claude, и про YOLO mode (режим агента) в Cursor и даже про проблемы Cline с DeepSeek

5 242

"Большие модели рассуждений. Ещё шаг в эпоху Новацена?" — новая лекция доктора технических наук Владимира Крылова. Разбираем: 🟠На что способны модели рассуждений вроде DeepSeek-R1? 🟠Как правильно сконструировать промпт для них? 🟠В чем состоят проблемы использования таких моделей? 🟠Как модель рассуждений думает без слов и как все это связано с системами сознания Канемана? Запись лекции доступна здесь и на других площадках: ➡️ YouTube ➡️ ВКонтакте ➡️ ЯндексМузыка

5 242

С 31 января 2025 года o3-mini стала доступна для подписчиков ChatGPT Plus. Вышли результаты на Livebench (это бенчмарк/платформа, которая постоянно обновляет набор задач, исключая возможность утечки решений и гарантируя, что задания остаются актуальными и интересными). На кодинге модель уверенно опережает всех. В среднем показывает лучшие результаты, чем Deep Seek R1 (за исключением математики). Первоначальные показатели по математике оказались аномально низкими, но организаторы обнаружили ошибку и пересчитали средние баллы.

5 242

А что, если совместить DeepSeek R1 и Claude? Компания Asterisk (AI Security) выпустила open source интерфейс DeepClaude, который объединяет рассуждения R1 и креативность Claude. R1 используется как архитектор - сначала запрос попадает к этой модели, а Claude как редактор кода – финальная реализация в виде кода того, что придумала R1. На бенчмарке Aider Polyglot такой подход показал интересные результаты: 1. Первое место, лучше чем DeepSeek R1, Claude и o1 2. В 14 раз дешевле, чем o1 На гитхабе: https://github.com/getasterisk/deepclaude https://deepclaude.com/ - на сайте есть deepclaude чат, но у меня он не работает. ☹️

5 242

Помните, мы все удивились новой китайской модели DeepSeek R1, которая сравнима с o1, но открытая? Ах, да, конечно помните, это же было неделю назад. Она основана на модели DeepSeek V3 (не рассуждающей). А теперь встречайте Tulu3-405B — американскую открытую модель, которая превосходит DeepSeek V3 по большинству бенчмарков (по крайней мере из тех, которые авторы указали в пресс-релизе). Разработчик: некоммерческий институт AI2 (Сиэтл) Параметры: 405B, обучение — 256 GPU По HumanEval (популярный бенчмарк на программирование с проверкой заданий юнит тестами) превосходит DeepSeek, есть дистиллированные маленькие модели - кандидаты на локальную модель для программирования, по отзывам скорости на бытовом железе скромные. На бенчмарках PopQA (вопросы по Википедии) и GSM8K (математика), обгоняя не только DeepSeek V3, но и GPT-4o с Llama 3.1. Код доступен на GitHub, Hugging Face, протестировать можно в чат-боте AI2. Рассуждать, правда, придётся самостоятельно — Tulu3 пока не умеет. Более подробный обзор: TechCrunch

5 242

В этот четверг, 30 января, в 12:00 доктор технических наук Владимир Крылов расскажет о моделях рассуждений (таких как DeepSeek R1, o1, o3), основанных на больших языковых моделях. На лекции обсудим: 🟠На что способны модели рассуждений? 🟠Как правильно сконструировать промпт для них? 🟠В чем состоят проблемы использования таких моделей? 🟠Как модель рассуждений думает без слов и как все это связано с системами сознания Канемана? Хотите узнать, как появление говорящих и рассуждающих моделей вписывается в концепцию перехода Земли от эпохи Антропоцена в эпоху Новацена? Подключайтесь!