Куда пропал и главные новости
Понимаю, что в этом ультраплотном инфопотоке — сложно заметить, что кто-то куда-то пропал. Но я должен пару строк тем, кто заметил. Последние пару недель я выпал как из инфополя, так и из любых рабочих (да и нерабочих тоже, как этот тг-канал) циклов. Где был? Убивал ноги… Я шёл ногами, на плечах нёс рюкзак, в руке поочерёдно нёс самое дорогое. Ноги натирались и кровили, плечи уставали и болели, руки загорали и облазили. Смысл? Нет смысла. Просто вот такое приключение. Своими, натёртыми практически сразу, ногами я прошёл 373.1 км за 11 дней. Было много разного, что точно не уместить в пост. Да и незачем… В общем — дошёл. Тем, кто следил и поддерживал в инсте — отдельно спасибо❤️. Живой. Возвращаюсь.
Т.к. за это время в мире ИИ и нейросетей было несколько интересных вещей и новостей, то кратко пройдусь по тому, что вчера для себя вычленил (таймлайн с важным прикрепил к посту).
1. Конечно же Гугл и его презентация
Они представили достаточно много всего, но самые интересные штуки (для меня). Самое простое — новые модель 3.5 Flash и 3.5 Flash lite (намекает нам о будущем релизе Pro 3.5), которая действительно хороша. Работает уже в интерфейсе Gemini, К
Также важный анонс —
Gemini Spark. Облачный агент по типу таких, какие есть у конкурентов. Пока только представили, когда выйдет — неизвестно, но пишут, что «Coming soon to AI Ultra». Это очень важная штука, потому что у Гугла большая инфраструктура сервисов и огромное кол-во данных о пользователях. Поэтому данный помощник сможет быть действительно чем-то толковым. Посмотрим.
Следующее от Гугла — это, конечно, новое семейство мультимодальных генераторов видосов Omni (
ссылка ). Там очень красочно всё нам показывали. Если уместить всё в несколько слов — это как нанабанана, только для видосов. Она вроде как понимает контекст и не делает «перегенерацию»… Мы можем просто попросить добавить звук, добавить эффект, изменить сцену, изменить ракурс, ускорить, замедлить, что-то изменить и ещё 100500 любых запросов — и модель должна нас понять, не перегенерить видео рандомно, а действительно сделать точечную правку. Принимает на вход и картинки, и видосы. Генерит до 4К… В комменты добавлю 4 видео, где понятно, о чём речь, более наглядно. Также, конечно же, всё очень зацензурено, что даже с собой что-то быстро создать не получилось… Нужно мучать дальше.
2. Интеграция ChatGPT в анализ персональных финансов. Это пока только для США, но уверен, это будет распространяться и далее
Почему я отметил для себя это. Поясню грубо, что это такое — это подключаем ChatGPT к нашим банковским приложухам и всё, можно спрашивать советы по своим финансам… В будущем, скорее всего, и руководить ими. Звучит это всё настолько многогранно и эпохально, что не сразу понятно. Здесь очень много всего зарыто. Начиная от данных о деньгах пользователей, заканчивая новым трендом внедрения ИИ-моделей в нашу жизнь в долгосрочной перспективе. Это действительно визионерский шаг и партнёрство.
Сам релиз
3. У OpenAI вышло большое обновление моделей для разговора, перевода и транскрибации
У них и так были они очень хорошими (особенно для транскрибации). Поэтому обновление меня порадовало. Пока не тестировал, но почему-то уверен, что там всё хорошо. Учитывая любовь вайбожаных к надиктовке. Да и дети, я вижу, уже не печатают, то работа в этом направлении от них — реально правильный шаг. (
Ссылка на релиз)
4. Выход Qwen 3.7 Max
Здесь для меня было интересно, что Китай снова оперативно сокращает разрыв. На популярных бенчмарках лидирует почти везде, даже опережает таких крутых, как Opus 4.7. Даже если учитывать, что бенчи всегда рисуют результаты для выставления в более выгодном свете — это всё равно неплохо. Играться можно тут (
ссылка)
5. Вчерашние обновы от Runway тоже порадовали
По сути это тоже нанабанана для видео, только от Runway. Здесь даже нет особого смысла писать свои мысли. Просто хороший шаг в сторону, куда движутся все. В нише видеогенераций направленно на максимальное упрощение взаимодействия, хорошо это или плохо — увидим только со временем. (
ccыка на релиз)