ChillHouse
Открыть в Telegram
By Alexey Moiseenkov about startups, AI, ML and consumer product building. Opinions are my own. Only about tech.
Больше5 957
Подписчики
+424 часа
+507 дней
+15030 день
Архив постов
5 957
Btw релизнули свой первый результат в рисерче.
Выкатили первые квантизованные версии моделей Qwen 3.5.
За счет совместной оптимизации квантизации и движка инференса нам удалось заметно обойти Unsloth/llama.cpp и MLX по ключевому компромиссу «качество vs скорость». На устройствах Apple от iPhone до мощных Mac модели выдаю на 40–60% больше токенов в секунду без потери качества.
Пост
hf collection
5 957
Заметил такую штуку за «успешными инвесторами и предпринимателями». Очень часто пишут советы мол: не цепляйся за ошибки слишком долго, умей проходить их или не пытайся реализовать сто идей сразу, вкладывайся в что-то одно и держи фокус. Ну вы поняли, вот эти стандартные рельсы. И следом обычно я созваниваюсь с этим человеком, у которого один из последних постов именно такой и спрашиваю че как дела. И он делает сто идей сразу, ему пофиг на людей, главное идея и так далее. Или другими словами полностью противоречит тому, что сам пишет и другим советует. Встречали?
5 957
На заметку пользователям Claude. Но вообще очень взвешенная статья вышла. Крайне не похоже, что Дарио ее смотрел.
Without that judgment, Claude is a capable assistant, but not a system that could drive AI progress on its own. It is genuinely unclear whether today’s training methods and architectures could unlock that capacity.
5 957
Наброшу в копилку про фронтир лабы. Часто в интернетах любят рассуждать про Open Weight Models. Мол скоро вот вот они догонят и всегда поджимают. Что думается мне после общения с разными людьми и какие проблемы я вижу:
• проблема таланта, как нанять команду делать небольшую или открытую модель, если норм рисерч талант в антропике получает 10м в год (реальные цифры), и это тебе еще надо compute и все такое
• допустим ты готов инвестировать в обучение людей годик другой, но тогда догонять будешь очень долго - как решить? ну надо поднимать сотку другую сразу и чилить, иначе я не очень понимаю в чем конкуретное преимущество в оффере
• но допустим ты привлекаешь апсайдом, тогда ходит такое мнение что "мол фронтир модели это 90% рынка в деньгах", откуда брать данные на обучение и RL, то есть буквально все покупают только "самое лучшее" (готовы давать рычноную премию к "модель чуть получше" - 20% больше платить или даже в 2 раза)
• условный Opus в 10 раз дороже китайских моделей и все его покупают
• в такой ситуации конкуренция усложняется еще тем, что процесс дистилляции начинают прикрывать тем самым что есть закрытые модели для индустрий и даже специальные деплой команды, которые эти модели в закрытом режиме интегрируют (см мифос, и математические модели openai). Или другими словами задистилить модель в claude code будет легко, но вот ту которая работает в банке - никак.
Все это напоминает типичную олигополию и места для OSS думаю со временем не будет за исключением определенных вертикалей или решений. Думаю что китайцы делают все открытым чтобы хотя немного данных иметь и привлекать людей. Других причин настоящих не вижу.
Ах да децентрализованный инфернес чушь.
5 957
Нашел отличный обзор про решение проблем Эрдеша. Крайне рекомендую. Ну и я уже говорил, что в целом канал топовый (хотя лайфстайл посты не мое).
То есть сейчас AI занимается тем, чем люди заниматься вряд ли могут по своей человеческой природе: систематически прочёсывает поле. Тот факт, что в этом поле обнаруживаются нерешённые задачи Эрдёша — это скорее факт о состоянии человеческой математики, чем об AI-моделях. Но, тем не менее, факт.
5 957
Вы тоже стали замечать даже когда текст/письмо/дизайн/контент по большей части сделан через ai?
5 957
Все реклама слишком долго висит. Я и забыл что последний пост такой.
Вернем рубрику прочитано, но не до конца понято.
1/ наткнулся в рамках вайбкодинга так сказать, хотя я сам не практикую особо, но занятно как люди которые вкладывают в это сотни часов потом сами думают а зачем. Есть забавное наблюдение ребят. Большая статья, но рекомендую тем кто занят этим.
2/ дваркеш стал похож на студента и зовет преподов, на этот раз про чип дизайн
3/ в любой непонятной дискуссии советую эту статью
4/ чуть чуть про игры и про игровой баланс, а то катки сливаю и злюсь
5/ мы релизнули новый сайт кстати Trymirai.com - дайте критики
6/ про продакт менеджемент, рекомендую (в эпоху аи)
5 957
Промо тайм. Меня попросили недавно, что мол даже с твоим отношением к вайбкодингу, что бы ты порекомендовал. Конечно же сходить и подумать своей головой перед тем как делать, но вот если уж прям надо, то пожалуй мои хорошие друзья делают курс по этой теме. Краткая инфа ниже:
Курс Vibecon (мне показали программу, покатит, ведь мы не ждем там курс линала или теорвера).
Что понравилось:
• 3 недели, 5 встреч, не растягивают по времени
• нормальный сетап: cursor + claude code + next.js + wispr flow
• программу пересобирают под каждый поток (потому что всё устаревает буквально за месяц, и это правда), а для учеников потом есть доступ ко всем обновлениям
По итогу. Если вы и так сами умеете учиться с ChatGPT, то это не для вас. Но если по какой-то причине так и не используйте Claude Code, то хорошая возможность начать
🗓 Старт: 26 мая
🔗 Сайт с подробностями
Ещё у них есть короткий тест, чтобы понять насколько ты сейчас "прокачан в AI". Кому интересно замерить себя – бот с квизом
5 957
Такая мысль закралась. А вам не кажется, что харнесс это технический долг, ведь там есть системы которые опираются на конкретные промты. То есть по факту мы надеемся что определенным образом сформулированная фраза даст лучший результат. Но это же меняется с каждой версией модели.
Получается, даже если модель поменялась (даже если вам квантованную вдруг подложили в API или сменили версию инференса) у вас может все разъехатся? Выходит промты и чем их больше это своего рода техннический долг и причем приличный. Поддерживать то, что не понимаешь так себе задача. В том смысле, что не имея знаний о том, что модель делает хорошо и какие данные долили сделать промты будет тяжко.
Вообще мое мнение, если модель обучили хорошенько на определенных задач влияние промта будет не такое большое. Но с другой стороны Cloudflare репортит после экспериментов на Mythos что мол харнесс наше все. Где правда не ясно, но что мне точно понятно, что делать харнессы на века без своей модели это выстрел себе в ногу.
5 957
Несколько вестей и комментариев:
1/ OpenAI решили одну из проблем Эрдеша. Это прямо хорошо. Очень хорошо. У меня не было пока времени вникать в решение, надеюсь кто-то запостит норм обзор (не из тех кто комменты давал для блога OpenAI). Но в целом многие говорили, что именно проблемы Эрдеша будут штурмовать. Так как задача по сути комбинаторная и я тут как-то писал, что в такого рода задачах где надо делать сложные глубокие гипотезы о структурах будет много прорывов. Кайф! Настоящий ассистент. Интересно много ли таких задач.
2/ На тему математики крайне рекомендую вот эту статью на Substack. Заодно если достаточно народу подпишется может туда длиннопосты буду дублировать. Статья про то, что математика создает новые способы познания и перебором говорят их не обнаружить. Или то, что доказательства не есть цели математики. Очень большой текст, кому лень прочтите с LLM.
3/ Anthropic платит xai по ярду в месяц за мощности. Норм.
4/ Карпаты перешел в претрен команду туда, где платят по ярду за мощности Илону. Явно за баблом.
5/ говорят скоро Claude mythos
5 957
Думается что самый полезный анонс на конфе гугла это конечно же осознание, что видеокарт не хватает всем. Вообще всем.
5 957
Наблюдения.
Мне каждую неделю приходят примерно 20 проектов/продуктов/команд и рассказывают, что они сделали/планируют делать и так далее. Что обычно замечаю:
1/ Дек, все материалы, блербы, письма сделаны через AI. Прям видно, что люди не читали, что сами сделали, деки по стопицот страниц, вайбкодинг фронтенды знаете с таким привкусом Claude Design (это когда попросил сделать красиво пожалуйста). И все они ожидают, что ктото в это будет вникать и изучать и более того давать деньги?
2/ Большая часть проектов не знает о существовании evals. Агент для "подставить чего-то" или улучшим вашего агента для "чего-то". Но как понять что предлагаемый подход лучше банального "скормить все chatgpt" без понятия. Хотя бы посмотрели что ли бенчи и системы оценки.
3/ Ну даже если эвалов и бенчей совсем нет, тогда за это должны платить. Иначе очень сложно понять чего делать и как оценивать то.
4/ Очень много "слопа", то есть я трачу 2-3 минуты и вижу фактические/численные ошибки в материалах. Например пишут размер рынка и там два числа перемноженных дают неверный результат. И такого просто тонна. Желание читать и разговариать с человеком, который даже не проверил что написал - нет.
5/ Все просят миллионы, и я не понимаю зачем. Все что сделано было сделано с подпиской 200 баксов в месяц. Зачем вам миллионы?
6/ Люди не знают базу. Да да, различие между харнесом и моделью, какие метрики что означают, не знают про recall etc. в задачах поиска. О чем вообще можно тогда говорить?
Складываются стойкое ощущение, что даже тексты и ответы на вопросы пишут не сами. И это печалит и именно поэтому стало тяжелее что-то сделать если думать не самому, но если своя голова на плечах сейчас лучшее время конечно!
5 957
Мне кажется ключевая ошибка многих как фаундеров, так и фондов/инвесторов это позиционирование в стиле: достичь чего-то это значит попасть в YC, speedrun, взять бабки у топ фонда.
Это такое искажение. И мне кажется люди на этом фокусируются больше чем на том что они блин делают.
Ведь главное бабки взять у топ чуваков (топовыми они конечно почти все были когда-то давно, когда деньги получить у них было посложнее, потому что денег у них было мало).
5 957
Если вы увидели где-то информацию, завлекалово, интервью о том как поднять свои первые бабки в венчуре. С проектом там или идеей. То пожалуйста проверьте эти три пункта и не слушайте перемешивателей воздуха.
Вам дадут денег на вашу идею или команду или продукт если:
1/ у вас есть трек рекорд, то есть предыдущие результаты которые известные в индустрии
2/ у вас есть метрики(измеримый трекшен) на момент привлечения денег и они слишком крутые, чтобы пройти мимо (есть еще возможность показать вау эффект - технологию, но это редкость)
3/ у вас есть нетворк богатых или крутых людей, которые вам доверяют и дадут денег
Все. Других способов поднять бабки нет. Деки, описания, советы адвайзеров и прочее это все уже следующий шаг.
Далее при прочих равных(очевидно трек рекорд убираем): деньги дадут молодому до 30, лучше 25 потому что ему легче рисковать образом жизни и временем.
Далее легче всего поднять деньги:
1/ в сша
2/ Европа/Англия
3/ все остальное
4/ Китай/корея если вы знаете язык
Делать стартап это один из самых маловероятных способов заработать денег на жизнь. Скорее убьете нервы.
5 957
Ну наконец-то понятно на что дали два ярда thinking machines
Interactive models. Если кратко моделька которая вас слушает в риал тайме и сразу там в фоне решает че надо сделать. Сама меняет поведение пока вы с ней говорите.
Радует что хоть кто-то уходит из этого убогого чат интерфейса. Наконец-то.
Видео
5 957
Пост, кого иногда читаю в телеге, не реклама:
1/ рандом канал чувака, который поясняет за матан, наткнулся в тиктоке, вспоминаю молодость
2/ Слава просто постит всякое, что я редко где вижу. Знакомы сто лет.
3/ и еще один Слава, и тоже давно знакомы, про AI
4/ когда-то всерьез хотел пойти в квант хэдж фонд, но пронесло, тем не менее интересно почитать от крутых ребят оттуда что да как
5/ а в сиолошной меня забанили потому что мол я не поклоняюсь OpenAI kekw
А вы что читаете из непопулярного?
5 957
Список так называемых неолабов, у которых в фокусе не выручка, а рисерч или около того. Оценочка под ярд и не понятно что дальше. Интересно изучить.
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
