ChillHouse
Kanalga Telegram’da o‘tish
By Alexey Moiseenkov about startups, AI, ML and consumer product building. Opinions are my own. Only about tech.
Ko'proq ko'rsatish6 032
Obunachilar
+724 soatlar
+427 kunlar
+13030 kunlar
Postlar arxiv
6 032
Заметки с полей. Мы используем кодинг агентов для всяких задач. Но именно end2end для экспериментов, поглядеть что к чему (там переписать тестовый апп с электрона на rust и тому подобное).
Так вот у меня сложилось впечатление, что fable от Anthropic это первая модель, которую надо уже думать куда натравлять. Иначе это оооочень дорого. То есть просто для себя повайбить эта штука не подходит. И мы приходим к простой мысли. Чтобы понимать куда ее направлять нужен человек, который знает и умеет. И у меня четко в голове складывается картинка и почему в лабы нанимают тоннами.
Как никогда в индустрии спрос на хард скиллы вырос жестко. Спрос на понимание, навыки, интуицию очень высокий. Ибо остальное закроет модель если надо. Но если нет навыков и понимания сгорит тонна денег. Мы увидим множество внедрений, которые провалятся не потому что модель не эффективна, а потому что human in the loop не смог.
6 032
Свежий тренд в долине. Вдруг (интересно почему же) многие осознали, что затраты на токены антропика и опенаи слишком высокие и может можно как-то уменьшить. И у гениальных людей появилась идея заделать тонну стартапов по посттрейну сеток на данных компании итд. Подняли 200м даже (конечно напишут красиво обо всем и вся что будет там как продукт).
В целом идея неплохая для Энтерпрайза. При наличии хорошей команды можно повторить на любом рынке или около того. Интересно вообще ведет себя рынок перед AIs IPO.
6 032
Помните спрашивали про децентрализованный инференс и все такое. Так сказать пища для размышления:
- вот так выглядит нормальный стек, как думаете реально заставить игроков поставить так сказать?
- в чем принципиальное отличие от обычной клауд инфры с OSs моделями? (OpenRouter?)
- ах да инференс сам по себе должен идти вместе с другими тоннами фичей
- если модели мелкие что их может хостить обычный чувак, то это значит их можно запускать локально, а значит бесплатно
- ну и да, кто блин обеспечивает SLA, поддержку, да что угодно важное для бизнеса? Правильно - никто.
И давайте никогда не пользоваться тем, где есть слово «утилити токен», нас же жизнь чему-то научила.
Но наверное поиграться кому-то может интересно.
6 032
Немного наблюдений. Про «поиск работы». Регулярно натыкаюсь на русскоязычные посты ака «я крутой, но такие дела, ищу работу». Попробую со стороны нанимающего высказать свои пять копеек:
- если кто-то очень крутой, прям безумно вау и все вот такие метафоры в комментах «ты вау», то какого извините хрена ищешь работу? Должны быть причины и если есть неконтролируемые обстоятельства именно с них я бы начал
- все эти странные чисто наши присказки: моя суперсила, лучше всего я умею видеть «прибыль/системность/собирать смыслы и превращать их в релизы И так далее» это про что? Никогда не понимал все эти абстрактные описания. Представьте что футболист своему агенту говорит «я вижу философию команды и умею понять как собрать волю в кулак и играть». Так блин все такие. Дайте что-то, что можно пощупать
- первое я сделаю это пойду возьму референсы, если позиция выше линейной, а в описании ровно про это и тогда мне все ваши «поиски смыслов и умение собрать системы» пофигу
- бывает по-разному в жизни, но всетаки необходимо свою крутость привести к измеримому руслу либо через референсы либо через метрики
- исключите свои вайбкодинг поделки пожалуйста, они показывают ваше полное не понимание рынка чаще чем наоборот
И я ни разу от кого-то на рынке сша, где типа конкуренция похлеще не видел постов в стиле «я супер крут, но дайте денег ищу работу». У меня в голове как-то эти две вещи плохо сходятся. И наверное поэтому так тут не делают.
Мои рекомендации, после просмотра тонны резюме и чтения постов и реального поиска людей к себе:
- пишите честно что делали и сделали, не украшайте, если ваша позиция не линейная
- фокус конечно же на том что важно в отклике
- уберите все суперсилы, нытье, ситуацию в жизни и долгую историю, это отбивает желание говорить (мы ведь незнакомы)
- показать желание важнее всего
- укажите кто вас может порекомендовать
6 032
Мне закинули идею, что я могу записывать миниподкасты в виде голосовых сообщений на 2-4 минуты. Сойдет как формат?
6 032
Было много работы. Но тут и новостей прикатило:
- забанили fable от антропика, там какая-то муть если честно и политика
- купили интерком за 3.6 ярда
- купили cursor окончательно за акции на 60 ярдов (получается самая дорогая покупка стартапа? Хотя пофиг)
А тем временем хорошая картинка про органические запуски без маркетинга и залива и трафлом
6 032
Btw релизнули свой первый результат в рисерче.
Выкатили первые квантизованные версии моделей Qwen 3.5.
За счет совместной оптимизации квантизации и движка инференса нам удалось заметно обойти Unsloth/llama.cpp и MLX по ключевому компромиссу «качество vs скорость». На устройствах Apple от iPhone до мощных Mac модели выдаю на 40–60% больше токенов в секунду без потери качества.
Пост
hf collection
6 032
Заметил такую штуку за «успешными инвесторами и предпринимателями». Очень часто пишут советы мол: не цепляйся за ошибки слишком долго, умей проходить их или не пытайся реализовать сто идей сразу, вкладывайся в что-то одно и держи фокус. Ну вы поняли, вот эти стандартные рельсы. И следом обычно я созваниваюсь с этим человеком, у которого один из последних постов именно такой и спрашиваю че как дела. И он делает сто идей сразу, ему пофиг на людей, главное идея и так далее. Или другими словами полностью противоречит тому, что сам пишет и другим советует. Встречали?
6 032
На заметку пользователям Claude. Но вообще очень взвешенная статья вышла. Крайне не похоже, что Дарио ее смотрел.
Without that judgment, Claude is a capable assistant, but not a system that could drive AI progress on its own. It is genuinely unclear whether today’s training methods and architectures could unlock that capacity.
6 032
Наброшу в копилку про фронтир лабы. Часто в интернетах любят рассуждать про Open Weight Models. Мол скоро вот вот они догонят и всегда поджимают. Что думается мне после общения с разными людьми и какие проблемы я вижу:
• проблема таланта, как нанять команду делать небольшую или открытую модель, если норм рисерч талант в антропике получает 10м в год (реальные цифры), и это тебе еще надо compute и все такое
• допустим ты готов инвестировать в обучение людей годик другой, но тогда догонять будешь очень долго - как решить? ну надо поднимать сотку другую сразу и чилить, иначе я не очень понимаю в чем конкуретное преимущество в оффере
• но допустим ты привлекаешь апсайдом, тогда ходит такое мнение что "мол фронтир модели это 90% рынка в деньгах", откуда брать данные на обучение и RL, то есть буквально все покупают только "самое лучшее" (готовы давать рычноную премию к "модель чуть получше" - 20% больше платить или даже в 2 раза)
• условный Opus в 10 раз дороже китайских моделей и все его покупают
• в такой ситуации конкуренция усложняется еще тем, что процесс дистилляции начинают прикрывать тем самым что есть закрытые модели для индустрий и даже специальные деплой команды, которые эти модели в закрытом режиме интегрируют (см мифос, и математические модели openai). Или другими словами задистилить модель в claude code будет легко, но вот ту которая работает в банке - никак.
Все это напоминает типичную олигополию и места для OSS думаю со временем не будет за исключением определенных вертикалей или решений. Думаю что китайцы делают все открытым чтобы хотя немного данных иметь и привлекать людей. Других причин настоящих не вижу.
Ах да децентрализованный инфернес чушь.
6 032
Нашел отличный обзор про решение проблем Эрдеша. Крайне рекомендую. Ну и я уже говорил, что в целом канал топовый (хотя лайфстайл посты не мое).
То есть сейчас AI занимается тем, чем люди заниматься вряд ли могут по своей человеческой природе: систематически прочёсывает поле. Тот факт, что в этом поле обнаруживаются нерешённые задачи Эрдёша — это скорее факт о состоянии человеческой математики, чем об AI-моделях. Но, тем не менее, факт.
6 032
Вы тоже стали замечать даже когда текст/письмо/дизайн/контент по большей части сделан через ai?
6 032
Все реклама слишком долго висит. Я и забыл что последний пост такой.
Вернем рубрику прочитано, но не до конца понято.
1/ наткнулся в рамках вайбкодинга так сказать, хотя я сам не практикую особо, но занятно как люди которые вкладывают в это сотни часов потом сами думают а зачем. Есть забавное наблюдение ребят. Большая статья, но рекомендую тем кто занят этим.
2/ дваркеш стал похож на студента и зовет преподов, на этот раз про чип дизайн
3/ в любой непонятной дискуссии советую эту статью
4/ чуть чуть про игры и про игровой баланс, а то катки сливаю и злюсь
5/ мы релизнули новый сайт кстати Trymirai.com - дайте критики
6/ про продакт менеджемент, рекомендую (в эпоху аи)
6 032
Промо тайм. Меня попросили недавно, что мол даже с твоим отношением к вайбкодингу, что бы ты порекомендовал. Конечно же сходить и подумать своей головой перед тем как делать, но вот если уж прям надо, то пожалуй мои хорошие друзья делают курс по этой теме. Краткая инфа ниже:
Курс Vibecon (мне показали программу, покатит, ведь мы не ждем там курс линала или теорвера).
Что понравилось:
• 3 недели, 5 встреч, не растягивают по времени
• нормальный сетап: cursor + claude code + next.js + wispr flow
• программу пересобирают под каждый поток (потому что всё устаревает буквально за месяц, и это правда), а для учеников потом есть доступ ко всем обновлениям
По итогу. Если вы и так сами умеете учиться с ChatGPT, то это не для вас. Но если по какой-то причине так и не используйте Claude Code, то хорошая возможность начать
🗓 Старт: 26 мая
🔗 Сайт с подробностями
Ещё у них есть короткий тест, чтобы понять насколько ты сейчас "прокачан в AI". Кому интересно замерить себя – бот с квизом
6 032
Такая мысль закралась. А вам не кажется, что харнесс это технический долг, ведь там есть системы которые опираются на конкретные промты. То есть по факту мы надеемся что определенным образом сформулированная фраза даст лучший результат. Но это же меняется с каждой версией модели.
Получается, даже если модель поменялась (даже если вам квантованную вдруг подложили в API или сменили версию инференса) у вас может все разъехатся? Выходит промты и чем их больше это своего рода техннический долг и причем приличный. Поддерживать то, что не понимаешь так себе задача. В том смысле, что не имея знаний о том, что модель делает хорошо и какие данные долили сделать промты будет тяжко.
Вообще мое мнение, если модель обучили хорошенько на определенных задач влияние промта будет не такое большое. Но с другой стороны Cloudflare репортит после экспериментов на Mythos что мол харнесс наше все. Где правда не ясно, но что мне точно понятно, что делать харнессы на века без своей модели это выстрел себе в ногу.
6 032
Несколько вестей и комментариев:
1/ OpenAI решили одну из проблем Эрдеша. Это прямо хорошо. Очень хорошо. У меня не было пока времени вникать в решение, надеюсь кто-то запостит норм обзор (не из тех кто комменты давал для блога OpenAI). Но в целом многие говорили, что именно проблемы Эрдеша будут штурмовать. Так как задача по сути комбинаторная и я тут как-то писал, что в такого рода задачах где надо делать сложные глубокие гипотезы о структурах будет много прорывов. Кайф! Настоящий ассистент. Интересно много ли таких задач.
2/ На тему математики крайне рекомендую вот эту статью на Substack. Заодно если достаточно народу подпишется может туда длиннопосты буду дублировать. Статья про то, что математика создает новые способы познания и перебором говорят их не обнаружить. Или то, что доказательства не есть цели математики. Очень большой текст, кому лень прочтите с LLM.
3/ Anthropic платит xai по ярду в месяц за мощности. Норм.
4/ Карпаты перешел в претрен команду туда, где платят по ярду за мощности Илону. Явно за баблом.
5/ говорят скоро Claude mythos
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
