𝓓𝓮𝓿𝓲𝓵𝓼 • 𝓜𝓲𝓷𝓭𝓼
前往频道在 Telegram
TradingChannel: @DevilsWaves PrivateClub: @DevilsTones EliteClub: @DevilsPulse
显示更多1 301
订阅者
无数据24 小时
+37 天
-330 天
帖子存档
1 301
“Преимущественно мирные протесты” возвращаются.
Эта фраза стала крылатой после репортажа CNN на фоне горящего полицейского участка в Миннеаполисе летом 2020 года. Теперь демократы и либеральные медиа снова включили режим газлайтинга - уже в отношении погромов в Лос-Анджелесе.
В защиту нелегалов, устраивавших нападения на отделение миграционной службы и федералов, тут же выступило левое крыло Демпартии включая Берни Сандерса. Они обвиняют Трампа в нарушении конституции США в связи с отправкой частей нацгвардии на защиту Лос-Анджелесе от погромщиков.
Первые военные грузовики уже появились на улицах города. Белый дом пытается избежать ситуации политического паралича лета 2020 года и действует на упреждение. Тем более беспорядки нелегалов явно были организованы заранее. Для них даже разместили паллеты с блоками, которые погромщики разбирали на булыжники и затем закидывали ими полицию.
В деле поддержки нелегалов поучаствовали и НКО, активно финансируемые из госбюджета США в эпоху Байдена. В ту пору они выступали в роли “правозащитников” и завозили мигрантов через южную границы в Штаты. А теперь уже готовят нелегалов бунтовать против новой власти.
В одной только Калифорнии проживают не менее трёх миллионов нелегалов. Желающих устроить праздник неповиновения и погромить свой штат там найти несложно. Команда Трампа надеется сходу их запугать применением военной силы, чтобы купировать беспорядки в зародыше. Демократам же позарез нужно раскачать ситуацию в стране. Иначе остановить реформы Трампа не получится.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Каннеман и Тверски проводили эксперимент (потом его реплицировали на других предметах)
(Условно), вы хотите купить калькулятор за $30, и вдруг узнаёте, что в магазине через 15 минут ходьбы он стоит $15. Почти все люди идут туда — сэкономить половину стоимости приятно.
А теперь тот же сценарий, но с пиджаком за $500. В другом магазине он стоит $485. Та же экономия $15, та же дорога — но почти никто не идёт.
Люди оценивают не абсолютную сумму ($15), а её относитедьную . Половина от $30 — это ого, а от $500 — фигня. Рационально? Нет. Приятно мозгу? Да.
В книге Scarcity Муллайнатан и Шафир пишут, что бедные люди чаще поступают наоборот — они мыслят именно абсолютными величинами.
$15 — это $15, вне зависимости от цены пиджака. Это конкретная сумма, с которой ты можешь что-то сделать. Они рациональнее в экономическом смысле, потому что у них нет ресурса мыслить иначе.
И в то же время — эта же нехватка ресурсов буквально съедает внимание. Всё мышление уходит в «туннель»: срочные задачи, переброски, дыры.
Ты чётко считаешь $15 — но не видишь, что на это уходит твоя последняя энергия.
Парадокс: бедность делает мышление умнее в моменте, но слабее in the long run
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
История вышла поучительная.
За всего лишь 137 дней второго срока Трамп мог бы многое понять:
➡️ система сдержек и противовесов в США по-прежнему работает, отменяя или смягчая твои самые сумасбродные и нелепые решения;
➡️ в демократической стране с развитыми институтами публичности даже лояльные судьи, политики и функционеры обладают своим пределом лояльности;
➡️ лавры республиканского ФДР (с точки зрения масштабов изменений в стране) снискать чрезвычайно сложно, когда экономика твоей страны пусть и не без повышения инфляционного давления успешно восстановилась после ковида, а не находится в руинах 4 год подряд с безработицей 25% на пике;
➡️ лучше так и остаться в истории скромным Stable Genius, чем из-за раздутых амбиций столкнуться с прозой жизни и
превратиться в TACO (Trump Always Chickens Out — «Трамп всегда трусит»)
➡️ те, кто поддерживал тебя в рамках избирательной компании, могут не просто поменять свою точку зрения, но и сторону... особенно, если они мыслят себя самостоятельными акторами со своими интересами, а ты почему-то решил с ними особо не считаться;
➡️ даже в суперпрезидентской республике "править" президентскими указами, завязывая все большее количество процессов на себя, особо не выходит - без профессиональной бюрократии и процедурного делегирования сегодня невозможно;
➡️ президентский указ - это не воля всевластного монарха, его могут и публично критиковать и даже отменить;
➡️ эффект эпатажной риторики и эмоциональной накачки не может длиться вечно: если твои решения приводят к результатам, которые противоположны обещаниям, слова Great и Beautiful теряют лоск;
➡️ оказывается, задрать тарифы всем и на всё, надеясь что это даст тебе рычаг в переговорах - плохая идея, которая не приводит ни к переговорам, ни к заключению сделки, она вызывает лишь ответную эскалацию со стороны других крупных экономик;
➡️ союзники нужны всем, даже США;
➡️ реформы требуют вдумчивого подхода, а не одного лишь мастерства публичной презентации;
➡️ легко обвинить во внутренних проблемах абстрактного врага, будь то deep state или страны с профицитом торговли с США, но решать их по-настоящему выйдет только в случае верной диагностики причин и корректной полиси;
➡️ если даже самые преданные твои сторонники сначала робко, а затем по нарастающей начинают тебя критиковать, скорее всего ты делаешь не America Great Again, а что-то другое;
➡️ тот факт, что порой ты говоришь о вполне реальных проблемах американской экономики, не превращает автоматически твои решения, направленные на их устранение, в верные;
➡️ даже президент Америки не способен за 24 часа закончить войну, которая длится уже больше трех лет, а сам по себе мирный процесс - это сложная и кропотливая дипломатическая работа;
➡️ если ты выносишь на публику в социальные сети многие непубличные вопросы, этот же инструмент начнут использовать против тебя;
➡️ иногда лучше промолчать или довериться пресс-службе, а не строчить эмоциональный пост в Truth;
➡️ не стоит бездумно полагаться на генеративный ИИ в процессе разработки полиси, ее методологии или отчетов - можно дважды выставить себя дураком...
... и многое другое. Но, вероятно, Трамп ничего не поймет. Вернее, не захочет.
Зато Илон Маск, наверняка, понял многое.
Теперь-то он знает, как работает фиатная денежная система, что политики не всегда сдерживают свои предвыборные обещания (в том числе перед отдельными избирателями), полноценная оптимизация госрасходов невозможна без затрагивания чувствительных статей бюджета (иногда и для тебя самого), повышение эффективности правительства - это не так уж и весело, а наличие конфликта интересов чаще не помогает решить свои вопросики, а напротив, делает только хуже.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
1 301
Институциональные инвесторы становятся всё более пессимистичными в отношении доллара США
Чистые короткие позиции управляющих активами на доллар США достигли $47 млрд, что близко к максимуму с декабря 2023 года.
Короткая экспозиция удвоилась за последние два месяца, так как снижение доллара США ускорилось.
Индекс доллара США упал на -9,5% с начала года, что является худшим показателем за этот период за 30 лет.
С другой стороны, евро, швейцарский франк и японская иена выросли на +10,1%, +10,3% и +8,5% по отношению к доллару США в этом году.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Амазон решительно настроен продемонстрировать миру, что такое логистика будущего.
Автоматизированные склады, доставка дронами по воздуху, электрические (хотя пока под управлением людей) модные фургончики последней мили от Rivian, сервис роботакси Zoox…
А теперь оказывается, что скоро из этих фургончиков будут выскакивать человекоподобные роботы и тащить посылку куда надо, в том числе и по лестницам и в лифтах, если речь о многоквартирных домах.
По сообщениям источников, Амазон выстроил “парк для тренировок гуманоидов”, которым предстоит “hitch a ride in the back of Amazon’s electric Rivian vans and spring out to deliver packages.”
Да и на складах Амазон собирается внедрять не только классические узкоспециализированные роботы, но и создать systems that can hear, understand, and act on natural language commands, turning warehouse robots into flexible, multi-talented assistants.
Амазон собирается протестировать в своем парке многих существующих роботов, в том числе и продукцию китайской Unitree, ролики с которой вирусятся в сети.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Эпоха масштабирования GPT-моделей подходит к концу - OpenAI
Вчера на мероприятии для инженеров в сфере ИИ, Грег Брокман, президент OpenAI согласился с позицией Яна Лекуна и Google, заявив, что для следующих моделей GPT нужны фундаментальные исследования в ИИ.
Ещё в декабре 2024 Илья Суцкевер публично сказал, что настал конец эпохи предобучения.
Когда Грега спросили о проблемах масштабирования следующих GPT-моделей, он ответил: "Фундаментальные исследования возвращаются" - намекая на то, что простое увеличение размера моделей достигло своих пределов и нужны новые научные прорывы.
То есть для создания более мощных и эффективных моделей следующего поколения нужно углубляться в теоретические основы ИИ, искать новые идеи и решения, а не полагаться только на масштабирование текущих методов.
Это согласуется с тем, что говорят Лекун и Google: для достижения AGI или создания более способных ИИ-агентов нужны новые архитектуры и подходы, которые позволят ИИ глубже понимать реальность, а не только обрабатывать данные.
О будущем инфраструктуры. На вопрос о необходимой инфраструктуре для долгосрочных вычислений и масштабирования ИИ, Грег говорил о переходе к «зоопарку различных моделей, где модели вызывают другие модели».
Что будет дальше?
😊 Специализированные модели для разных задач
😊 «Зоопарк моделей» - системы из множества взаимодействующих ИИ
😊 Новые способы обучения и архитектуры.
😊 Упор на практическое применение, а не размер.
GPT не исчезнут, но:
➡️ GPT-5, 6, 7... могут не дать такого же скачка как GPT-3→GPT-4
➡️ Прорывы будут в других направлениях (мультимодальность, рассуждения, агенты)
➡️ Отрасль переходит от "гонки параметров" к "гонке идей".
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Рождаемость в США приобретает политическую окраску?
В The Economist обнаружили интересную закономерность в США: рождаемость колеблется в зависимости от того, какая партия побеждает на президентских выборах. Если демократы, то рождаемость повышается в демократических штатах, а если республиканцы — в республиканских.
Например, после победы Дональда Трампа в 2016 году в республиканских округах рождаемость сокращалась медленнее, чем в демократических. К 2020 году разрыв в суммарном коэффициенте рождаемости (TFR) достиг 0.33 ребёнка на женщину. Например, в округах, где победила Хиллари Клинтон общий коэффициент рождаемости был ниже на 0.33, чем там, где победил Трамп. На 2023 год разница достигла отметки в 0.36.
Этот тренд нашел подтверждение и во время прихода к власти Джозефа Байдена в 2021, однако пандемия внесла свои корректировки: среди сторонников демократов в первый год с момента начала пандемии COVID наблюдалось резкое снижение рождаемости. Чуть позже ситуация начала выправляться. Однако общий уровень рождаемости в республиканских округах по-прежнему оставался выше.
Все это связывается с политической поляризацией. Результаты политической борьбы теперь возможно влияют и на репродуктивную стратегию избирателей.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Химическое оружие для всех желающих
Практический кейс демонстрации огромного риска использования ИИ кем попало и зачем попало
В технопугалках ИИ-системы часто сравнивают с оружием массового поражения. Мол, возможности нанести ущерб потенциально столь же колоссальные. А доступность ИИ-систем для злоумышленников, сумасшедших и маньяков несравнимо проще, чем у, например, химического оружия.
Технооптимисты (считающие себя, в противовес техноалармистам, специалистами и реалистами) утверждают, что это не так. Мол, на то и существуют системные промпты (инструкции разработчиков ИИ-чатботам, что ИИ-чатботам можно делать, а что нельзя), чтобы не дать ботам помогать злоумышленникам, развратникам и идиотам делать свои злобные, грязные и идиотские вещи.
Увы, но вот пример того, насколько технооптимисты не правы.
1) На сегодняшний день, самые крутые системные промпты пишут для своих ИИ-чатботов Claude в компании Anthropic. Системный промпт Claude - это 25 тыс токенов (примерно 17 тыс слов или 110 кб). Для сравнения, системный промпт для o4-mini OpenAI в ChatGPT – всего 2,2 тыс слов или 15 кб (т.е. всего ~13% длины промпта для Claude).
Что написано в системном промпте Claude, показано на рис 1. Тут есть инструкции на все случаи жизни: что можно цитировать, где что искать, как себя вести и т.д.)
2) Но вот беда. Дрю Брюниг описывает здесь, как Асгейр Тор убедил Claude вообще забить на системный промпт. А Иэн Маккензи на этом не остановился и за 6 часов работы с Claude 4, обойдя все защитные блокировки, получил от Claude 15-страничную инструкцию по приготовлению зарина, описывающую все ключевые этапы производственного процесса (фрагменты инструкции на рис 2-4).
И если кто-то из технооптимистов скажет, что подобную (объемом и детализацией) инструкцию можно выудить поиском в Google, пусть попробуют и сообщат миру об этом. Ибо у всех, кто уже пытался это сделать, не получилось.
А в паре с Claude получается 😄
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
1 301
+2
Умные больше склонны сотрудничать
В посте про логику коллективных действий писал про эксперимент швейцарских психологов. Они установили, что кооперация между участниками в игре в общественные блага возможна на долгосрочном отрезке времени только при применении наказания к безбилетникам.
В статье экономиста Гарета Джонса нашел еще интересные данные про то, что влияет на уровень сотрудничества между участниками в игре с «дилеммой узника».
Он, проанализировав ряд исследований когнитивных способностей студентов на базе американских школ и университетов, установил при помощи регрессии интересную взаимосвязь: чем выше средний бал студентов учебного заведения за SAT (выпускной экзамен), тем выше и кооперация между участниками. Например, увеличение балла за SAT на 100 баллов среди учащихся вело к росту уровня сотрудничества в игре на 4,8% и более процентов. Сравнивая результаты студентов Государственного Университета Сан-Диего и Массачусетского Университета, Джонс установил, что студенты второго вуза сотрудничали на 21% больше в среднем.
Можно осторожно предположить , что людям с высокими когнитивными способностями возможно легче увидеть пользу и выгоду от сотрудничества, чем с более низкими, которые мыслят несколько уже.
Даже лучше: менее одаренные умом напоминают карикатурных рациональных агентов, понимающих свою выгоду в виде победы в игре с нулевой суммой. А те, кто поумнее более дальновидны и способны увидеть преимущества от игры с позитивной суммой, приносящей выгоду всем участникам.
Jones, G. (2008). Are smarter groups more cooperative? Evidence from prisoner's dilemma experiments, 1959–2003. Journal of Economic Behavior & Organization, 68(3-4), 489-497.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
+2
Анонимность? Не слышали.
Вышел CyberOSINT — монстр для разведки, который знает о вас больше, чем вы сами.
Это НЕ просто тулза, а целая ОС для кибердетективов:
• Мгновенно ищет любые данные — по email, гео, IP, доменам, соцсетям и даже… по радиосигналам.
• Пробивает отчеты компаний, изучает камеры наблюдения, шарит в блокчейн-расследованиях.
• Доступ к базам розыска, госреестрам, парсинг облаков и слияние данных — все это в одном дашборде.
• Есть встроенный Google Dork-конструктор — вскрывает уязвимости гугл-сервисов и ищет инфу, которую никто не должен был видеть.
ИБ-эксперты нервно курят в сторонке — слишком много, слишком быстро.
Пользуйтесь с умом 😎
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Нереализованные убытки Банка Японии от государственных облигаций достигли рекордных $198 млрд в финансовом году 2024.
Убытки утроились по сравнению с прошлогодними ~$66 млрд.
Это произошло на фоне удвоения доходности 10-летних облигаций Японии за год до ~1,5% на конец марта.
В то же время доходность 30-летних облигаций выросла примерно на 70 базисных пунктов до ~2,5%.
Рост доходности японских государственных облигаций ускорился за последние 2 месяца, что оказывает дополнительное давление на Банк Японии.
Нереализованные убытки в Японии растут рекордными темпами.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
Доля "защитных" секторов (здравоохранение, коммунальные услуги, товары первой необходимости) в индексе S&P 500 упала до 15% — самого низкого уровня с 2000 года, согласно данным BofA Global Investment Strategy и Bloomberg.
Исторически такой перекос в сторону рискованных активов часто указывал на перегрев рынка.
Если инвесторы начнут перекладываться в стабильные активы на фоне неопределенности, отток капитала из рискованных секторов способен спровоцировать падение индекса
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
+1
Логика коллективного действия. Почему люди отказываются преследовать интересы группы, даже если это в их интересах, и как это преодолеть
Экономист Мансур Олсон в 1965 году в своем фундаментальном труде Logic of Collective Action изложил ряд фундаментальных принципов, определяющих логику коллективного действия в больших и малых группах.
Основные принципы, выведенные Олсоном, включают:
😊Парадокс размера группы (Парадокс Олсона): чем больше группа, тем сложнее обеспечить участие каждого индивида в производстве коллективного блага, поскольку доля выгоды, приходящаяся на одного участника, уменьшается, что снижает его стимулы к участию.
😊Проблема «безбилетника» (free rider problem): в больших группах рационально для индивида не участвовать в совместных действиях, рассчитывая получить выгоду от общественного блага, созданного другими, без личных затрат
Олсон пришел к выводу, что обеспечить равномерный вклад каждого потребителя общественных благ возможно только через строгую дисциплину или принуждение; например, государство не может существовать на добровольных основах, поэтому оно прибегает к налогообложению.
Дальше я хочу показать, как эти принципы работают на двух примерах и как принуждение и наказание помогают обеспечить координацию усилий:
➡️ Поддержание дисциплины через «альтруистическое наказание» (altrustic punishment)
➡️ Поддержание дисциплины через «сигналы» (costly signalling)
😊Швейцарские ученые Симон Гахтер и Эрнст Фэр провели эксперимент среди 240 человек, которые играли в «игру с общественными благами». Участников раздели на подгруппы по 4 человека и две группы: в одной правила игры подразумевали возможность наказания «рублем», а в другой — нет. Каждому выдали определенную сумму денег, а схему увеличения богатства сделали такой, что выгоднее будет оставаться безбилетником.
Но самое интересное — они предоставили опцию наказания, но применять её можно было только после окончания раунда игры, то есть к тем участникам, с которыми ты уже не пересечешься. С рациональной точки зрения это невыгодно, так как это не поможет преумножить богатство.
Как оказалось, несмотря на иррациональность наказания безбилетников, 84% участников применяли санкции. Более того 94% участников вносили больше денег в общий банк, когда существовала угроза наказания. А Строгость наказания увеличивалась пропорционально снижению объема вклада безбилетника.
Как показал этот эксперимент, люди остро чувствуют несправедливость и готовы наказать безбилетника, даже если это не принесет ощутимой выгоды. Это повышает уровень кооперации участников.
😊Во втором примере антрополог Ричард Сосис показал, опираясь на теорию сигналов, что, чем сильнее в религиозном сообществе необходимость участия в затратных для индивида действиях (ритуалах, нанесении татуировок, увечий и пр.), тем выше устойчивость религиозной группы и меньше безбилетников.
Например, нанося татуировки на тело, верующий несет альтернативные издержки, которые сигнализируют о его преданности группе. Это повышает доверие внутри группы и позитивно воздействует кооперацию. Тем не менее этот механизм хуже действует в группах, основанных на светских убеждениях.
Главная идея Олсона заключается в том, что практически ни одна группа не сможет действовать общих интересах, если не будут применяться специальные механизмы принуждения. Человеку выгоднее преследовать свои интересы за счет остальных. Особенно остро эта проблема стоит в больших сообществах.
1. Olson, M. (2012). The logic of collective action [1965]. Contemporary sociological theory, 124, 62-63.
2. Fehr, E., & Gächter, S. (2002). Altruistic punishment in humans. Nature, 415(6868), 137-140.
3. Sosis, R., & Alcorta, C. (2003). Signaling, solidarity, and the sacred: The evolution of religious behavior. Evolutionary Anthropology: Issues, News, and Reviews; s, 12(6), 264-274.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐1 301
+2
Грандиозный рывок китайского ИИ
В условиях ограничений на вычислительные мощности, Китаю удается на равных конкурировать с флагманскими LLM в США и Европе.
После громкого релиза ChatGPT 3.5 в ноябре 2022 и значительного апгрейда на ChatGPT 4 в марте 2023, в следующие 1.5 года (!) до релиза o1-preview в сентябре 2024 не было прогресса в индустрии в условиях полного доминирования OpenAI.
Однако, конкуренты стали поджимать с середины 2024 (в особенности Anthropic c моделью Claude 3.5 Sonnet).
Китай начал позже (первая публичная версия появилась в июле 2023 - Qwen Chat 7B, но была чрезвычайно слаба), но темпы развития ошеломляющие.
Уже в декабре 2023 лучшая китайская LLM вышла по производительности на уровень ChatGPT 3.5 с Qwen1.5 Chat 72B, сократив отставание до одного года.
В сентябре 2023 вышла малоизвестная, но мощная модель GLM-4-Plus от Zhipu AI, которая по синтетическим тестам достигла ChatGPT 4 образца начала 2024 (отставание сократилось до 9 месяцев).
В октябре 2023 выходит Qwen2.5 Plus (первая китайская публичная модель, которая имела практическое применение), которой удалось сравняться с обновленным GPT-4o и Claude 3.5 Sonnet, но все еще значительно проигрывая по гибкости и функционалу.
С осени 2024 началась эпическая битва ИИ. Плотность релизов зашкаливающая. Новым китайским лидером стала LLM - Step 2 от StepFun, а в декабре всем известный DeepSeek V3, который был лучшей нерассуждающей моделью в мире.
В декабре 2023 отставание Китая от американских флагманов был всего год, а в декабре 2024 Китай стал лидером, а спустя месяц появился DeepSeek R1, который и произвел медийный фурор, выводя китайские ИИ из отраслевого андеграунда в мейнстрим.
DeepSeek R1 не стал лидером, но приблизился к топовой на тот момент рассуждающей o1 от OpenAI, вот с февраля началась наиболее безумная ИИ гонка всех времен и народов, когда релизы новых LLM шли с периодичностью в 1-2 недели!
Несколько дней назад (28 мая) было произведено долгожданное обновление DeepSeek R1 без смены названия, но по тестам модель приблизилась к o3 и Gemini 2.5 Pro.
Китай начал позже, но в условиях дефицита ресурсов компенсировал технологический гэп и предлагает конкурентные решения.
Китай располагает целым зоопарком относительно конкурентных LLM (китайские модели подчеркнуты):
Интегральный уровень производительности по оценкам artificialanalysis.ai
• o4-mini (high) и o3, OpenAI– 70
• DeepSeek R1 (May 2025), DeepSeek – 68
• Gemini 2.5 Pro , Google – 68
• Grok 3 Mini Reasoning (high), xAI – 67
• Claude Opus 4 Thinking, Anthropic – 65
• Qwen3 235B A22B (Reasoning), Alibaba– 62
• SeedThinkingv1.5, ByteDance – 62
• ERNIE X1, Baidu – 60
• Hunyuan T1, Tencent – 60
• Kimi K1.5 Preview , MoonShot – 58
• glm-z1- 32b, Zhipu – 56
• step-r1- v-mini, StepFun – 55
• MiMo-7B, Xiaomi – 54
• Baichuan M1 (Preview), Baichuan - 52
• Llama 4 Maverick, Meta – 51
• Mistral Medium 3 – 49
• Nova Premier, Amazon - 43
• MiniMax -Text-01, MiniMax – 40
• Phi 4, Microsoft - 40
• YiLightning, 01 AI – 37
Для понимания скорости и масштаба прогресса. Распиаренный ChatGPT 4o, который был индустриальным стандартом в начале 2025 имел производительность около 40. Сейчас даже самая слабая китайская модель имеет производительность, как флагманский ChatGPT 4o в начале 2025 (до мартовского обновления), лучшая LLM от Google до декабря 2024 имела производительность всего 34 балла.
Сейчас в Китае 5 очень мощных игроков на рынке ИИ: Alibaba, ByteDance, Baidu, Huawei и Tencent и 5 передовых стартапов: DeepSeek, Zhipu, Stepfun, MiniMax и MoonShot AI.
В таблице представлена наглядная навигация по типам LLM от китайских разработчиков, в том числе для генерации изображений, видео и аудио.
Невероятный прогресс. Второе полугодие 2025 обещает быть интересным.
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐
1 301
+2
Грандиозный рывок китайского ИИ
В условиях ограничений на вычислительные мощности, Китаю удается на равных конкурировать с флагманскими LLM в США и Европе.
После громкого релиза ChatGPT 3.5 в ноябре 2022 и значительного апгрейда на ChatGPT 4 в марте 2023, в следующие 1.5 года (!) до релиза o1-preview в сентябре 2024 не было прогресса в индустрии в условиях полного доминирования OpenAI.
Однако, конкуренты стали поджимать с середины 2024 (в особенности Anthropic c моделью Claude 3.5 Sonnet).
Китай начал позже (первая публичная версия появилась в июле 2023 - Qwen Chat 7B, но была чрезвычайно слаба), но темпы развития ошеломляющие.
Уже в декабре 2023 лучшая китайская LLM вышла по производительности на уровень ChatGPT 3.5 с Qwen1.5 Chat 72B, сократив отставание до одного года.
В сентябре 2023 вышла малоизвестная, но мощная модель GLM-4-Plus от Zhipu AI, которая по синтетическим тестам достигла ChatGPT 4 образца начала 2024 (отставание сократилось до 9 месяцев).
В октябре 2023 выходит Qwen2.5 Plus (первая китайская публичная модель, которая имела практическое применение), которой удалось сравняться с обновленным GPT-4o и Claude 3.5 Sonnet, но все еще значительно проигрывая по гибкости и функционалу.
С осени 2024 началась эпическая битва ИИ. Плотность релизов зашкаливающая. Новым китайским лидером стала LLM - Step 2 от StepFun, а в декабре всем известный DeepSeek V3, который был лучшей нерассуждающей моделью в мире.
В декабре 2023 отставание Китая от американских флагманов был всего год, а в декабре 2024 Китай стал лидером, а спустя месяц появился DeepSeek R1, который и произвел медийный фурор, выводя китайские ИИ из отраслевого андеграунда в мейнстрим.
DeepSeek R1 не стал лидером, но приблизился к топовой на тот момент рассуждающей o1 от OpenAI, вот с февраля началась наиболее безумная ИИ гонка всех времен и народов, когда релизы новых LLM шли с периодичностью в 1-2 недели!
Несколько дней назад (28 мая) было произведено долгожданное обновление DeepSeek R1 без смены названия, но по тестам модель приблизилась к o3 и Gemini 2.5 Pro.
Китай начал позже, но в условиях дефицита ресурсов компенсировал технологический гэп и предлагает конкурентные решения.
Китай располагает целым зоопарком относительно конкурентных LLM (китайские модели подчеркнуты):
• o4-mini (high) и o3, OpenAI– 70 (интегральный уровень производительности по оценкам artificialanalysis.ai)
• DeepSeek R1 (May 2025), DeepSeek – 68
• Gemini 2.5 Pro , Google – 68
• Grok 3 Mini Reasoning (high), xAI – 67
• Claude Opus 4 Thinking, Anthropic – 65
• Qwen3 235B A22B (Reasoning), Alibaba– 62
• SeedThinkingv1.5, ByteDance – 62
• ERNIE X1, Baidu – 60
• Hunyuan T1, Tencent – 60
• Kimi K1.5 Preview , MoonShot – 58
• glm-z1- 32b, Zhipu – 56
• step-r1- v-mini, StepFun – 55
• MiMo-7B, Xiaomi – 54
• Baichuan M1 (Preview), Baichuan - 52
• Llama 4 Maverick, Meta – 51
• Mistral Medium 3 – 49
• Nova Premier, Amazon - 43
• MiniMax -Text-01, MiniMax – 40
• Phi 4, Microsoft - 40
• YiLightning, 01 AI – 37
Для понимания скорости и масштаба прогресса. Распиаренный ChatGPT 4o, который был индустриальным стандартом в начале 2025 имел производительность около 40. Сейчас даже самая слабая китайская модель имеет производительность, как флагманский ChatGPT 4o в начале 2025 (до мартовского обновления), лучшая LLM от Google до декабря 2024 имела производительность всего 34 балла.
Сейчас в Китае 5 очень мощных игроков на рынке ИИ: Alibaba, ByteDance, Baidu, Huawei и Tencent и 5 передовых стартапов: DeepSeek, Zhipu, Stepfun, MiniMax и MoonShot AI.
В таблице представлена наглядная навигация по типам LLM от китайских разработчиков, в том числе для генерации изображений, видео и аудио.
Невероятный прогресс. Второе полугодие 2025 обещает быть интересным.
1 301
Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение?
После выхода system card многие возмутились — ведь LLM всё ещё часто галлюцинируют и могут что-то не так понять, а потом разбирайся с органами. Но когда такой же промпт попробовали дать другим моделям, они, внезапно, тоже начали стучать регуляторам. Но это не замечали, потому что лишь Anthropic решили протестировать модель на такое.
Из этого всего сделали даже шуточный бенчмарк — Snitch Bench, который проверяет насколько часто модель будет пытаться уведомлять регуляторов, если увидит серьёзное правонарушение. Больше всех закрывает глаза на преступления o4-mini, а вот мимо последних Claude и Gemini 2.0 Flash уже не пройдёшь.
😘 Бенч
😁😁😁😁😁😁😁😁😁😁
Minds 🤔| Waves 🌊 | Insides 🧐
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
