ML || DL
Open in Telegram
Код, нотатки, цікаві статті на тему машинного та глибокого навчання. --- З приводу питань звертатися до: @MagnumGrizzly
Show more1 058
Subscribers
+324 hours
+77 days
-230 days
Posts Archive
1 057
Різниця між вмінням користуватися ШІ-інструментами й здатністю будувати на їх основі автономні системи — принципова. Сьогодні Україна потребує AI-архітекторів та інженерів, які проєктують і розгортають багаторівневі ШІ-системи на реальних задачах: від прогнозної аналітики до систем, що забезпечують обробку даних у складних операційних середовищах.
KSE відкриває набір до першої в Україні KSE Agentic AI Summer School — десятитижневої програми з розробки автономних ШІ-агентів для математично сильних школярів 11 класу, випускників шкіл, студентів та інженерів. 30 місць, конкурсний відбір. Заявки до 20 червня. Участь безоплатна зі стипендією в еквіваленті 600 доларів на місяць і проживанням на період навчання в Києві.
Що отримує учасник KSE Agentic AI Summer School:
• Прямий доступ до GPU-інфраструктури та агентного runtime для запуску повноцінних моделей
• Стипендію
• Проживання для учасників не з Києва
• Практика з ментором
• Реальні задачі від партнерських організацій
• Участь у Demo Day перед технічними командами, партнерами й реальними користувачами запропонованих рішень.
• Сертифікат за результатами захисту фінального проєкту
• Мови викладання: українська та англійська
Ідеальний кандидат на програму — людина, що звикла думати у формальній системі. Необов'язково програміст. Математик, фізик, інженер, аналітик, інколи економіст чи юрист, який роками працює з даними. Той, хто, побачивши задачу, не питає «як це зробити», а починає її розбирати. Самостійність — головний фільтр відбору на програму KSE Agentic AI Summer School.
Відбір конкурсний з вхідним тестуванням, онлайн-кваліфікацією та співбесідою. Старт навчання 1 липня 2026 року.
Подавайте заявку до 20 червня. За посиланням: https://university.kse.ua/agentic-ai-summer-school-2026
Контакти: csd@kse.org.ua
1 057
Андрій Карпаті випустив цікавий влог по створенню LLM Council😍
LLM Council — це проста локальна веб-програма з інтерфейсом, як у ChatGPT, але з тією різницею, що запит надсилається через Openrouter декільком LLM. Отримані відповіді перехресно оцінюються і ранжуються, і, нарешті, «модель-голова ради» формує остаточну відповідь. Для використання потрібен API-ключ OpenRouter. На платформі є безкоштовні моделі. На ваші запити відповідає рада з мовних моделей. Ідея полягає в тому, що замість того, щоб задавати питання одній LLM, ви можете об'єднати їх в «Раду моделей». Більш детально процес виглядає так: 1. Збір думок Запит надсилається всім моделям окремо, і їхні відповіді збираються. Відповіді кожної моделі відображаються в окремій вкладці, щоб можна було їх переглянути вручну. 2. Рецензування Кожна модель отримує відповіді інших моделей. При цьому ідентифікатори анонімізовані, щоб виключити «гру в улюбленців» при оцінці чужих результатів. На цьому етапі відповіді ранжуються за точністю і глибиною аналізу. 3. Підсумовуємо відповідь Головна модель приймає всі відповіді моделей і компілює їх в єдину остаточну відповідь.
1 057
Ось і під'їхала технічна карта Gemini 3.0 з бенчмарками😋
Чекаємо на офіційний реліз, має бути цікаво, а зараз деякі метрики з тех.карти:
– На багатьох бенчмарках істотно обходить GPT-5.1 і Sonnet 4.5. Особливо виділяється Humanity's Last Exam і ARC-AGI 2.
– Круті результати на бенчмарках, пов'язаних з усілякими агентськими здібностями, розумінням зображень, відео та інтерфейсів. Це багатообіцяюче.
– У кодуванні як Sonnet 4.5, щодо Gemini 2.5 Pro приріст гарний, але в цілому рівень Sonnet 4.5.
1 057
Дослідники зі Стенфорда і Цінхуа представили агента, який думає і діє одночасно 🧐
Підхід базується на основі прийняття рішень у реальному часі. У таких середовищах кожна дія має свій дедлайн: не встиг виконуєш безпечний хід за замовчуванням.
Головна ідея🙃
Поєднати миттєву реакцію і паралельне планування. Коли навколишне середовище постійно змінюється, чисто реактивні агенти діють швидко, але не зовсім логічно, а довгі планувальники більш йрозумні, але занадто повільно і часто спізнюються. Комбінація працює краще за обидва варіанти.
Новий метод називається AgileThinker🧐. Він запускає два потоки:
- швидкий — ґрунтується на часткових планах і свіжому спостереженні
- плануючий — постійно оновлює стратегію і доповнює план
Час вимірюється не секундами, а токенами, що майже ідеально корелює з реальним часом виконання.
Автори зібрали тестовий набір: Freeway, Snake і Overcooked.
Результати прості: під навантаженням і жорсткими таймінгами AgileThinker стабільно обганяє обидва базові підходи — і швидкий, і «довго думаючий».
Підсумок🙂
Це крок до агентів, які зберігають інтелект, не втрачаючи швидкість, і можуть діяти в динамічних середовищах, де зволікання дорівнює помилці.1 057
Розбираємо цікаву статтю LLMs Can Get Brain Rot 😌
Стаття про те, що моделі теж деградують від думскролінгу. Дослідники з Техасу опублікували дуже цікаву роботу, яка викликала хвилю обговорень. Вони показали, що якщо LLM почати донавчати на низькоякісних даних із соцмереж коротких, популярних, клікабельних постах, то вона починає втрачати свої когнітивні здібності. Приблизно так само, як людина втрачає увагу і пам'ять, коли занадто багато думсерфіть. Чому так: Фактично, експеримент був наступним. Взяли Llama 3 8B Instruct і почали донавчати на коротких і дуже популярних постах, у яких багато лайків, ретвітів і реплаїв; і на контенті з низькою смисловою цінністю: клікбейт, конспірологія, все таке. Після цього заміряли метрики і порівняли з результатами до донавчання. Що маємо? – Якість ризонінгу впала з 74,9 до 57,2 – Розуміння довгого контексту – з 84,4 до 52,3 – На елаймент-тестах з'ясувалося, що у моделі розвинулися нарцисизм, макіавеллізм і психопатія Навіть після додаткового тюнінгу на чистих даних деградація не зникла повністю. Але справа в тому, що ніякого глобального відкриття тут немає. Пояснюється все це простим зсувом розподілу. При донавчанні на коротких, популярних, емоційно забарвлених твітах модель бачить зовсім інший статистичний ландшафт, ніж під час вихідного претрейну на книжках, статтях тощо. Це зміщує розподіл у просторі ембеддінгів і змінює attention-патерни. Модель постійно бачить короткі тексти без логічного ланцюжка, і, природно, маски уваги починають більше фокусуватися на останніх декількох токенах і втрачати довгострокові залежності, які раніше і забезпечували якісний CoT. Градієнтна динаміка тут теж грає проти нас. Втрати просто мінімізуються за рахунок поверхневих кореляцій, а параметри, що відповідають за довгі причинно-наслідкові зв'язки, майже не отримують оновлень. Ось і виходить, що моделька втрачає здатність довго міркувати. Автори називають цей феномен thought-skipping.
1 057
Anthropic тихо випустили Claude Haiku 4.5
Anthropic тихо і без зайовшого шуму презентували міні-версію Claude нового покоління. Модель одразу додали в Claude Code, Claude для Chrome, в чаті та API. На SWE-bench модель набирає 73,3%. Це більше, ніж у Claude Sonnet 4 (72,7%). Адже цю модель випустили всього півроку тому, і вона довго вважалася SOTA для кодування. Тепер таку ж якість можна отримати втричі дешевше і вдвічі швидше. Модель перевершує Sonnet 4 в метриках на Computer Use. Загалом, це повноцінна заміна не тільки попереднього малюка Haiku 3.5, але і Sonnet 4 яка, імовірно, в кілька разів більша за кількістю параметрів.
1 057
Розбиремо найгучнішу статтю останніх днів Less is More: Recursive Reasoning with Tiny Networks від Samsung
Головне питання, як це взагалі можливо, щоб модель в 10 000 разів менша була настільки розумнішою?) – Рекурсія😋. МодельTRM багаторазово обмірковує свою відповідь, переглядає її і виправляє, перш ніж видати остаточне рішення. Процес виглядає приблизно так ○ Модель отримує умови завдання і відразу генерує якийсь грубий приклад рішення. Це не обов'язково повинна бути правильна відповідь, достатньо просто швидке припущення. ○ Далі система створює scratchpad. Туди вона записує все, що думає про завдання і свою чернетку, де помилки, що можна поліпшити, як перевірити гіпотезу. При цьому важливо розуміти, що scratchpad – це не потік токенів, як у звичайному ризонінгу. Це внутрішній прихований стан, тобто матриця або вектор, який поступово оновлюється. Іншими словами, TRM вміє думати мовчки. ○ Модель в кілька еткапів оновлює цей внутрішній стан, кожен раз звіряючись з завданням - А і вихідним прикладом - Б. Вона ніби думає, чи узгоджується поточна чернетка з умовою, де суперечності, що краще поліпшити. Після N-ої кількості ітерацій модель переписує вихідний чернеток, спираючись на свій сформований scratchpad. Але це не все. Цей процес спочатку подумай → потім виправ, повторюється кілька разів. І ось тільки після цього ми отримуємо остаточну відповідь. Кінцеві результати, звичайно, вражають: Метрики: – ARC-AGI-1 / ARC-AGI-2 – 44,6% / 7,8%. Для порівняння, у o3-mini-high – 34,5% / 3,0%. – Також модель відмінно вирішує судоку і лабіринти. Тут треба відмітити, що це не мовна модель, вона призначена тільки для алгоритмів і текстом відповідати не вміє. Проте, ідея класна. Багато разів пройтися однією і тією ж крихітною сіткою по scratchpad – це буквально як емулювати глибину великої моделі без великої моделі.
1 057
Відійдемо трохи від новин стосовно OpenAI Devday та розглянемо нобелівку з фізики 😜
Цього року присудили за відкриття в галузі квантових обчислень. Нагороду щойно отримали Джон Кларк, Мішель Деворет і Джон Мартініс. У 80-х вони вперше довели, що явища квантової механіки, які зазвичай спостерігаються тільки на мікроскопічному рівні, можуть проявлятися в повнорозмірних системах. Вони встановили, що так зване квантово-механічне тунелювання можливе на макрорівні. У їхніх експериментах використовувався надпровідний електричний ланцюг, і вчені змогли довести, що він здатний перейти зі стану без напруги в стан з напругою, проходячи через бар'єр, що в принципі неможливо для класичних об'єктів у фізичному світі. Це і є квантовий перехід тобто вся система поводиться як єдина квантова частинка, хоча містить величезну кількість електронів. Саме з цього відкриття почався весь розвиток квантових комп'ютерів, квантових криптографічних систем тощо.
1 057
Прилетіло оновлення для Claude Sonnet 4.5 та Claude Code😌
Claude Sonnet 4.5🫶 Тепер у Anthropic знову SOTA модель для кодування. Модель впевнено обганяє GPT-5 на всіх бенчмарках з програмування, на інших йдуть майже нарівні. Claude Code✌️ – Додали нове розширення для VS Code – Оновили інтерфейс терміналу – Додали команду для швидкого повернення до попереднього чекпоїнту (або на кілька кроків назад) і команду для швидкого переходу до розширеного ризонінгу – Тепер агент прямо в терміналі зможе створювати файли, таблиці та діаграми на основі ваших даних.
1 057
Repost from Ооо нейромережеве🐱
Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️
Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣
Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю параметрів. Що правда, коли справа доходить до чогось більшого, ніж просто текст (а ще й зображення/формули) Qwen все ще вище 😞
Є дві версії: 4b та 12b. Квантизована версія 12b на диво шустра — на MacBook Pro з M3 з 16 ГБ RAM видає ~11 токенів на секунду.
Ви певно спитаєте мене: котику, ну й що робити з цією моделькою? 😱😱😱
🪙 Ідеальний перекладач у парі англійська-українська і назад. Особливо враховуючи підтримку документів у LMStudio;
🪙 Якщо ви працюєте з текстом (о, це я): на наборі з 500 питань MamayLM перевершує Claude 3.7 і генерує десь на рівні з GPT-5-mini в плані лінгвістичної якості тексту. До речі, оцінював Gemini. ГЕМІНЬ!
🪙 Враховуючи, що модель мультимодальна, можна перетворювати зображення в текст (OCR) чи розшифровувати рукописи;
🪙 Ваш власний ШІ-бро, раджу оцей системний промт;
🪙 Якщо ваше прізвище починається на «Ф», а закінчується на «едоров» — то це файна заміна Gemini 2.0 Flash у чат-боті Дії, щоб не платити Google за API;
🪙 Ну і якщо ви просто фанат open source LLM, то це та ж Gemma 3, але трохи краще.
Ледь не забув посилання на моделі, у LMStudio просто вбийте
MamayLM-Gemma-3 ☕️
ооо донат на збір (лишилося 60 498.25)1 057
Google релізнули Learn Your Way
Це персоналізований репетитор, який допоможе засвоїти будь-яку тему😌. Тулза поки працює в режимі експерименту, але спробувати вже можна. Система зчитує ваші захоплення, а потім будь-яку тему пояснює так, щоб вам було зрозуміло і цікаво. Наприклад, якщо ви любите баскетбол і повинні вивчити закони Ньютона, то всі приклади починають будуватися навколо кидків і дриблінгу. Якщо ви художник і вивчаєте економіку, то все зведеться до галерейних аукціонів і арт-ринків👌. Всередині працює мультиагентна система LearnLM на базі Gemini 2.5 Pro. Навіть є спеціальний агент для малювання навчальних ілюстрацій. Що по тулзам під капотом Learn Your Way? – Створеннятмайндмепи, якщо вам зручніше сприймати інформацію візуально – Генерування аудіоуроків, якщо хочете слухати, а не читати – Малювання за допомогою інтерактивних тулзів наприклад, часові шкали, по яких можна тикати – Задавати питання і робити тести, які змінюються в залежності від того, що ви робите неправильно Модель пройшла етап тестування 📈 на 60 чиказьких студентах віком від 15 до 18 років. Їм дали 40 хвилин на те, щоб вивчити незнайому їм тему: одна група просто читала PDF-файли, інша працювала з LYW. 📉 Як підсумок через 5 днів ті, хто працював з PDF, запам'ятали матеріал на 67%, а ті, хто навчався з Learn Your Way – на 78%. Крім того, 100% студентів, які працювали з ШІ, відчували себе більш комфортно і зацікавлено під час виконання завдання.
1 057
Робимо огляд на новий метод Semantic Relative Preference Optimization для дифузійних моделях
Що таке SRPO?🔹 SRPO це відносно новий фреймворк навчання з підкріпленням для моделей text-image, створений як більш ефективна альтернатива GRPO підходам. Він робить генерацію стабільнішою, швидшою і дешевшою. Розглянемо степ бай степ👇: 1. Виконується оптимізація за допомогою Direct-Align для економії та оптимізації пам'яті. 2. Promptable Rewards: Отримуємо Promptable Rewards яка перетворюються на умовні сигнали додаючі ключові слова до промпта на основі цього підходу модель відразу підсилює реалізм без додаткового навчання. 3. На виході отримуємо reward model, яка усуває перенасичення зображень та reward hacking. У заключенні маємо👍: – Ефективність зростання продуктивності, результати за 10 хвилин на 32 GPU метрики випереджає DanceGRPO підхід\. – Підвищений рівень реалізму та естетики для FLUX.1-dev без додавання нових даних. – Відсутність reward hacking, робота з готовими reward-моделями та усунення перенасичення зображень.
1 057
⏰ Your kindly reminder: До Data Science UA Meetup менше тижня – встигни забронювати місце!
Залишилося всього 25 квитків. Тож якщо ти плануєш піти – саме час діяти, бо через декілька днів їх може вже не бути 😌
Чому варто доєднатися до нашого івенту? 👇🏻
👉🏻 Олексій Шалденко та Костянтин Здор – Co-founders компанії Wantent – розкажуть про:
🔹AI-підходи до аналізу відеоконтенту
🔹те, як агенти можуть симулювати поведінку та реакції глядачів, надаючи швидкі й масштабовані інсайти
🔹створення та використання синтетичних аудиторій
🔹глибокий аналіз атрибутів контенту (темп, кольорова гама, емоційність сцен та контекст), що дозволяє точніше прогнозувати залученість і сприйняття контенту
👉🏻 Максим Кметь – Senior AI Engineer в MacPaw – поділиться практичним досвідом про те:
🔹як мовні моделі генерують наступний токен
🔹як стратегії декодування – top-k, top-p та температура – впливають на результат
🔹як формулювати якісні запити
🔹як оцінювати відповіді за допомогою класичних метрик і підходу "LLM як суддя"
🔹як підвищувати якість генерації завдяки автоматичній оптимізації промптів
👋🏻 Чекаємо на тебе 23 вересня о 18:00 за київським часом у Києві, у БЦ Gulliver, Creative Quarter, вежа Б, 12-й поверх.
А якщо графік занадто щільний, обирай опцію перегляду в записі 😉
Available now! Telegram Research 2025 — the year's key insights 
