uz
Feedback
ML || DL

ML || DL

Kanalga Telegram’da o‘tish

Код, нотатки, цікаві статті на тему машинного та глибокого навчання. --- З приводу питань звертатися до: @MagnumGrizzly

Ko'proq ko'rsatish
1 057
Obunachilar
+324 soatlar
+77 kunlar
-230 kunlar
Postlar arxiv
photo content

Різниця між вмінням користуватися ШІ-інструментами й здатністю будувати на їх основі автономні системи — принципова. Сьогодні Україна потребує AI-архітекторів та інженерів, які проєктують і розгортають багаторівневі ШІ-системи на реальних задачах: від прогнозної аналітики до систем, що забезпечують обробку даних у складних операційних середовищах. KSE відкриває набір до першої в Україні KSE Agentic AI Summer School — десятитижневої програми з розробки автономних ШІ-агентів для математично сильних школярів 11 класу, випускників шкіл, студентів та інженерів. 30 місць, конкурсний відбір. Заявки до 20 червня. Участь безоплатна зі стипендією в еквіваленті 600 доларів на місяць і проживанням на період навчання в Києві. Що отримує учасник KSE Agentic AI Summer School: •⁠ ⁠Прямий доступ до GPU-інфраструктури та агентного runtime для запуску повноцінних моделей •⁠ ⁠Стипендію •⁠ ⁠Проживання для учасників не з Києва •⁠ ⁠Практика з ментором •⁠ ⁠Реальні задачі від партнерських організацій •⁠ ⁠Участь у Demo Day перед технічними командами, партнерами й реальними користувачами запропонованих рішень. •⁠ ⁠Сертифікат за результатами захисту фінального проєкту •⁠ ⁠Мови викладання: українська та англійська Ідеальний кандидат на програму — людина, що звикла думати у формальній системі. Необов'язково програміст. Математик, фізик, інженер, аналітик, інколи економіст чи юрист, який роками працює з даними. Той, хто, побачивши задачу, не питає «як це зробити», а починає її розбирати. Самостійність — головний фільтр відбору на програму KSE Agentic AI Summer School. Відбір конкурсний з вхідним тестуванням, онлайн-кваліфікацією та співбесідою. Старт навчання 1 липня 2026 року. Подавайте заявку до 20 червня. За посиланням: https://university.kse.ua/agentic-ai-summer-school-2026 Контакти: csd@kse.org.ua

Зустрічаємо Gemma 4 Результати вражають) тільки подивіться на аджнетік юз та лів код бенч, особливо цікаві моделі E4B та E3B
Зустрічаємо Gemma 4 Результати вражають) тільки подивіться на аджнетік юз та лів код бенч, особливо цікаві моделі E4B та E3B які спокійно запустиш на смартфоні або якомусь розбері пай 5☺️

photo content

Вийшов Опус 4.6 Що ж метрки та скор на код арена це завжди класно, але ми ж знаємо що треба тести в Claude Code. Тосу летс го
Вийшов Опус 4.6 Що ж метрки та скор на код арена це завжди класно, але ми ж знаємо що треба тести в Claude Code. Тосу летс го подивимост що воно таке😜

Андрій Карпаті випустив цікавий влог по створенню LLM Council😍
LLM Council — це проста локальна веб-програма з інтерфейсом, як у ChatGPT, але з тією різницею, що запит надсилається через Openrouter декільком LLM. Отримані відповіді перехресно оцінюються і ранжуються, і, нарешті, «модель-голова ради» формує остаточну відповідь. Для використання потрібен API-ключ OpenRouter. На платформі є безкоштовні моделі. На ваші запити відповідає рада з мовних моделей. Ідея полягає в тому, що замість того, щоб задавати питання одній LLM, ви можете об'єднати їх в «Раду моделей». Більш детально процес виглядає так: 1. Збір думок Запит надсилається всім моделям окремо, і їхні відповіді збираються. Відповіді кожної моделі відображаються в окремій вкладці, щоб можна було їх переглянути вручну. 2. Рецензування Кожна модель отримує відповіді інших моделей. При цьому ідентифікатори анонімізовані, щоб виключити «гру в улюбленців» при оцінці чужих результатів. На цьому етапі відповіді ранжуються за точністю і глибиною аналізу. 3. Підсумовуємо відповідь Головна модель приймає всі відповіді моделей і компілює їх в єдину остаточну відповідь.

Ось і під'їхала технічна карта Gemini 3.0 з бенчмарками😋 Чекаємо на офіційний реліз, має бути цікаво, а зараз деякі метрики
Ось і під'їхала технічна карта Gemini 3.0 з бенчмарками😋 Чекаємо на офіційний реліз, має бути цікаво, а зараз деякі метрики з тех.карти: – На багатьох бенчмарках істотно обходить GPT-5.1 і Sonnet 4.5. Особливо виділяється Humanity's Last Exam і ARC-AGI 2. – Круті результати на бенчмарках, пов'язаних з усілякими агентськими здібностями, розумінням зображень, відео та інтерфейсів. Це багатообіцяюче. – У кодуванні як Sonnet 4.5, щодо Gemini 2.5 Pro приріст гарний, але в цілому рівень Sonnet 4.5.

Дослідники зі Стенфорда і Цінхуа представили агента, який думає і діє одночасно 🧐
Підхід базується на основі прийняття рішень у реальному часі. У таких середовищах кожна дія має свій дедлайн: не встиг виконуєш безпечний хід за замовчуванням. Головна ідея🙃 Поєднати миттєву реакцію і паралельне планування. Коли навколишне середовище постійно змінюється, чисто реактивні агенти діють швидко, але не зовсім логічно, а довгі планувальники більш йрозумні, але занадто повільно і часто спізнюються. Комбінація працює краще за обидва варіанти. Новий метод називається AgileThinker🧐. Він запускає два потоки: - швидкий — ґрунтується на часткових планах і свіжому спостереженні - плануючий — постійно оновлює стратегію і доповнює план Час вимірюється не секундами, а токенами, що майже ідеально корелює з реальним часом виконання. Автори зібрали тестовий набір: Freeway, Snake і Overcooked. Результати прості: під навантаженням і жорсткими таймінгами AgileThinker стабільно обганяє обидва базові підходи — і швидкий, і «довго думаючий». Підсумок🙂 Це крок до агентів, які зберігають інтелект, не втрачаючи швидкість, і можуть діяти в динамічних середовищах, де зволікання дорівнює помилці.

Розбираємо цікаву статтю LLMs Can Get Brain Rot 😌
Стаття про те, що моделі теж деградують від думскролінгу. Дослідники з Техасу опублікували дуже цікаву роботу, яка викликала хвилю обговорень. Вони показали, що якщо LLM почати донавчати на низькоякісних даних із соцмереж коротких, популярних, клікабельних постах, то вона починає втрачати свої когнітивні здібності. Приблизно так само, як людина втрачає увагу і пам'ять, коли занадто багато думсерфіть. Чому так: Фактично, експеримент був наступним. Взяли Llama 3 8B Instruct і почали донавчати на коротких і дуже популярних постах, у яких багато лайків, ретвітів і реплаїв; і на контенті з низькою смисловою цінністю: клікбейт, конспірологія, все таке. Після цього заміряли метрики і порівняли з результатами до донавчання. Що маємо? – Якість ризонінгу впала з 74,9 до 57,2 – Розуміння довгого контексту – з 84,4 до 52,3 – На елаймент-тестах з'ясувалося, що у моделі розвинулися нарцисизм, макіавеллізм і психопатія Навіть після додаткового тюнінгу на чистих даних деградація не зникла повністю. Але справа в тому, що ніякого глобального відкриття тут немає. Пояснюється все це простим зсувом розподілу. При донавчанні на коротких, популярних, емоційно забарвлених твітах модель бачить зовсім інший статистичний ландшафт, ніж під час вихідного претрейну на книжках, статтях тощо. Це зміщує розподіл у просторі ембеддінгів і змінює attention-патерни. Модель постійно бачить короткі тексти без логічного ланцюжка, і, природно, маски уваги починають більше фокусуватися на останніх декількох токенах і втрачати довгострокові залежності, які раніше і забезпечували якісний CoT. Градієнтна динаміка тут теж грає проти нас. Втрати просто мінімізуються за рахунок поверхневих кореляцій, а параметри, що відповідають за довгі причинно-наслідкові зв'язки, майже не отримують оновлень. Ось і виходить, що моделька втрачає здатність довго міркувати. Автори називають цей феномен thought-skipping.

Anthropic тихо випустили Claude Haiku 4.5 Anthropic тихо і без зайовшого шуму презентували міні-версію Claude нового поколінн
Anthropic тихо випустили Claude Haiku 4.5
Anthropic тихо і без зайовшого шуму презентували міні-версію Claude нового покоління. Модель одразу додали в Claude Code, Claude для Chrome, в чаті та API. На SWE-bench модель набирає 73,3%. Це більше, ніж у Claude Sonnet 4 (72,7%). Адже цю модель випустили всього півроку тому, і вона довго вважалася SOTA для кодування. Тепер таку ж якість можна отримати втричі дешевше і вдвічі швидше. Модель перевершує Sonnet 4 в метриках на Computer Use. Загалом, це повноцінна заміна не тільки попереднього малюка Haiku 3.5, але і Sonnet 4 яка, імовірно, в кілька разів більша за кількістю параметрів.

photo content

Розбиремо найгучнішу статтю останніх днів Less is More: Recursive Reasoning with Tiny Networks від Samsung
Головне питання, як це взагалі можливо, щоб модель в 10 000 разів менша була настільки розумнішою?) – Рекурсія😋. МодельTRM багаторазово обмірковує свою відповідь, переглядає її і виправляє, перш ніж видати остаточне рішення. Процес виглядає приблизно так ○ Модель отримує умови завдання і відразу генерує якийсь грубий приклад рішення. Це не обов'язково повинна бути правильна відповідь, достатньо просто швидке припущення. ○ Далі система створює scratchpad. Туди вона записує все, що думає про завдання і свою чернетку, де помилки, що можна поліпшити, як перевірити гіпотезу. При цьому важливо розуміти, що scratchpad – це не потік токенів, як у звичайному ризонінгу. Це внутрішній прихований стан, тобто матриця або вектор, який поступово оновлюється. Іншими словами, TRM вміє думати мовчки. ○ Модель в кілька еткапів оновлює цей внутрішній стан, кожен раз звіряючись з завданням - А і вихідним прикладом - Б. Вона ніби думає, чи узгоджується поточна чернетка з умовою, де суперечності, що краще поліпшити. Після N-ої кількості ітерацій модель переписує вихідний чернеток, спираючись на свій сформований scratchpad. Але це не все. Цей процес спочатку подумай → потім виправ, повторюється кілька разів. І ось тільки після цього ми отримуємо остаточну відповідь. Кінцеві результати, звичайно, вражають: Метрики: – ARC-AGI-1 / ARC-AGI-2 – 44,6% / 7,8%. Для порівняння, у o3-mini-high – 34,5% / 3,0%. – Також модель відмінно вирішує судоку і лабіринти. Тут треба відмітити, що це не мовна модель, вона призначена тільки для алгоритмів і текстом відповідати не вміє. Проте, ідея класна. Багато разів пройтися однією і тією ж крихітною сіткою по scratchpad – це буквально як емулювати глибину великої моделі без великої моделі.

Відійдемо трохи від новин стосовно OpenAI Devday та розглянемо нобелівку з фізики 😜 Цього року присудили за відкриття в галу
Відійдемо трохи від новин стосовно OpenAI Devday та розглянемо нобелівку з фізики 😜
Цього року присудили за відкриття в галузі квантових обчислень. Нагороду щойно отримали Джон Кларк, Мішель Деворет і Джон Мартініс. У 80-х вони вперше довели, що явища квантової механіки, які зазвичай спостерігаються тільки на мікроскопічному рівні, можуть проявлятися в повнорозмірних системах. Вони встановили, що так зване квантово-механічне тунелювання можливе на макрорівні. У їхніх експериментах використовувався надпровідний електричний ланцюг, і вчені змогли довести, що він здатний перейти зі стану без напруги в стан з напругою, проходячи через бар'єр, що в принципі неможливо для класичних об'єктів у фізичному світі. Це і є квантовий перехід тобто вся система поводиться як єдина квантова частинка, хоча містить величезну кількість електронів. Саме з цього відкриття почався весь розвиток квантових комп'ютерів, квантових криптографічних систем тощо.

Прилетіло оновлення для Claude Sonnet 4.5 та Claude Code😌 Claude Sonnet 4.5🫶 Тепер у Anthropic знову SOTA модель для кодува
Прилетіло оновлення для Claude Sonnet 4.5 та Claude Code😌
Claude Sonnet 4.5🫶 Тепер у Anthropic знову SOTA модель для кодування. Модель впевнено обганяє GPT-5 на всіх бенчмарках з програмування, на інших йдуть майже нарівні. Claude Code✌️ – Додали нове розширення для VS Code – Оновили інтерфейс терміналу – Додали команду для швидкого повернення до попереднього чекпоїнту (або на кілька кроків назад) і команду для швидкого переходу до розширеного ризонінгу – Тепер агент прямо в терміналі зможе створювати файли, таблиці та діаграми на основі ваших даних.

Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️ Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на
+3
Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️ Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣 Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю параметрів. Що правда, коли справа доходить до чогось більшого, ніж просто текст (а ще й зображення/формули) Qwen все ще вище 😞 Є дві версії: 4b та 12b. Квантизована версія 12b на диво шустра — на MacBook Pro з M3 з 16 ГБ RAM видає ~11 токенів на секунду. Ви певно спитаєте мене: котику, ну й що робити з цією моделькою? 😱😱😱 🪙 Ідеальний перекладач у парі англійська-українська і назад. Особливо враховуючи підтримку документів у LMStudio; 🪙 Якщо ви працюєте з текстом (о, це я): на наборі з 500 питань MamayLM перевершує Claude 3.7 і генерує десь на рівні з GPT-5-mini в плані лінгвістичної якості тексту. До речі, оцінював Gemini. ГЕМІНЬ! 🪙 Враховуючи, що модель мультимодальна, можна перетворювати зображення в текст (OCR) чи розшифровувати рукописи; 🪙 Ваш власний ШІ-бро, раджу оцей системний промт; 🪙 Якщо ваше прізвище починається на «Ф», а закінчується на «едоров» — то це файна заміна Gemini 2.0 Flash у чат-боті Дії, щоб не платити Google за API; 🪙 Ну і якщо ви просто фанат open source LLM, то це та ж Gemma 3, але трохи краще. Ледь не забув посилання на моделі, у LMStudio просто вбийте MamayLM-Gemma-3 ☕️ ооо донат на збір (лишилося 60 498.25)

Красиво

Google релізнули Learn Your Way
Це персоналізований репетитор, який допоможе засвоїти будь-яку тему😌. Тулза поки працює в режимі експерименту, але спробувати вже можна. Система зчитує ваші захоплення, а потім будь-яку тему пояснює так, щоб вам було зрозуміло і цікаво. Наприклад, якщо ви любите баскетбол і повинні вивчити закони Ньютона, то всі приклади починають будуватися навколо кидків і дриблінгу. Якщо ви художник і вивчаєте економіку, то все зведеться до галерейних аукціонів і арт-ринків👌. Всередині працює мультиагентна система LearnLM на базі Gemini 2.5 Pro. Навіть є спеціальний агент для малювання навчальних ілюстрацій. Що по тулзам під капотом Learn Your Way? – Створеннятмайндмепи, якщо вам зручніше сприймати інформацію візуально – Генерування аудіоуроків, якщо хочете слухати, а не читати – Малювання за допомогою інтерактивних тулзів наприклад, часові шкали, по яких можна тикати – Задавати питання і робити тести, які змінюються в залежності від того, що ви робите неправильно Модель пройшла етап тестування 📈 на 60 чиказьких студентах віком від 15 до 18 років. Їм дали 40 хвилин на те, щоб вивчити незнайому їм тему: одна група просто читала PDF-файли, інша працювала з LYW. 📉 Як підсумок через 5 днів ті, хто працював з PDF, запам'ятали матеріал на 67%, а ті, хто навчався з Learn Your Way – на 78%. Крім того, 100% студентів, які працювали з ШІ, відчували себе більш комфортно і зацікавлено під час виконання завдання.

Робимо огляд на новий метод Semantic Relative Preference Optimization для дифузійних моделях
Що таке SRPO?🔹 SRPO це відносно новий фреймворк навчання з підкріпленням для моделей text-image, створений як більш ефективна альтернатива GRPO підходам. Він робить генерацію стабільнішою, швидшою і дешевшою. Розглянемо степ бай степ👇: 1. Виконується оптимізація за допомогою Direct-Align для економії та оптимізації пам'яті. 2. Promptable Rewards: Отримуємо Promptable Rewards яка перетворюються на умовні сигнали додаючі ключові слова до промпта на основі цього підходу модель відразу підсилює реалізм без додаткового навчання. 3. На виході отримуємо reward model, яка усуває перенасичення зображень та reward hacking. У заключенні маємо👍: – Ефективність зростання продуктивності, результати за 10 хвилин на 32 GPU метрики випереджає DanceGRPO підхід\. – Підвищений рівень реалізму та естетики для FLUX.1-dev без додавання нових даних. – Відсутність reward hacking, робота з готовими reward-моделями та усунення перенасичення зображень.

Your kindly reminder: До Data Science UA Meetup менше тижня – встигни забронювати місце! Залишилося всього 25 квитків. Тож якщо ти плануєш піти – саме час діяти, бо через декілька днів їх може вже не бути 😌 Чому варто доєднатися до нашого івенту? 👇🏻 👉🏻 Олексій Шалденко та Костянтин Здор – Co-founders компанії Wantent – розкажуть про: 🔹AI-підходи до аналізу відеоконтенту 🔹те, як агенти можуть симулювати поведінку та реакції глядачів, надаючи швидкі й масштабовані інсайти 🔹створення та використання синтетичних аудиторій 🔹глибокий аналіз атрибутів контенту (темп, кольорова гама, емоційність сцен та контекст), що дозволяє точніше прогнозувати залученість і сприйняття контенту 👉🏻 Максим Кметь – Senior AI Engineer в MacPaw – поділиться практичним досвідом про те: 🔹як мовні моделі генерують наступний токен 🔹як стратегії декодування – top-k, top-p та температура – впливають на результат 🔹як формулювати якісні запити 🔹як оцінювати відповіді за допомогою класичних метрик і підходу "LLM як суддя" 🔹як підвищувати якість генерації завдяки автоматичній оптимізації промптів 👋🏻 Чекаємо на тебе 23 вересня о 18:00 за київським часом у Києві, у БЦ Gulliver, Creative Quarter, вежа Б, 12-й поверх. А якщо графік занадто щільний, обирай опцію перегляду в записі 😉