cookie

نحن نستخدم ملفات تعريف الارتباط لتحسين تجربة التصفح الخاصة بك. بالنقر على "قبول الكل"، أنت توافق على استخدام ملفات تعريف الارتباط.

avatar

partially unsupervised

@arsenyinfo пишет про software engineering и machine learning

إظهار المزيد
روسيا74 031الروسية76 625الفئة غير محددة
مشاركات الإعلانات
6 632
المشتركون
-124 ساعات
+57 أيام
+3230 أيام

جاري تحميل البيانات...

معدل نمو المشترك

جاري تحميل البيانات...

Кажется, с разных сторон назревает некоторый антихайп про generative AI: Например: - Партнер в Sequoia насчитал, что с текущими инвестициями в железо genAI должен принести $600B, чтобы окупиться, и этого, конечно, не видно. - Goldman Sachs оценивает будущие инвестиции в железо в триллион баксов (правда, без уточнения, за какой период) и тоже сомневаются в окупаемости - Видеокарты не становятся фундаментально эффективнее, а в основном просто больше (правда, этот тейк относится к продвижению альтернативного железа, так что take it with a grain of salt). - Anecdotal data: лично разговаривал с парой человек, которые после тщательного анализа передумали лезть в некоторые на первый взгляд привлекательные ниши, где genAI вроде должен быть полезен: оказалось, что соотношение цена/качество (и полезность как следствие качества) не сходятся буквально на порядок. Но подождите, рано ползти на кладбище. Вместо этого приведу цитату из requests for startups от YC: Small fine-tuned models as an alternative to giant generic ones' Giant generic models with a lot of parameters are very impressive. But they are also very costly and often come with latency and privacy challenges. ... We are eager to support companies engaged in developing or fine-tuning such specialized models or creating tools to facilitate their construction. Запрос на это не может не развиться: на foundation моделях хорошо строить прототипы, а вот скейлить и улучшать - гораздо сложнее. Например, мои бывшие коллеги делали решение для крупного банка, и их специализованный API получился примерно в 500 раз дешевле: Enriching these transactions directly with GPT4-0314 , would cost $4.5M per day. With Ntropy, this costs $9k per day, a 500x reduction, while maintaining the same accuracy. Окей, GPT4-0314 - это уже плохой выбор, GPT-4o обошлась бы в разы дешевле, но разбежка примерно на два порядка все еще сохраняется. Как человек, который любит делать мелкие негигантские специализированные модели и не любит обещать API-based foundation моделям $100 чаевыми, я не могу не радоваться.
إظهار الكل...
24👍 20
Это было предсказуемо: в 2024 легкая небрежность в тексте/коде окончательно стала премиальной и крафтовой. Пресный вежливый текст - значит, написано при помощи LLM (и даже без упражнений с промптами). Шероховатости придают эффект теплоты: человек не поленился и написал сам. Например, пишет мне рекрутер, и второй абзац его письма выглядит как LLM-summary моего линкедин-профиля. Дальше как-то автоматически сложно поверить его словам, что this is exactly the type of experience they are looking for. Или с другой стороны: проверяю тестовые задания, и довольно быстро калибруюсь. Например, много тривиальных комментариев, начинающихся с заглавной буквы и заканчивающихся точкой - явное свидетельство сгенеренного кода. Да ладно комментарии, я уже и по названиям переменных узнаю код авторства GPT.
# Init model.
model = Autoencoder.to(DEVICE)
criterion = nn.MSELoss()
Вообще, кстати, в этом тестовом использовать GPT не запрещено, но надо бы не только сгенерить решение, но и понять, что там происходит. В итоге больше всего сигнала в ответе на вопрос "почему это работает?". В итоге умение писать кое-как теперь вообще не имеет значения, а умение писать изящно (будь то текст или код) ценится как и раньше.
إظهار الكل...
56😁 26👍 13
Photo unavailableShow in Telegram
🤡 21🔥 1
Искренне считаю, что рекламировать неординарные вакансии - это добро, потому не стесняюсь разместить: 🔥 Wunder fund: вакансия Senior Data Researcher 🔥 TLDR: Wunder Fund, Senior Data Researcher, Алготрейдинг, HFT 🌍 Локация: Remote/Релокация в несколько стран 💰Вилка: от $5k до $7k на руки, иногда больше — договоримся (есть привязка к валюте, можем платить в долларах или крипте) 👁 Инфа: Мы — Wunder Fund, занимаемся высокочастотной торговлей (HFT) с 2014 года. Торгуем на 14 биржах по всему миру и наш дневной оборот больше $5 млрд. Сейчас ищем в команду Senior Data Researcher, который возглавит направление нейросетей в Wunder Fund. Вам предстоит обучать модели, проверять гипотезы и добиваться максимальной точности моделей. Задача похожа на Kaggle-соревнование, только модели и фичи должны считаться максимально быстро. Вы будете работать в сильной команде — это лучшие программисты, математики, физики, выпускники лучших вузов, победители соревнований и международных олимпиад. Наша сфера очень конкурентна, поэтому мы используем самые современные технологии, чтобы обеспечить максимальную скорость и точность наших систем. 🤓 Что вам понадобится - Хорошо знать Python и математику - Быть опытным практиком пристального вглядывания в данные - Иметь успехи в Kaggle соревнованиях (Kaggle Master/Grandmaster) - Иметь опыт успешного обучения трансформеров и LSTM. - Будет плюсом: опыт в соревнованиях по NLP, Speech Recognition. Условия: работа в команде выпускников МГУ и Физтеха, полная удаленка, гибкий график, ЗП по результатам собеседования от $5,000 до $7,000 на руки. Небольшой видос про data science у нас и исследования: https://youtu.be/in2wXwxeaqs Ссылка на вакансию: https://clck.ru/3A2CnM Как откликнуться: Пишите в ТГ @nedifar1703
إظهار الكل...
Data science в Wunder Fund

Рассказываем немного про фонд и про то, как устроен дата саенс в высокочастотной торговле.

🤡 87👍 9👎 6 4💩 3🖕 3
Наша книга по ML System Design прошла третье - и последнее - ревью внутри паблишера. Я уже писал про ревью раньше, но вкратце процесс такой: издатель раздает 10+ потенциальным читателям текущую версию книги и заставляет писать много комментариев и отвечать на десятки вопросов. Ревью проводится после каждой трети книги, и потом анонимизированные комментарии сваливаются обратно авторам: чините, что считаете важным. По результатам ревью выглядит так, что мы наконец-то научились писать: оценки выросли 3.75 → 4.36 → 4.73. Во многом это вызвано тем, что книга "отлежалась" - много мелких улучшений по результатам первых ревью, отзывов читателей (большое вам спасибо!) и собственных переосмыслений/дополнений. Еще в комментариях написали, что книгу стоило бы назвать Principles of ML Design. Мы вообще-то так и хотели, но издательство вежливо проигнорировало наше мнение по этому вопросу. В общем, с нашей стороны все в целом готово, осталось пройти через пару кругов формальностей, дождаться корректуры, и тогда книга уйдет в печать (и все предзаказавшие печатную версию ее наконец-то получат). Зная неповортливость издательства, рассчитываю увидеть печатную версию к концу года. В раннем доступе было продано чуть больше тысячи экземпляров. До завтрашнего дня у издательства скидки 50% на все, но я ни на что не намекаю :)
إظهار الكل...
👍 61🔥 32🍾 16 9
Беда пришла откуда не ждали: сегодня tensorboard насрал мне в штаны. Ковырял задачу, в которой без оценки глазами пока никак. Сгенерил все семплы, сложил в тензорборд, предусмотрительно запустил с -samples_per_plugin images=100000, начал анализировать. Размер датасета я знал, пролистал все картинки, нашел ошибки, и бодро подытожил в духе: "так, среди 200 семплов у нас 4 ошибки, error rate 2%, проблема незначительна". Подытожил настолько бодро, что даже CTO поверил. Внес небольшие изменения, пошел смотреть на различия и вдруг что-то зачесалось - как будто слишком быстро все просмотрел. Ну и оказалось, что в UI отображалась только примерно половина семплов. Пришлось вручную распарсить tensorboard-файл и со стыдом признаться, что в своей оценке масштаба проблемы я ошибся примерно вдвое.
إظهار الكل...
😨 60🤔 5😁 4🖕 4👍 3🥴 1
Реклама, которую вы точно не ждали. Если вы склонны ворчать, что программирование стало скучным конвейером по перекладыванию протобафов для бесполезных фичей и крысиными гонками за новыми фреймворками, то вот вам шанс резко изменить свою жизнь! Мой старый кореш Алексей ищет программиста на Фортране для разработки симулятора физики плазмы. Достаточно даже опыта С/C++ и готовности этот самый Фортран освоить. Кроме того, не придется жить под мостом и питаться объедками: обещают платить вполне себе рыночные деньги 💰
إظهار الكل...
Keep it simple, stupid!

Next Step Fusion,

https://nextfusion.org/

— люксембургский стартап в области fusion energy ищет программиста на Fortran и C/C++ для продолжения разработки симулятора физики плазмы NSF Simulator. Симулятор активно используется для симуляции и расчёта сценариев, а также в качестве окружения для тренировки ML-моделей. Первые задачи включают в себя завершение переноса части функциональности из фортран библиотеки в C++ wrapper, отладку приложения целиком, оптимизация по скорости, налаживание автоматического тестирования. Дальше будет интеграция с другими «кодами», доработки для использования в составе симуляционной платформы, доработки по запросу различных команд. Требования: 1️⃣ Fortran — работа с памятью, распараллеливание, методы экономии ресурсов, методы ускорения вычислений и т.д. Опыт с Fortran CUDA — большой плюс. 2️⃣ Знание C/C++ или острое желание быстро освоить. 3️⃣ Опыт в коммерческих проектах разработки ПО. 4️⃣ Опционально физика плазмы, матан и линейная алгебра. Задать вопросы и откликнуться на…

🤯 34👍 19🔥 13👏 3😁 2 1👻 1
Дата-дривен карго культ учит, что если метрики растут, а результат на глаз выглядит не очень, то метрики первичны, ведь они как будто имеют больший охват (например, весь тестовый датасет), чем то, что может увидеть один человек невооруженным взглядом. Я и сам долгое время был адептом этого тезиса, пока не наступил на достаточное количество граблей. Проблема в том, что сделать сбалансированную метрику или набор метрик всегда сложнее, чем кажется (завсегдатаи Kaggle не дадут соврать). Именно поэтому в реальности приходится не оптимизировать единственную метрику верхнего уровня, а делать набор метрик и следить за всеми, а потом принимать субъективное решение, когда одна метрика неизбежно вдруг пойдет вверх, а другая вниз. Буквально вчера на работе смотрел на результаты ML экспериментов и недоумевал: вариант, который и визуально мне нравился больше, и в теории должен был быть лучше, по метрикам выглядел хуже. Заподозрил проблему в недавно задизайненной метрике, поленился доказывать теорией, сделал "модель", которая генерила рандом с определенными свойствами и тут же выбил искомые 100%. Будь это корпорация с бездумной ориентацией на KPI, можно было бы закоммитить и бездельничать до конца квартала!
إظهار الكل...
👍 98💯 28😁 6 5
Люблю всратую музыку, и потому suno.ai врывается на третье место generative AI приложений в моем личном рейтинге (сразу после ChatGPT и Github Copilot). Пост-панк на русском получается очень атмосферным без особых хлопот, с одного промпта, вот примеры: - Моя боль, мой стартап 🧑‍💻; - Коты не навещают меня в больнице 😿; - Такой молодой, такой тупой 👴
إظهار الكل...
Моя Боль Мой Стартап (My Pain, My Start-Up) | Suno

post-punk gritty song. Listen and make your own with Suno.

🔥 52❤‍🔥 13😁 12
Как человек, который еще помнит про computer vision за пределами диплернинга, насладился статьей про дистилляцию LSD. Товарищ майор, я про line segment detector, а вовсе не про психоделики! 🚔 Идея подкупает простотой и элегантностью. В малоизвестной, но важной задаче нахождения отрезков (line segments) на картинке по-прежнему все не очень хорошо: есть классический алгоритм LSD - не очень стабильный, зато универсальный; есть сколько-то DL моделей, обученных на единственном датасете из 5000 картинок, они гораздо более устойчивы к шуму, но не обобщаются на другие датасеты. Авторы предлагают такое: - для генерации трейн сета применяем классический LSD к сотне аугментированных версий одной картинки; - превращаем найденные отрезки в distance/angle fields, то есть такое представление, где для каждого пикселя есть значение "в какую сторону и как далеко надо идти к ближайшему отрезку" и усредняем по этим аугментированным версиям; - учим классический Unet предсказывать такие поля; - обратно преобразуем предсказанные поля в отрезки. Быстро, эффективно, не требует ни ручной разметки, ни мощного железа. P.S. Если этот пост наберет сколько-то лайков, я напишу (или не напишу) метапост, как я читаю (или не читаю) статьи!
إظهار الكل...
DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients

Line segments are ubiquitous in our human-made world and are increasingly used in vision tasks. They are complementary to feature points thanks to their spatial extent and the structural...

👍 218🔥 19 12💯 1
اختر خطة مختلفة

تسمح خطتك الحالية بتحليلات لما لا يزيد عن 5 قنوات. للحصول على المزيد، يُرجى اختيار خطة مختلفة.