Python вопросы с собеседований

Открыть в Telegram

Вопросы с собеседований по Python @workakkk - админ @machinelearning_interview - вопросы с собесдований по Ml @pro_python_code - Python @data_analysis_ml - анализ данных на Python @itchannels_telegram - 🔥 главное в ит РКН: clck.ru/3FmrFd

Больше

Сеть:Machinelearning Россия26 805 Технологии и приложения5 489...

📈 Аналитический обзор Telegram-канала Python вопросы с собеседований

Канал Python вопросы с собеседований (@python_job_interview) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 24 973 подписчиков, занимая 5 489 место в категории Технологии и приложения и 26 805 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 24 973 подписчиков.

Согласно последним данным от 04 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -145, а за последние 24 часа — -13, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 6.29%. В первые 24 часа после публикации контент обычно набирает 3.00% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 1 570 просмотров. В течение первых суток публикация набирает 750 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 8.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как github, api, собеседование, git, docker.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Вопросы с собеседований по Python @workakkk - админ @machinelearning_interview - вопросы с собесдований по Ml @pro_python_code - Python @data_analysis_ml - анализ данных на Python @itchannels_telegram - 🔥 главное в ит РКН: clck.ru/3FmrFd”

Благодаря высокой частоте обновлений (последние данные получены 05 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

24 973

Подписчики

-1324 часа

-357 дней

-14530 день

1 570

Просмотры поста

~ 75024 часа

~ 86548 часов

6.29%

Коэффициент вовлеченности

~ 1

Постов в день

Ads index

beta

Архив постов

24 968

🖥 Лучшие практики написания кода на Python (2026) При разработке на Python следует руководствоваться философией The Zen of Python (PEP 20) – набором принципов, подчеркивающих важность простоты и ясности кода. Например, “Beautiful is better than ugly. Explicit is better than implicit. Simple is better than complex.” («Красивое лучше, чем некрасивое. Явное лучше неявного. Простое лучше сложного.»). Один из ключевых афоризмов Zen of Python гласит: “Readability counts.” («Читаемость кода имеет значение»), и действительно, код читается гораздо чаще, чем пишется. Поэтому чистый код – это код, который легко читать и поддерживать. Мы собрали современные рекомендации по стилю кода в этой статье: https://uproger.com/luchshie-praktiki-napisaniya-koda-na-python-2026-2/

24 968

🧊 pyPFC - Python-библиотека для Phase Field Crystal (PFC) симуляций Если ты занимаешься моделированием материалов, кристаллов или фазовых переходов - сохрани. pyPFC позволяет запускать PFC-симуляции быстро и удобно прямо на Python. Что такое Phase Field Crystal (PFC)? PFC (Phase Field Crystal) - это метод моделирования, который описывает материал как непрерывное поле плотности. Проще: - вместо того чтобы симулировать каждый атом отдельно (как в molecular dynamics) - PFC моделирует “узор кристаллической решётки” как волну/поле За счёт этого PFC может моделировать процессы на более длинных временных масштабах, чем классические атомарные симуляции. PFC используют, чтобы изучать: - рост кристаллов и формирование структуры - дефекты решётки (дислокации) - зернистость и границы зёрен - фазовые переходы и самоорганизацию - поведение материалов при охлаждении/нагреве Что даёт pyPFC: ⚡ ускорение на GPU через PyTorch (можно гонять и на CPU, и на RTX) 🧪 готовые 3D-симуляции, примеры, эксперименты 🧩 удобно для исследований и обучения 📦 open-source проект + нормальная инженерная структура GitHub: https://github.com/HHallb/pyPFC

24 968

⚡️ Экономичный способ развернуть DeepSeek локально запускай модель через Ollama. Так ты получаешь мощную LLM на своём ПК без облака и без огромных требований к железу. Что важно: - выбирай DeepSeek Distill 7B/8B или 14B - формат GGUF + квантизация Q4 (лучший баланс) - поднимаешь как локальный API и дергаешь из Python, бота или агента Плюс: - приватность - всё работает локально - дешево - не нужен сервер - можно быстро менять модель, не трогая код


# 1) Установи Ollama (macOS/Linux/Windows)
# https://ollama.com

# 2) Запусти экономичную DeepSeek модель
ollama pull deepseek-r1:8b
ollama run deepseek-r1:8b

# 3) Проверка: запрос к локальному API
curl http://localhost:11434/api/generate \
  -d '{"model":"deepseek-r1:8b","prompt":"Explain transformers simply","stream":false}'

# 4) Использование из Python
python - << 'PY'
import requests

r = requests.post(
    "http://localhost:11434/api/generate",
    json={
        "model": "deepseek-r1:8b",
        "prompt": "Сделай краткий план изучения SQL за 7 дней",
        "stream": False
    },
    timeout=120
)

print(r.json()["response"])
PY

https://www.youtube.com/shorts/zjn2pXrGbXI

24 968

🧠 Python-задача с собеседования: найди ошибку Код должен посчитать количество чисел больше среднего значения в списке.


def count_above_avg(nums, avg=sum(nums)/len(nums)):
    count = 0
    for n in nums:
        if n > avg:
            count += 1
    return count

data1 = [1, 2, 3, 4, 5]
data2 = [10, 20, 30]

print(count_above_avg(data1))
print(count_above_avg(data2))

Проблема в этой строке: ```python def count_above_avg(nums, avg=sum(nums)/len(nums)): ``` Здесь используется значение по умолчанию, которое вычисляется один раз — в момент определения функции, а не при каждом её вызове. Что происходит по шагам: Когда Python читает определение функции, он сразу считает: sum(nums)/len(nums) Но nums в этот момент - это первый переданный список, то есть data1. Значение avg фиксируется и больше не меняется. При вызове: • count_above_avg(data2) • среднее значение не пересчитывается, используется старое — от data1. Поэтому логика ломается, функция работает с неверным средним. 📌 Это известная ловушка Python Значения аргументов по умолчанию вычисляются один раз. Это та же причина, почему списки и словари в дефолтных параметрах часто приводят к багам. 🛠 Правильное решение Нужно вычислять среднее внутри функции, а не в параметрах: ```python def count_above_avg(nums, avg=None): if avg is None: avg = sum(nums) / len(nums) return sum(1 for n in nums if n > avg) ``` Теперь среднее будет считаться заново при каждом вызове. 💡 Главное правило Никогда не используй вычисляемые или изменяемые объекты как значения по умолчанию: ❌ def f(x, lst=[]) ❌ def f(x, avg=sum(x)/len(x)) ✅ Используй None и считай внутри функции.

24 968

Repost from Machinelearning

🌟 PaddleOCR-VL-1.5: компактная модель для сложного парсинга. PaddlePaddle обновили свою линейку PaddleOCR-VL, выпустив PaddleOCR-VL-1.5 - компактную VLM на 0.9 млрд. параметров на базе ERNIE-4.5-0.3B-Paddle. Несмотря на скромный размер, в задачах разбора документов она показывает SOTA-результаты. На тесте OmniDocBench v1.5 модель выбила 94.5% точности, обойдя не только прошлую версию, но и более тяжелых конкурентов. Фишка обновления - упор на полевые условия. Модель специально учили работать с плохими исходниками: кривыми сканами, бликами от мониторов и мятыми страницами. Попутно сделали бенчмарк Real5-OmniDocBench, который гоняет модели по 5 сценариям: сканирование, перекосы, деформация листа, фото с экрана и плохое освещение. 🟡В 1.5 добавили: 🟢Text spotting: находит и распознает текст одновременно (печатный русский - неплохо, рукописный - почти никак) 🟢Seal recognition: распознает печати (русские - не очень, китайские - на ура). 🟢Cross-page table merging: умеет склеивать таблицы, которые разорваны между страницами. 🟢Работа с заголовками: не теряет структуру параграфа при переходе на новый лист. 🟢Новые языки: добавили поддержку тибетского и бенгальского, подтянули распознавание редких символов и древних текстов. 🟡Деплой - на любой вкус Модель работает с transformers, дружит с Flash Attention 2 и, само собой, поддерживается PaddlePaddle 3.2.1. Если нужно быстро поднять сервис - есть готовый Docker-образ. 🟡Пара важных моментов по использованию

Если нужен полноценный постраничный парсинг всего документа, лучше использовать официальный пакет PaddleOCR. Реализация через transformers пока ограничена только распознаванием отдельных элементов и споттингом.

В пайплайн встроили логику препроцессинга. Если картинка меньше 1500 пикселей, она автоматом апскейлится фильтром Lanczos. При этом есть потолок в 1.6 млн. пикселей для споттинга, это чтобы не перегружать память GPU и сохранить читаемость мелкого шрифта.

📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo 🟡DeepWiki 🖥Github @ai_machinelearning_big_data #AI #ML #VL #OCR #PaddleOCR

24 968

✔️ Сравнение производительности Python и ручного подхода Когда нужно сравнить скорость выполнения задачи с использованием Python и ручного подхода, полезно измерять время выполнения обеих стратегий. Ниже приведен пример, как можно сравнить время выполнения функции, которая суммирует числа от 1 до n с помощью Python и с использованием ручного метода.


import time
# Ручной подход
def manual_sum(n):
    total = 0
    for i in range(1, n + 1):
        total += i
    return total
# Питон-метод
def python_sum(n):
    return sum(range(1, n + 1))
# Сравнение производительности
n = 1000000
start_time = time.time()
manual_result = manual_sum(n)
manual_time = time.time() - start_time
start_time = time.time()

24 968

🔥 Бесплатный интенсив по ChatGPT и созданию НЕЙРОСТРУДНИКОВ без опыта программирования🔥 Вы узнаете, как использовать ChatGPT в профессиональных целях, создавать нейросотрудников на заказ и зарабатывать на ИИ от 150.000р в месяц. Простое понимание основ, без сложного кода! Что будет на интенсиве? 🧬 Теория: как создаются нейро-сотрудники с GPT на Python 🧬 Практика: мы создадим нейро-консультанта, нейро-HR, нейро-маркетолога и др. Интенсив - максимально простой и доступный, без какого-либо сложного программирования. Ведущий интенсива - Senior AI-разработчик нейросетей с 2003 года и основатель Университета искусственного интеллекта - Дмитрий Романов. 🤖Присоединяйтесь к нашему бесплатному интенсиву и разберитесь в этой увлекательной теме с нами!

24 968

🧠 Microsoft: как люди используют ИИ - сильно зависит от контекста Microsoft проанализировали 37.5 млн+ диалогов с Copilot и увидели простую, но важную закономерность: 💻 Днём и с компьютера (рабочие часы) люди чаще спрашивают про: - продуктивность - работу и карьеру - задачи “по делу” 📱 С телефона и поздно ночью запросы уходят в другое: - здоровье - игры - философия - личные советы и размышления Интересно, что со временем Copilot уходит от чисто рабочих сценариев: всё больше запросов становится “повседневными”. Это намекает на тренд: ИИ постепенно превращается не только в инструмент для работы, а в постоянного помощника по жизни. ⚡️ Полное исслежование: https://www.deeplearning.ai/the-batch/microsoft-study-shows-people-use-ai-very-differently-at-different-times-or-on-different-devices/

24 968

🖥 Парсинг на Python - от DOM до асинхронщины. Стань Гуру Парсинга. Один из лучших курсов по Парсинг на Stepik со скидкой 48% Освой Python-парсинг так, как это делают в реальных проектах. Не учебные “игрушки”, а рабочие инструменты для сбора данных с сайтов, API и динамических сервисов. На курсе ты шаг за шагом пройдешь путь от нуля до уровня, где умеешь стабильно забирать данные, работать с защитами, динамикой и автоматизацией. Без воды - только то, что используют в продакшене. В итоге ты сможешь не просто “писать на Python”, а решать практические задачи: анализ данных, мониторинг, автоматизация, фриланс-заказы и собственные проекты. Сегодня можно забрать курс со скидкой 48%: https://stepik.org/a/269942/

24 968

🔥 NovaSR - крошечная open-source модель, которая ускоряет обработку аудио в сотни раз Вышел релиз NovaSR - маленькая, но очень мощная модель для улучшения качества аудио. Самый громкий факт: ⚡️ 3600 секунд аудио за 1 секунду То есть целый час звука обрабатывается практически мгновенно - на порядки быстрее прошлых решений. Зачем это нужно NovaSR полезна везде, где есть “сырой” звук: ✅ улучшение TTS-озвучки (делает голос чище и приятнее) ✅ улучшение качества датасетов (для обучения ASR/TTS/voice моделей) ✅ очистка и восстановление созвонов / звонков / записей ✅ быстрый preprocessing перед ML пайплайном Это как “апскейлер” для звука: меньше шумов, больше чёткости, лучше разборчивость. Ссылки: Repo: https://github.com/ysharma3501/NovaSR Model: https://huggingface.co/YatharthS/NovaSR Если работаешь с TTS / ASR / аудио-датасетами - это must-have тулза.

24 968

Python : подробный путеводитель с примерами кода 2026 года Этот материал предназначен для новичков и тех, кто хочет систематизировать знания по языку программирования Python. В статье рассматриваются основные конструкции языка и показаны примеры кода для самых разных задач - от работы со строками до асинхронных запросов и анализа данных. Все примеры снабжены пояснениями, чтобы вы понимали не только как, но и почему. 📌 Подробнее

24 968

🖥 FastAPI для клиента: как должны выглядеть API-клиенты в Python Python-сообщество отлично научилось делать API-серверы. FastAPI / DRF дают идеальный опыт разработчика: - типы - валидация - понятные эндпоинты - документация по OpenAPI - минимум рутины Но есть проблема. Серверы стали удобными и “правильными”, а вот клиентская сторона до сих пор часто выглядит как кустарщина. Что часто встречается в проектах на базе python: - везде раскиданы httpx.get/post - URL собираются руками - параметры и headers копируются по коду - ответы парсятся вручную - ошибки обрабатываются как попало - нет нормальных типов и автодополнения И именно тут часто появляется 80% проблем. API может быть идеально спроектирован, но пользоваться им неудобно. Да, можно сгенерировать кода клиента. Но чаще всего генератор выдаёт огромный неудобный код: - странные имена методов - перегруженные классы - нечитаемый boilerplate - всё равно приходится писать обёртки руками В итоге клиенты либо не генерируют вообще, либо генерируют и потом ненавидят. API-клиенты должны быть сделаны как фреймворк. Как FastAPI, только наоборот. То есть ты описываешь клиент красиво и декларативно: - функция описывает intent (что мы делаем) - типы описывают контракт - библиотека берёт на себя HTTP-рутину Вместо кода “на коленке” httpx.get("https://api.site.com/users/123") Должно быть get_user(123) И дальше библиотека сама: - соберёт URL - подставит параметры - сериализует запрос - выполнит HTTP - распарсит ответ - кинет нормальную ошибку - даст типы и автодополнение в IDE Именно эту идею автор статье и продвигает (проект Clientele) Сделать API-клиенты удобными, чистыми и типобезопасными так же, как мы привыкли делать серверы Проблема не в HTTP. Проблема в том, что API-клиенты в Python до сих пор не стали “первоклассным кодом”. А должны стать. Подробности: paulwrites.software/articles/python-api-clients

24 968

Repost from Machinelearning

🗣 Qwen3-TTS - мощный open-source релиз (voice design + клонирование голоса) Qwen официально выпустили Qwen3-TTS и полностью открыли всю линейку моделей - Base / CustomVoice / VoiceDesign. Что внутри: - 5 моделей (0.6B и 1.8B классы) - Free-form Voice Design - генерация/редаквтирование голоса по описанию - Voice Cloning - клонирование голоса - 10 языков - 12Hz tokenizer - сильная компрессия аудио без сильной потери качества - полная поддержка fine-tuning - заявляют SOTA качество на ряде метрик Раньше лучшие генераторы были в закрытых API, а теперь появляется полноценный open-source стек TTS, где можно: - обучать под домен, - делать кастомные голоса, - и не зависеть от провайдера. ▪GitHub: https://github.com/QwenLM/Qwen3-TTS ▪Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts ▪Демо (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS ▪Блог: https://qwen.ai/blog?id=qwen3tts-0115 ▪Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf @ai_machinelearning_big_data #AI #TTS #Qwen #OpenSource #SpeechAI

24 968

Заархивировали

24 968

🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты? Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом. Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям. Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт. 🎁 48 часов действует скидка в 40% процентов 👉 Начать учиться на Stepik

24 968

Repost from Machinelearning

🌟 GenRobot RealOmni-OpenData: апдейт датасета для Embodied AI RealOmni - это не просто каталог видео, где роборука хватает кубик на белом столе. Это мультимодальный подарок с траекториями, аннотациями и движениями суставов. 🟡Сенсоры Картинка с Fisheye-камер, данные IMU (инерциалка), энкодеры и данные с тактильных датчиков с разрешением 1 мм. 🟡Сценарии Снимали в 3000 реальных домах, никаких стерильных лабораторий: складывание одежды, завязывание шнурков, разбор посуды и сортировка всякого хлама. 🟡Bimanual manipulation Почти все таски двурукие. 🟡Long-horizon Медианная длина клипа ~ 210 секунд. То есть это не "схватил-положил", а полноценные процессы "достать, сложить, убрать в ящик". В свежем обновлении добавили 35 тыс. клипов с фокусом на разгребание куч разнородных предметов. Это именно та задача, на которой сыпется большинство моделей. Немного цифр о всем датасете 🟢Объем (заявленный): 95 ТБ (об этом ниже). 🟢Количество клипов: 1M+ (в планах). 🟢Разрешение: 1600x1296 @ 30fps. 🟢Формат: .mcap (стандарт для ROS, внутри сжатый H.264). Весть проект запланирован объемом 95 ТБ и хронометражем 10,000 часов. Но если посчитать, то что уже залито (Stage 1 + Stage 2), то суммарно около 5.4 ТБ и ~1600 часов. Остальное обещают догрузить as soon as possible. 🟡Важно знать Данные собраны специфическим гриппером GenDAS, так что если у вас другой сенсорный массив (или его нет), transfer learning может стать болью. Ассеты заточены под железку GenRobot. Это все еще телеоперация. То есть мы учим робота копировать движения человека-оператора и если он тупил или руки дрожали сетка это тоже выучит. Тем не менее, это очень крутой релиз для тех, кто пилит домашних роботов. Данные по завязыванию шнурков и разбору предметов в open-source редкость. 📌Лицензирование: CC-BY-NC-SA-4.0 License. 🟡Датасет 🖥GitHub @ai_machinelearning_big_data #AI #ML #Robotics #Dataset #RealOmni #GenRoborAI

24 968

🚀 Токенизация в LLM - как “Hello” превращается в цифры. Токенизация - это первый шаг перед тем, как LLM вообще начнет “думать”. Модель не понимает текст напрямую. Она понимает только числа. Поэтому любой текст сначала разбивается на маленькие кусочки - токены: - иногда это целые слова - иногда части слов (su, per, man) - иногда один символ - иногда даже пробел - тоже токен Пример: Фраза "I love programming" разбивается не обязательно на слова, а на кусочки слов: [I] ,[ love] ,[ program] , [ming] Обрати внимание: - " love" начинается с пробела - потому что пробел тоже часть токена - programming разделилось на 2 токена: " program" + "ming" То есть Токенизация - это когда LLM режет текст на маленькие кусочки (токены) и переводит их в числа. Важно: Чем больше токенов - тем дороже запрос и тем быстрее съедается контекст. Плохая токенизация = странные ошибки (особенно в коде, ссылках, редких словах). Поэтому LLM отлично понимают частые слова, но могут путаться на редких именах, терминах и смешанных языках. И лайфхак: если хочешь “дешевле” и “чище” ответы - пиши короче, без мусора, без повторов. Контекст - это валюта.


# Tokenization demo (Python)
# pip install tiktoken

import tiktoken

text = "I love programming in Python 🐍"

enc = tiktoken.get_encoding("cl100k_base")
tokens = enc.encode(text)

print("Text:", text)
print("Token IDs:", tokens)
print("Tokens count:", len(tokens))

# decode back
print("\nDecoded tokens:")
for t in tokens:
    print(t, "->", repr(enc.decode([t])))

https://www.youtube.com/shorts/A7DCcYLq38M

24 968

⚡️ Как запустить Qwen у себя на ПК с Python Совет: если хочешь развернуть Qwen локально без облака, проще всего поставить её через Transformers - модель скачивается один раз и дальше работает офлайн. Подходит даже для слабых ПК, если брать маленькие версии (например, Qwen-2.5-1.5B-Instruct).


# Установка:
# pip install transformers accelerate torch

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

MODEL_NAME = "Qwen/Qwen2.5-1.5B-Instruct"

# Модель и токенайзер загрузятся один раз — потом работают офлайн
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    torch_dtype=torch.float16,
    device_map="auto"   # автоматически использует GPU, если есть
)

prompt = "Объясни простыми словами, чем контейнер отличается от виртуальной машины."

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    **inputs,
    max_new_tokens=200,
    do_sample=True,
    temperature=0.7
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

24 968

🖥 Онлайн-книга: «Исследуем математику с помощью Python» 📘 Бесплатный онлайн-учебник по математике с практикой на Python. Это обновлённая версия книги *Exploring Mathematics with Your Computer*, где все примеры переписаны на Python и дополнены новыми главами. Книга разбирает идеи математики через код и эксперименты, охватывая: - основы алгоритмов и математического мышления - теорию чисел - вероятность и статистику - комбинаторику - численные методы - фракталы и хаос - геометрию и графику - марковские цепи - продолженные дроби - кривые и многое другое Каждая тема сопровождается пояснениями, упражнениями и примерами кода. Подходит тем, кто уже знает базовый Python и хочет через практику прокачать математику и алгоритмическое мышление. 📍 Ссылка на книгу: https://coe.psu.ac.th/ad/explore/

24 968

🖥 Сравнение лучших библиотек визуализации данных на Python в 2025 году Визуализация данных помогает разработчикам и аналитикам превращать таблицы цифр в наглядные графики, карты и панели мониторинга. В 2025 году Python остаётся доминирующим языком для анализа данных и визуализации: популярность языка подтверждают исследовательские индексы и рост сообщества. Экосистема Python предлагает десятки библиотек для построения графиков — от классических 2‑D диаграмм до интерактивных веб‑панелей. Ниже приведён обзор самых актуальных библиотек визуализации данных для Python на 2025 год и их отличительные особенности. https://uproger.com/sravnenie-luchshih-bibliotek-vizualizaczii-dannyh-na-python-v-2025-godu/