Python Portal
前往频道在 Telegram
Всё самое интересное из мира Python Сотрудничество, реклама: @devmangx Менеджер: @Spiral_Yuri РКН: https://clck.ru/3GMMF6
显示更多📈 Telegram 频道 Python Portal 的分析概览
频道 Python Portal (@pythonportal) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 52 564 名订阅者,在 技术与应用 类别中位列第 2 546,并在 俄罗斯 地区排名第 11 886 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 52 564 名订阅者。
根据 07 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -754,过去 24 小时变化为 -28,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 9.11%。内容发布后 24 小时内通常能获得 5.59% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 788 次浏览,首日通常累积 2 938 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 24。
- 主题关注点: 内容集中在 строка, none, true, модуль, peter 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Всё самое интересное из мира Python
Сотрудничество, реклама: @devmangx
Менеджер: @Spiral_Yuri
РКН: https://clck.ru/3GMMF6”
凭借高频更新(最新数据采集于 08 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
52 564
订阅者
-2824 小时
-1857 天
-75430 天
帖子存档
52 556
Бывшие сотрудники Google опубликовали карту всех внутренних инструментов Google и их open-source аналогов.
15 200 звёзд. 1 100 форков. 99 контрибьюторов.
→ Borg = Kubernetes
→ Spanner = CockroachDB
→ Colossus = HDFS
→ Dremel = DuckDB / Presto
→ Chubby = Zookeeper
→ Stubby = gRPC
→ Zanzibar = SpiceDB
→ Blaze = Bazel
→ MapReduce = Spark
всё, чем инженеры Google пользуются каждый день.
у всего этого есть open-source аналоги.
ничто из этого не требует работы в Google.
https://github.com/jhuangtw/xg2xg
👉 @PythonPortal
52 556
Смотри топовые научные статьи по ИИ, машинному обучению, робототехнике, квантовой физике и другим направлениям на kurate.org.
Сотни препринтов с arXiv ежедневно ранжируются по научному импакту через парные сравнения, где судьями выступают модели — Claude, GPT и Gemini.
👉 @PythonPortal
52 556
Как с помощью Python и OpenCV считать лица на видео / фото
🟢Подключаемся к камере.
🟢Используем библиотеку dlib для обнаружения лиц.
🟢Рисуем рамки вокруг лиц и выводим их количество.
🟢Останавливаем программу по нажатию "q".
Пример кода тоже есть.
👉 @PythonPortal
52 556
Есть число с плавающей точкой в Python и нужно вывести его как процент — используй формат
% в f-строке
x = .023
print(f'{x:.2%}') # 2.30%
x = .02375
print(f'{x:.2%}') # 2.38% -- округляется!
x = 1.02375
print(f'{x:.2%}') # 102.38%
👉 @PythonPortal52 556
Безумцы реализовали MicroGPT от Andrej Karpathy полностью на ПЛИС-логике.
Без графического процессора.
Без PyTorch.
Без циклов инференса на центральном процессоре.
Только трансформер, «зашитый» в железо, генерирующий 50 000+ токенов в секунду.
Модель небольшая, но идея не в этом: инференс не обязан существовать только в программной среде.
Целью было не сделать максимально большую модель.
Целью было представить весь путь инференса трансформера в виде, читаемом для железа: память, счётчики, состояния конечных автоматов, аккумуляторы, таблицы поиска и многотактные арифметические блоки.
Базовая схема использует фиксированную арифметику Q4.12 и веса, хранящиеся в ПЗУ.
Большая часть модели сводится к одной повторяющейся операции: матрично-векторному умножению. Поэтому был реализован переиспользуемый 16-канальный потоковый блок матрично-векторных вычислений и затем он временно мультиплексируется на Q/K/V, MLP и выходной слой языковой модели.
Самым интересным оказался механизм внимания.
В Python это одно аккуратное уравнение.
В RTL это превращается в расписание: генерация Q/K/V, проход по скалярным произведениям, отслеживание максимума, приближённое вычисление экспоненты, накопление, деление, смешивание V, затем обратная проекция.
https://github.com/Luthiraa/TALOS-V2
👉 @PythonPortal
52 556
Большой момент для Soniox: сегодня запускаем Soniox Text-to-Speech.
Это серьёзный шаг вперёд. Soniox начинали с распознавания речи. Теперь, имея и распознавание, и синтез, мы становимся голосовой платформой для любого языка.
Soniox TTS заточен под самые сложные части генерации речи:
- Речь уровня носителя на более чем 60 языках
- Генерация без галлюцинаций
- Корректное озвучивание буквенно-цифровых последовательностей: числа, идентификаторы, адреса
- Правильное произношение имён и иностранных слов
- Стриминг с ультранизкой задержкой для приложений в реальном времени
Ценообразование простое: $0.70 за час сгенерированной речи.
Ключевое здесь — общий вектор: разработчики и компании могут работать с одним провайдером для базового голосового стека — распознавание речи, синтез речи, мультиязычный голос, инфраструктура реального времени, региональные деплои и соответствие требованиям.
Это важный шаг в переходе от провайдера распознавания речи к полноценной голосовой платформе для всех языков.
Голос становится базовым интерфейсом для софта. Для глобального использования он должен быть быстрым, точным, устойчивым и доступным на любом языке. Этим мы и занимаемся в Soniox.
Подробнее в блоге
👉 @PythonPortal
52 556
Hugging Face буквально собрали у себя все ключевые «секреты».
Важно разобраться в оценке больших языковых моделей.
> Пока ты работаешь с языковыми моделями:
> обучаешь или дообучаешь свои модели,
> выбираешь модель под задачу,
> или пытаешься понять текущее состояние области,
почти неизбежно возникает вопрос:
как понять, что модель хорошая?
> Ответ — оценка качества. Она везде:
> лидерборды с рейтингами моделей,
> бенчмарки, которые якобы меряют рассуждения,
> знания, кодинг или математику,
> статьи с заявленными новыми лучшими результатами.
Но что такое оценка на самом деле?
И что она реально показывает?
Этот гайд помогает во всём разобраться.
О чём вообще оценка моделей Базовые понятия больших языковых моделей для понимания оценки Оценка через готовые бенчмарки Создание своей системы оценки Главная проблема оценки Оценка свободного текста Статистическая корректность оценки Стоимость и эффективность оценки👉 @PythonPortal
52 556
Будь ленивым разработчиком 😴😴😴
Лучшие разработчики — не те, кто пишет больше всего кода. Это те, кто пишет минимум кода и при этом решает задачу быстрее, качественнее и надёжнее.
Это избыточный подход:
transposed = []
for i in range(len(matrix[0])):
row = []
for r in matrix:
row.append(r[i])
transposed.append(row)
Это нормальный, идиоматичный вариант:
transposed = list(zip(*matrix))Лень — не про небрежность. Это про уважение к своему времени и времени команды. Это про вложение ресурсов в понимание идиом языка, чтобы фокусироваться на реальных задачах, а не переизобретать базовые вещи. У каждого сильного разработчика есть набор «ленивых» приёмов: ✔️генераторы списков вместо вложенных циклов ✔️
collections.defaultdict вместо ручных проверок
✔️ контекстные менеджеры вместо ручного открытия/закрытия ресурсов
✔️короткие выражения, которые проходят ревью
Цель — не демонстрировать объём проделанной работы, а доставлять чистые и поддерживаемые решения с минимальными затратами.
👉 @PythonPortal52 556
Используй f-строки Python и спецификаторы форматирования, чтобы быстро и на скорую руку собирать таблицы:
d = {'a':10, 'bcd': 2, 'e': 3456}
for key, value in d.items():
print(f'{key:.<5}{value:.>5}')
Вывод:
a.......10 bcd......2 e.....3456👉 @PythonPortal
52 556
Sentrux измеряет архитектуру кодовой базы в реальном времени.
Что делает:
→ Оценивает «здоровье» архитектуры (0–10000)
→ Отслеживает модульность, циклические зависимости, глубину, равномерность, избыточность
→ Работает за миллисекунды (Rust + tree-sitter, 52 языка)
→ Отдает фидбек, пока агенты пишут код
Как работает:
→ scan / rescan анализируют структуру
→ check_rules применяет ограничения
→ evolution отслеживает изменения во времени
→ Правила лежат в
.sentrux/rules.toml (связность, слои, циклы)
Экспонируется как MCP-сервер:
→ Агенты получают живой структурный фидбек прямо в процессе сессии
Вместо:
code → review позже
Получаешь:
code → оценка → исправление (внутри цикла)
https://github.com/sentrux/sentrux
👉 @PythonPortal52 556
Теперь можно искать по PDF на 500 страниц без чанкинга и без векторизации.
Андрей Карпати недавно озвучил идею:
что если база знаний работает как вики, а не как векторная база?
OpenKB — open-source CLI, построенный вокруг этой концепции.
Он компилирует сырые документы в структурированную связанную вики-систему с помощью LLM.
Знания накапливаются, а не пересобираются при каждом запросе.
В классическом RAG контекст каждый раз восстанавливается заново. Здесь модель опирается на уже построенную структуру.
Длинные PDF разбираются через PageIndex — древовидный индекс без векторов, который позволяет рассуждать по структуре документа.
Что получается на выходе:
> авто-суммаризация и страницы концептов
> кросс-ссылки между документами
> детект противоречий и пробелов
> режим наблюдения за изменениями
> markdown, совместимый с Obsidian
Поддерживаются PDF, Word, PowerPoint, Excel, HTML и изображения.
Таблицы и фигуры извлекаются нативно.
Один новый файл может автоматически обновить до 15 страниц в вики.
База знаний начинает сохранять то, что уже было выучено.
https://github.com/VectifyAI/OpenKB
👉 @PythonPortal
52 556
Нужно обнулить время (до полуночи) в серии datetime в Pandas — используется
dt.normalize:
df['x'].dt.normalize()На выходе та же серия datetime, но у всех значений время
00:00:00.
👉 @PythonPortal52 556
Нужно округлить даты/время в Pandas:
*
dt.floor — вниз (к предыдущему интервалу)
* dt.ceil — вверх (к следующему интервалу)
* dt.round — к ближайшему интервалу
Пример:
s.dt.floor('3h') # предыдущий 3-часовой слот
s.dt.ceil('15m') # следующий 15-минутный слот
s.dt.round('1D') # ближайшие сутки
👉 @PythonPortal52 556
f-строки в Python:
* Перед строкой ставится f
* Возвращается обычная строка
* Выражения в {} вычисляются и подставляются
x = 5
y = 7
f'{x} + {y} = {x+y}' # 5 + 7 = 12
x = [1, 2]
y = [3, 4]
f'{x} + {y} = {x+y}' # [1, 2] + [3, 4] = [1, 2, 3, 4]
👉 @PythonPortal52 556
Хотите освоить анализ данных, но не знаете, с чего начать?
Центр непрерывного образования ФКН НИУ ВШЭ запускает онлайн-программу профессиональной переподготовки «Практический анализ данных» — полный цикл обучения от нуля до уровня практикующего аналитика.
Что вас ждет:
🟣Python для автоматизации и анализа данных: от первых строк кода до Pandas и визуализации
🟣SQL на продвинутом уровне: оконные функции, индексы, партиционирование, оптимизация запросов
🟣Прикладная статистика и A/B-тестирование: проверка гипотез, планирование экспериментов, работа с малыми выборками
🟣Основы машинного обучения: регрессия, классификация, кластеризация
🟣Дашборды в Tableau и Yandex DataLens
🟣Продуктовая аналитика: метрики, сегментация, приоритизация гипотез
🟣Хранилища данных: архитектура DWH, Hadoop, Spark, ETL, Airflow
Преподаватели — практикующие специалисты из Wildberries, Вкусно — и точка и других компаний. По окончании вы получите диплом о профессиональной переподготовке НИУ ВШЭ.
📁 Старт: 12 мая.
Подробнее о программе 📍
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
