Python для начинающих

Kanalga Telegram’da o‘tish

Ko'proq ko'rsatish

Rossiya290 487 Texnologiyalar & Aralashmalar38 631

1 241

Obunachilar

Ma'lumot yo'q24 soatlar

+27 kunlar

+230 kunlar

122

Post ko'rishlar

Ma'lumot yo'q24 soatlar

Ma'lumot yo'q48 soatlar

9.83%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

1 241

- Основы взаимодействия с облачными сервисами через Python

1 241

### Обработка и визуализация данных с помощью библиотеки Seaborn Друзья, вы наверняка знаете, как важно не только уметь работать с данными, но и правильно представлять их. Ведь сухие цифры таблиц и массивов далеко не всегда говорят сами за себя. Тут на арену выходит визуализация данных — мощный инструмент для анализа, поиска закономерностей и принятия решений. Сегодня я расскажу вам о Seaborn — одной из самых популярных библиотек Python для построения красивых графиков. Но что делает Seaborn таким крутым? Это библиотека, построенная поверх matplotlib, ориентированная на статистическую визуализацию. Она позволяет создавать изящные и информативные графики буквально в несколько строк кода! Сразу к делу: давайте разбираться, как это работает на практике. --- ### Установка и подключение библиотеки Для начала, нам нужно установить библиотеку (если, конечно, она у вас еще не установлена).

pip install seaborn

После чего её нужно импортировать в вашем скрипте:

import seaborn as sns
import matplotlib.pyplot as plt

Seaborn прекрасно дополняет pandas. Стандартный подход таков: вы храните свои данные в pandas DataFrame, а Seaborn уже подстраивается под структуру данных, позволяя работать с колонками напрямую. --- ### Пример №1: График рассеяния (Scatter Plot) Представим, что у нас есть данные о разнице в окупаемости объектов в зависимости от их площади и цены. Задача: визуально оценить корреляцию между параметрами.

import seaborn as sns
import pandas as pd

# Пример данных
data = pd.DataFrame({
    'price': [200000, 150000, 300000, 350000, 500000],
    'area': [70, 50, 100, 120, 200]
})

# Построение графика
sns.scatterplot(x='area', y='price', data=data)
plt.title('Price vs Area')
plt.show()

График рассеяния отлично визуализирует взаимосвязь между переменными. А с помощью hue можно добавить третий фактор, например, категориальный:

data['type'] = ['apartment', 'apartment', 'house', 'house', 'villa']

sns.scatterplot(x='area', y='price', hue='type', data=data)
plt.title('Price vs Area with Property Types')
plt.show()

И уже вуаля — ваши данные начинают рассказывать истории! --- ### Пример №2: Распределение данных (Histogram и KDE) Когда вы работаете с числовыми данными, полезно понять их распределение. Seaborn предоставляет несколько инструментов, чтобы сделать это просто.

# Пример плотности и гистограммы
sns.histplot(data=data, x='price', kde=True)
plt.title('Price Distribution')
plt.show()

Параметр kde=True активно используется для добавления линейной функции плотности к графику. Он помогает визуально понять, где сконцентрированы ваши данные. --- ### Пример №3: Box Plot для категорий А как быть, если нужно сравнить несколько категорий? Например, сравнить цены недвижимости по типам объектов?

sns.boxplot(x='type', y='price', data=data)
plt.title('Price Distribution by Property Type')
plt.show()

Box Plot, или график размаха, мгновенно уточняет различия и показывает выбросы данных. На новом графике сразу видно, что виллы имеют значительно более высокую стоимость. --- ### Используйте темы и стили Seaborn — это не просто красиво, но еще и гибко. Вы можете настроить стиль ваших графиков под конкретные задачи и аудиторию.

sns.set_theme(style='whitegrid')  # Установка темы

Попробуйте разные стили: "darkgrid", "white", "ticks". Эти мелочи делают работу с графиками по-настоящему эстетической. --- ### Заключение Seaborn — это инструмент, который помогает не просто визуализировать данные, но и делать это эффективно и красиво. С его помощью вы быстро создадите графики для анализа, которые улучшают восприятие данных и облегчают их интерпретацию. Если вы работаете с данными, Seaborn должен стать вашим добрым другом. Попробуйте, поэкспериментируйте, создавайте свои графики и анализируйте! Этот инструмент, сочетая простоту и мощь, поможет вам взлететь на новый уровень работы с данными.

1 241

- Обработка и визуализация данных с помощью библиотеки seaborn

1 241

Вы можете: - Добавить обработку ошибок (например, если отправлен некорректный запрос). - Реализовать маршруты для обновления и удаления книг (методы PUT и DELETE). - Использовать базы данных вместо списка Python. - Добавить авторизацию для защиты API. --- ### Итоги Разработка RESTful сервисов с Flask — не только полезный, но и увлекательный процесс. С его помощью вы можете быстро разрабатывать прототипы и даже полноценные приложения. Это подходит как для обучения, так и для реальных проектов. Попробуйте создать свое API, нужное именно вам, — это невероятно затягивает!

1 241

# Разработка простых RESTful сервисов на Python Если вы когда-нибудь задумывались, как создаются веб-приложения, которые обмениваются данными между сервером и клиентом, то, вероятно, слышали о RESTful API. Это популярный подход в разработке, который позволяет создавать универсальные интерфейсы для кода, устройств и пользователей. Сегодня я расскажу, как быстро разработать простой RESTful сервис на Python. ## Почему Python? Python — язык, который словно создан для таких задач. У него есть минималистичный синтаксис, огромная экосистема библиотек и модулей, а главное — популярный веб-фреймворк Flask, который идеально подходит для разработки небольших RESTful сервисов. ## Установка Flask Для работы с Flask вам понадобится Python (очевидно!) и сам фреймворк. Установить его можно буквально за пару секунд с помощью pip:

pip install flask

Теперь мы готовы приступить к созданию нашего первого RESTful сервиса! --- ### Создание RESTful API 1. Базовая структура Flask-приложения Начнем с минимального рабочего примера. Создадим файл app.py с таким содержимым:

from flask import Flask, jsonify

app = Flask(__name__)

@app.route('/api/hello', methods=['GET'])
def say_hello():
    return jsonify({"message": "Hello, world!"})

if __name__ == '__main__':
    app.run(debug=True)

Что тут происходит: - Мы импортируем Flask и jsonify для удобного формирования JSON-ответов. - Создаем объект приложения app. - Определяем маршрут /api/hello, который обрабатывается функцией say_hello. Он возвращает JSON с приветственным сообщением. - Запускаем сервер с debug=True, чтобы видеть ошибки и автоматически перезапускать сервер при изменении кода. Если вы запустите этот скрипт, перейдете в браузере на http://127.0.0.1:5000/api/hello, то увидите:

{"message": "Hello, world!"}

2. Усложняем API: работа с данными Давайте расширим функционал нашего сервиса. Добавим возможность работать с простой коллекцией данных — списком книг. Мы реализуем следующие операции: - GET — получить список всех книг. - POST — добавить новую книгу. Допишем функционал в наш app.py:

books = []

@app.route('/api/books', methods=['GET'])
def get_books():
    return jsonify(books)

@app.route('/api/books', methods=['POST'])
def add_book():
    from flask import request
    new_book = request.get_json()
    books.append(new_book)
    return jsonify({"message": "Book added successfully!"}), 201

Объяснение: - Переменная books будет хранить список книг в виде массива (в реальном проекте здесь использовалась бы база данных, но для простоты мы этого касаться не будем). - Маршрут /api/books с методом GET возвращает весь список книг. - Маршрут с методом POST позволяет добавить новую книгу. Мы получаем данные из тела запроса через request.get_json(). После добавления книги возвращаем сообщение с кодом состояния 201 (успешное создание ресурса). Пример использования: 1. Отправляем GET-запрос на /api/books, получаем пустой список:

[]

2. Отправляем POST-запрос с телом:

   {"title": "Clean Code", "author": "Robert C. Martin"}

В ответ получаем:

   {"message": "Book added successfully!"}

3. Повторно отправляем GET-запрос, теперь в списке:

   [{"title": "Clean Code", "author": "Robert C. Martin"}]

--- 3. Удобный запуск через Postman или curl Для тестирования нашего API используйте инструменты вроде Postman или утилиту curl: - Получить книги:

  curl http://127.0.0.1:5000/api/books

- Добавить книгу:

  curl -X POST -H "Content-Type: application/json" \
      -d '{"title": "The Pragmatic Programmer", "author": "Andrew Hunt"}' \
      http://127.0.0.1:5000/api/books

--- ### Идеи для улучшения На этом этапе вы уже умеете создавать простое API, но это только начало.

1 241

- Разработка простых RESTful сервисов на Python

1 241

Работа с распределениями, тестами гипотез, функцией плотности вероятности — всё это доступно в модуле stats. #### Пример: Случайное нормальное распределение

from scipy.stats import norm

# Сгенерируем случайные данные
data = norm.rvs(loc=0, scale=1, size=1000)

# Найдём параметры распределения
mean, std = norm.fit(data)
print(mean, std)

--- ## Заключение SciPy — это мощный инструмент, который помогает решать широкий спектр задач: от оптимизаций до работы с данными и статистикой. Даже если вы только начинаете изучать Python, добавление этой библиотеки в ваш рабочий арсенал сделает вас гораздо продуктивнее. Надеюсь, этот краткий обзор вдохновит вас взять SciPy на вооружение. В следующем посте мы разберем более сложные применения и углубимся в конкретные сценарии, такие как обработка сигналов и численные решения дифференциальных уравнений. А пока вперед — экспериментируйте!

1 241

# Введение в библиотеку SciPy для научных расчетов Представьте себе вселенную Python как огромную мастерскую инструментов. У вас есть молоток под названием NumPy, который виртуозно обрабатывает массивы и матрицы. А вот рядом лежит более сложный инструмент — SciPy. Это как универсальный швейцарский нож для научных расчетов. Сегодня мы разберем, зачем нужна библиотека SciPy, что она умеет, и как её можно использовать в реальных задачах. --- ## Что такое SciPy? SciPy (Scientific Python) — это библиотека, основанная на NumPy, которая расширяет его функциональность и предлагает мощные инструменты для научных и инженерных расчетов. Она включает модули для работы с оптимизацией, статистикой, обработкой сигналов, интегрированием, интерполяцией и многими другими задачами. Если NumPy — это прочный фундамент, то SciPy — это целый дом, построенный на этом фундаменте. SciPy подходит всем: от студентов, изучающих линейную алгебру, до профессионалов, работающих в области анализа данных. --- ## Установка Прежде чем начать, давайте убедимся, что у вас установлен SciPy. Если нет, то добавьте её с помощью pip:

pip install scipy

И всё! Теперь у вас в руках один из самых мощных инструментов Python для научных задач. --- ## Ключевые возможности SciPy Поговорим о том, что делает SciPy таким универсальным. ### 1. Оптимизация (scipy.optimize) Иногда нужно найти минимум функции, например, чтобы минимизировать затраты при максимальной эффективности. SciPy предоставляет удобный интерфейс для этих задач. #### Пример: Минимизация функции

from scipy.optimize import minimize
import numpy as np

# Задаем функцию y = x^2 + 2x + 1
def objective(x):
    return x[0]**2 + 2*x[0] + 1

# Ищем минимум
result = minimize(objective, x0=[0])  # Начальная точка — 0
print(result.x)  # Координата минимума

Результат: минимальное значение функции достигается при x = -1. Просто и быстро нашли ответ. --- ### 2. Вычисление интегралов (scipy.integrate) Интегралы — это основа многих научных расчетов. SciPy позволяет легко работать как с определёнными, так и с численными интегралами. #### Пример: Определённый интеграл

from scipy.integrate import quad

# Интеграл от e^(-x^2) на интервале [0, ∞)
result, error = quad(lambda x: np.exp(-x**2), 0, np.inf)
print(result)  # Результат интеграла

Здесь мы вычисляем Gaussian integral (интеграл Гаусса) — важный компонент в теории вероятностей. --- ### 3. Интерполяция (scipy.interpolate) Иногда у нас есть дискретные данные, из которых нужно построить гладкую функцию. SciPy успешно справляется и с этой задачей. #### Пример: Построение интерполяции

from scipy.interpolate import interp1d
import numpy as np

# Данные
x = np.array([0, 1, 2, 3, 4])
y = np.array([0, 1, 4, 9, 16])

# Интерполяция линейной зависимостью
f = interp1d(x, y, kind='linear')

# Значение в промежуточной точке
print(f(2.5))  # Оценка для x = 2.5

Теперь можно работать с данными так, как будто у вас есть непрерывная функция. --- ### 4. Линейная алгебра (scipy.linalg) Для работы с матрицами и линейными уравнениями SciPy предлагает мощный модуль linalg. Он умеет всё: от поиска собственных значений до LU-разложения. #### Пример: Решение системы линейных уравнений Рассмотрим систему уравнений:

2x + y = 5
x - y = 1

Давайте решим её с помощью SciPy:

from scipy.linalg import solve
import numpy as np

# Коэффициенты матрицы
A = np.array([[2, 1], [1, -1]])
b = np.array([5, 1])

# Решение системы
solution = solve(A, b)
print(solution)  # [x, y]

SciPy мгновенно выдаёт ответ: x = 2, y = 1. --- ### 5. Статистика (scipy.stats) SciPy — это не только математика, но и статистика.

1 241

- Введение в библиотеку SciPy для научных расчетов

1 241

Вот как можно это сделать:

import os

dir_path = "test_folder"
file_extension = ".tmp"

if os.path.exists(dir_path):
    for file_name in os.listdir(dir_path):
        if file_name.endswith(file_extension):
            file_path = os.path.join(dir_path, file_name)
            os.remove(file_path)
            print(f"Removed: {file_path}")
else:
    print(f"Directory {dir_path} does not exist.")

Скрипт пройдет по папке, проверит расширение файлов и удалит ненужные. --- ### Заключение Модули os и sys — это настоящие "швейцарские ножи" для работы с системой. Они позволяют вашему коду стать адаптивным и гибким. Хотите управлять файлами, обрабатывать аргументы командной строки или узнавать информацию о среде выполнения — используйте os и sys. Теперь у вас есть базовый набор инструментов, чтобы творить что угодно!

1 241

Как использовать sys и os для взаимодействия с системой Давайте поговорим о том, как Python может стать мостом между вашей программой и операционной системой. Если вы хотите управлять файлами, работать с путями, копаться в системных переменных или даже узнавать, на каком выходитом коде завершилась программа, вам не обойтись без модулей sys и os. Эти два мощных инструмента — ваши глаза и руки для взаимодействия с системой. Итак, давайте разберемся, чем они полезны и как их использовать. --- ### Модуль os: ваш проводник по файловой системе Модуль os позволяет напрямую взаимодействовать с операционной системой. Его функционал огромен: работа с файлами и папками, управление путями, запуск внешних команд — и это только начало. #### Пример 1. Проверяем, существует ли файл Предположим, вы хотите узнать, существует ли файл example.txt и является ли он файлом:

import os

file_path = "example.txt"

if os.path.exists(file_path):
    if os.path.isfile(file_path):
        print(f"{file_path} exists and is a file!")
    else:
        print(f"{file_path} exists, but it is not a file.")
else:
    print(f"{file_path} does not exist.")

Метод os.path.exists() проверяет существование файла или папки. А с os.path.isfile() вы можете уточнить, что перед вами именно файл, а не папка или символическая ссылка. --- #### Пример 2. Создание и удаление папок Создать папку можно с помощью метода os.mkdir(), а удалить — os.rmdir(). Будьте осторожны: если папка не пуста, возникнет ошибка.

import os

dir_path = "my_folder"

# Создаем папку, если ее нет
if not os.path.exists(dir_path):
    os.mkdir(dir_path)
    print(f"{dir_path} created.")
else:
    print(f"{dir_path} already exists.")

# Теперь удалим ее
if os.path.exists(dir_path):
    os.rmdir(dir_path)
    print(f"{dir_path} removed.")

Для создания сложных вложенных структур можно использовать os.makedirs(), а для удаления таких структур — модуль shutil. --- ### Модуль sys: настройка выполнения Python Если os — это ваши руки, то sys — это глаза, которые позволяют вашей программе видеть, где она выполняется и как она была запущена. #### Пример 3. Аргументы командной строки sys.argv — это список аргументов, переданных при запуске скрипта. Первый элемент — это имя самого скрипта, а остальные — произвольные аргументы, которые вы укажете.

import sys

print("Script name:", sys.argv[0])  # Имя скрипта
if len(sys.argv) > 1:
    print("Arguments:", sys.argv[1:])  # Аргументы, переданные скрипту
else:
    print("No arguments provided.")

Попробуйте запустить этот скрипт так:

python your_script.py arg1 arg2 arg3

И вы увидите в выводе переданные аргументы. --- #### Пример 4. Завершение программы с кодом ошибки С помощью sys.exit() можно завершить выполнение программы. В качестве аргумента передается код завершения: 0 — успешное выполнение, любое другое число — ошибка.

import sys

# Завершаем программу с ошибкой
print("Something went wrong.")
sys.exit(1)

Если заменить 1 на 0, программа завершится без ошибок. Системный код завершения полезен для взаимодействия с другими скриптами или утилитами. --- ### Объединяем усилия Хотите узнать, в какой операционной системе вы работаете, и где находится исполняемый файл Python? Легко!

import os
import sys

print("Operating system:", os.name)  # 'posix' для Unix-систем, 'nt' для Windows
print("Python executable path:", sys.executable)

Этот код покажет вам, используете ли вы Windows или Linux/Unix, а также путь к интерпретатору Python. --- ### Пример из реальной жизни: автоматическая обработка файлов Допустим, у вас есть папка с файлами, и вам нужно удалить все файлы с определенным расширением, например .tmp.

1 241

- Как использовать sys и os для взаимодействия с системой

1 241

Так что разбирайтесь с алгоритмами, это полезный навык, который вас точно не подведет!

1 241

### Алгоритмы сортировки: от простого к сложному Сортировка — это тот самый тип задач, с которым сталкивается любой программист. Независимо от вашего уровня подготовки, знание алгоритмов сортировки существенно расширяет ваши горизонты в программировании. Сегодня я расскажу, как можно отсортировать элементы списка с помощью разных подходов: от интуитивно понятных до эффективных и оптимизированных. #### Пузырьковая сортировка: проще некуда На первом месте в нашем списке — пузырьковая сортировка. Она проверяет каждый элемент массива, сравнивает его со следующим, и если текущий элемент больше, они меняются местами. Процесс повторяется до тех пор, пока список не будет полностью отсортирован.

def bubble_sort(array):
    n = len(array)
    for i in range(n):
        for j in range(0, n - i - 1):
            if array[j] > array[j + 1]:
                array[j], array[j + 1] = array[j + 1], array[j]

data = [64, 34, 25, 12, 22]
bubble_sort(data)
print(data)  # [12, 22, 25, 34, 64]

Этот алгоритм прост, но медленный. Его временная сложность — O(n²), что делает пузырьковую сортировку практически бесполезной для больших массивов. --- #### Сортировка выбором: минималистичный подход Следующий метод — это сортировка выбором. Идея проста: мы находим минимальный элемент и меняем его местами с элементом на первой позиции, затем повторяем процесс для оставшегося массива.

def selection_sort(array):
    for i in range(len(array)):
        min_idx = i
        for j in range(i + 1, len(array)):
            if array[j] < array[min_idx]:
                min_idx = j
        array[i], array[min_idx] = array[min_idx], array[i]

data = [64, 34, 25, 12, 22]
selection_sort(data)
print(data)  # [12, 22, 25, 34, 64]

С временной сложностью O(n²) этот алгоритм работает лучше пузырьковой сортировки, так как выполняет меньше операций перестановки. --- #### Быстрая сортировка: работа с рекурсией Теперь отправляемся в мир более эффективных алгоритмов — быстрая сортировка (QuickSort). Это превосходный пример "разделяй и властвуй". Она делит список на две части: элементы меньше опорного попадают в левую часть, больше — в правую. Затем процесс повторяется для каждой из частей.

def quick_sort(array):
    if len(array) <= 1:
        return array
    pivot = array[len(array) // 2]  # выбираем средний элемент как опорный
    left = [x for x in array if x < pivot]
    middle = [x for x in array if x == pivot]
    right = [x for x in array if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

data = [64, 34, 25, 12, 22]
result = quick_sort(data)
print(result)  # [12, 22, 25, 34, 64]

Быстрая сортировка имеет среднюю временную сложность O(n log n), что делает ее невероятно популярным вариантом. --- #### Сортировка встроенными методами Python Все алгоритмы хороши, но в конечном счете, вам зачастую не нужно изобретать велосипед. Python имеет встроенную функцию sorted() и метод списка .sort(), которые работают на основе гибридного алгоритма Timsort. Он сочетает в себе подходы из сортировки вставками и слиянием.

data = [64, 34, 25, 12, 22]
result = sorted(data)
print(result)  # [12, 22, 25, 34, 64]

Встроенная сортировка в Python работает быстро и оптимизирована для большинства сценариев. Ее временная сложность — O(n log n). --- #### Какой алгоритм выбрать? 1. Если у вас небольшой массив, вы хотите получить базовое понимание — начинайте с пузырьковой сортировки. 2. Нужно что-то чуть сложнее? Сортировка выбором покажет, как добиться результата за меньшее количество операций. 3. Хотите понять, как работают эффективные алгоритмы? Разберитесь с быстрой сортировкой. 4. Работаете с реальными задачами? Без сомнений, используйте встроенную sorted(). Каждый из рассмотренных алгоритмов — это отдельная ступень в обучении. Знание принципов сортировки важно не только для решения базовых задач, но и для понимания более сложных структур данных, таких как деревья или кучи.

1 241

- Алгоритмы сортировки: от простого к сложному

1 241

Асинхронный подход особенно хорошо подходит для задач ввода-вывода и масштабируемых серверов без необходимости создания тысяч потоков. Пример асинхронной загрузки веб-страниц:

import asyncio
import aiohttp

async def fetch_data(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as response:
            text = await response.text()
            print(f"{url}: {len(text)} bytes received")

urls = [
    "https://www.python.org",
    "https://www.wikipedia.org",
    "https://www.github.com"
]

async def main():
    tasks = [fetch_data(url) for url in urls]
    await asyncio.gather(*tasks)

asyncio.run(main())

Асинхронный код часто оказывается более производительным и читаемым, чем многопоточность, но на первый взгляд он может показаться сложным. Однако это далеко не так, и следует хотя бы попробовать! --- ### Заключение Python предоставляет мощные инструменты для работы с потоками и процессами. Используя их разумно, вы сможете добиться значительного ускорения своих программ и улучшить их производительность. Но всегда помните — чрезмерное усложнение архитектуры программы может привести к непредсказуемым багам и сложностям в отладке. Поэтому управлять потоками и процессами нужно аккуратно и с пониманием целей. Удачи в ваших экспериментах!

1 241

Управление потоками и процессами в Python: эффективное использование возможностей языка Привет, друзья! Сегодня поговорим об одной из самых увлекательных и мощных возможностей Python — управлении потоками (threads) и процессами (processes). Если вы хотите ускорить выполнение задач, оптимизировать ресурсозатраты или просто разобраться, в чем различие между параллельным и многопоточным программированием, добро пожаловать! --- ### Потоки и процессы: в чем разница? Прежде чем перейти к практике, давайте немного разберемся в теории. - Процесс — это независимая программа, выполняемая операционной системой. Каждый процесс имеет свою область памяти, что делает его изолированным, но более требовательным к ресурсам. - Поток — это "легковесный" подкомпонент процесса, который выполняется внутри него. Несколько потоков в одном процессе могут делить между собой память, что облегчает общение между ними, но порождает проблемы, такие как "глобальная блокировка интерпретатора" (GIL). Если ваша задача связана с интенсивными вычислениями, лучше использовать процессы. Если нужно выполнять множество операций ввода-вывода, например, скачивать данные с интернета, потоков будет достаточно. --- ### Многопоточность в Python Python предоставляет удобный модуль threading для работы с потоками. Несмотря на ограничение GIL, для задач ввода-вывода (например, загрузка данных) многопоточность все еще полезна. Давайте рассмотрим пример — загрузку нескольких веб-страниц одновременно:

import threading
import requests

def fetch_data(url):
    response = requests.get(url)
    print(f"{url}: {len(response.text)} bytes received")

urls = [
    "https://www.python.org",
    "https://www.wikipedia.org",
    "https://www.github.com"
]

threads = []
for url in urls:
    thread = threading.Thread(target=fetch_data, args=(url,))
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()  # Ждем завершения всех потоков

Код одновременно загружает несколько страниц и выводит их размер. threading.Thread позволяет легко запускать потоки, а join гарантирует, что программа завершится только после всех вычислений. --- ### Многопроцессорность в Python Модуль multiprocessing предоставляет возможность работать с процессами, что особенно полезно для выполнения ресурсоемких вычислений. Вот простой пример: предположим, нам нужно вычислить квадраты для большого набора чисел:

from multiprocessing import Process

def calculate_square(numbers):
    for num in numbers:
        print(f"Square of {num}: {num**2}")

numbers = [1, 2, 3, 4, 5]

process1 = Process(target=calculate_square, args=(numbers,))
process2 = Process(target=calculate_square, args=(numbers,))

process1.start()
process2.start()

process1.join()
process2.join()

Здесь два процесса выполняют одну и ту же функцию. Это пример того, как мы можем распределять ресурсоемкую задачу между процессами. Каждый процесс полностью изолирован, поэтому глобальная блокировка интерпретатора (GIL) нам не помеха. --- ### Когда что использовать? - Используйте потоки (threading), если ваша программа в основном занята ожиданием ввода-вывода: например, сетевые запросы, работа с файлами или ожидание ответа от базы данных. - Используйте процессы (multiprocessing), если в вашей задаче много вычислений — например, обработка изображений или видео, математическое моделирование и т.д. --- ### Асинхронность — альтернатива потокам Не стоит забывать про еще один подход — асинхронное программирование с использованием модуля asyncio. Он позволяет писать легковесный код, который под капотом работает на основе событийной модели.

1 241

- Управление потоками и процессами в Python

1 241

# Основы работы с библиотекой pandas для анализа данных Если вы хотя бы раз сталкивались с анализом данных в Python, то наверняка слышали о библиотеке pandas. Это мощный инструмент, который позволяет работать с табличными данными в удобном формате. С pandas вы можете, например, читать данные из файлов, обрабатывать их, фильтровать, трансформировать и даже визуализировать. Сегодня мы рассмотрим ключевые возможности этой библиотеки и познакомимся с основными методами, которые сделают вашу работу с данными проще и быстрее. --- ## Что такое pandas и для чего она нужна? Основной объект в pandas — это DataFrame. В простых словах, это таблица, похожая на Excel или Google Sheets, но управлять этой таблицей можно программно. У pandas также есть второй важный объект — Series, представляющий собой одномерный массив данных, похожий на колонку в таблице. pandas используется, когда нужно: - Загружать данные из различных источников (CSV, Excel, базы данных); - Фильтровать или трансформировать данные; - Рассчитывать статистические показатели; - Работать с пропущенными значениями; - Произвести группировку и агрегацию данных. Круто, правда? Теперь давайте перейдём от слов к делу. --- ## Пример 1: Загрузка данных Допустим, у нас есть CSV-файл с информацией о продажах. Начнём с загрузки данных в DataFrame:

import pandas as pd

# Загрузка данных из файла
data = pd.read_csv('sales_data.csv')

# Выведем первые пять строк таблицы
print(data.head())

Метод read_csv позволяет быстро загрузить данные. После этого метод head() показывает первые пять строк. Это удобно для первого знакомства с таблицей. --- ## Пример 2: Основы фильтрации Давайте представим, что мы хотим выбрать только те записи, где сумма продажи превышает 100:

# Фильтрация данных
filtered_data = data[data['sale_amount'] > 100]

print(filtered_data)

Здесь мы используем логическое выражение для фильтрации строк. В целом, работа с данными в pandas очень похожа на то, как это делается в SQL, что делает библиотеку особенно удобной для тех, кто уже знаком с базами данных. --- ## Пример 3: Обработка пропущенных значений В мире данных пустые значения — это обычное дело. Просмотрим, есть ли пропуски, и заменим их на ноль:

# Проверим пропуски
print(data.isnull().sum())

# Заполним пропуски нулями
data = data.fillna(0)

Функция isnull() даёт нам понимание, сколько пропусков находится в каждой колонке. А fillna() позволяет заполнить их, например, нулями или средним значением. --- ## Пример 4: Агрегация Что если мы хотим узнать, сколько продаж (и на какую сумму) пришлось на каждого продавца?

# Группировка и агрегация
summary = data.groupby('seller')['sale_amount'].sum()

print(summary)

Метод groupby() помогает сгруппировать данные, а sum() подводит итог по количественным данным. Этот инструмент невероятно полезен для аналитики. --- ## Пример 5: Сохранение результата После обработки данных можно сохранить результат в новый файл:

# Сохранение в CSV
data.to_csv('processed_data.csv', index=False)

Метод to_csv() — это отличный способ сохранить вашу работу для последующего использования. --- ## Вывод pandas — это настоящий швейцарский нож для работы с данными. Он интуитивно понятен и мощен одновременно. От загрузки данных до сложных вычислений — всё можно сделать с минимальным количеством кода. Если вы ещё не пробовали pandas в деле, настоятельно рекомендую. Эта библиотека станет вашим надёжным помощником в любых проектах, связанных с данными.

1 241

- Основы работы с библиотекой pandas для анализа данных