Кейс 6: Визуализация данных для анализа с использованием Matplotlib

Last updated about 1 year ago
18 questions
Описание ситуации: Вы продолжаете работу в компании "Технологии будущего". На одной из встреч с аналитиком компании, Андреем, он рассказывает о необходимости визуализации данных для анализа. Андрей объясняет, что использование научной графикипомогает не только увидеть тенденции и закономерности в данных, но и более эффективно передавать результаты анализа другим отделам. Для этого компания использует библиотеку Matplotlib, которая позволяет создавать различные типы графиков и диаграмм.
"В Matplotlib мы используем объект, называемый рисунком(figure), на котором размещаются графики. Основные виды графиков включают гистограммыдля отображения распределения, диаграммы рассеяниядля анализа зависимости между переменными, линейные графикидля отображения трендов, круговые диаграммы для распределения категорий и тепловые карты для визуализации данных в матрице."
Проблемная ситуация: Вам предстоит понять, как визуализация помогает в анализе данных.
Исходные условия: Данные предоставлены в формате CSV, включающие числовые и категориальные значения для анализа. Работа выполняется в Jupyter Notebook, каждое задание выполняется в отдельной ячейке.
Форма выполнения задания: Индивидуальная работа.
Программные инструменты для выполнения:
- ПО: Jupyter Notebook
- Язык программирования: Python
- Библиотека: Matplotlib
Требования к результату выполнения задания: Предоставить файл .ipynb с выполненными заданиями, содержащий примеры визуализаций и комментарии.
Создайте файл в Jupiter notebook, назовите его фамилия_№группы.
1

Выберите оценку проделанной работы:

Создание базового рисунка (figure): Создайте пустой рисунок и настройте его размер, чтобы привыкнуть к понятию рисунка.
Используйте plt.figure(figsize=(8, 6)) для создания рисунка. Настройте размер рисунка и выведите его, чтобы убедиться, что все работает корректно.
1

Выберите оценку проделанной работы:

Гистограмма: Постройте гистограмму для числового столбца данных, чтобы увидеть распределение значений.
Используйте plt.hist() для построения гистограммы по выбранному столбцу данных. Настройте параметры, такие как количество бинов, и выведите график.
1

Выберите оценку проделанной работы:

Диаграмма рассеяния: Постройте диаграмму рассеяния для двух числовых столбцов, чтобы проанализировать связь между переменными.
Используйте plt.scatter(x, y) для построения диаграммы рассеяния. Укажите, что ось x соответствует одному столбцу, а ось y — другому, и выведите график.
1

Выберите оценку проделанной работы:

Линейный график: Постройте линейный график для анализа тренда числовых данных, например, изменение значений по времени.
Используйте plt.plot(x, y) для создания линейного графика, где ось x — это время (или другая переменная), а ось y — значения. Настройте график и выведите его.
1

Выберите оценку проделанной работы:

Круговая диаграмма: Создайте круговую диаграмму, чтобы отобразить распределение категорий в выбранном столбце данных.
Используйте plt.pie() для создания круговой диаграммы. Укажите доли для каждой категории и выведите график.
1

Выберите оценку проделанной работы:

Диаграмма размаха (boxplot): Постройте диаграмму размаха для анализа распределения данных и выявления выбросов.
Используйте plt.boxplot() для создания диаграммы размаха по выбранному столбцу данных. Настройте параметры и выведите график.
1

Выберите оценку проделанной работы:

Тепловая карта: Постройте тепловую карту для визуализации корреляции между числовыми столбцами данных.
Используйте метод sns.heatmap() из библиотеки Seaborn, которая работает на базе Matplotlib, для построения тепловой карты. Выведите корреляцию для числовых столбцов данных.
1

Выберите оценку проделанной работы:

Настройка осей и заголовков: Добавьте названия осей и заголовок к одному из графиков, чтобы сделать его более информативным.
Используйте plt.xlabel(), plt.ylabel(), и plt.title() для настройки осей и заголовка.
1

Выберите оценку проделанной работы:

Настройка цвета и стиля линий: Измените цвет и стиль линии на линейном графике, чтобы сделать его более заметным и стильным.
Используйте аргументы color, linestyle, и linewidth в plt.plot() для изменения цвета и стиля линии. Выведите график с новыми параметрами.
1

Выберите оценку проделанной работы:

Сравнительная гистограмма: Постройте гистограммы для двух разных столбцов данных на одном рисунке для их сравнения.
Используйте plt.hist() дважды для создания двух гистограмм на одном рисунке, укажите разные цвета для наглядности.
1

Выберите оценку проделанной работы:

Построение графиков с легендой: Постройте линейный график с несколькими линиями и добавьте легенду для их различия.
Используйте plt.plot() для построения нескольких линий на одном графике и plt.legend() для добавления легенды.
1

Выберите оценку проделанной работы:

Создание тепловой карты для категорий: Постройте тепловую карту, показывающую распределение категорий по частоте.
Используйте sns.heatmap() и передайте в нее частотную таблицу для создания тепловой карты, отображающей распределение категорий.
1

Выберите оценку проделанной работы:

1

Загрузите файл с работой

Оцените свою работу с кейсом.
Следующий блок оценивается Вами и педагогом.
1

1. Активность участия

1

2. Решение проблем:

1

3. Применения теоретических знаний

1

4. Качество работы с кейсами