Log in
Sign up for FREE
arrow_back
Library

Кейс 6: Визуализация данных для анализа с использованием Matplotlib

star
star
star
star
star
Last updated over 1 year ago
18 questions
1
1
1
1
1
Описание ситуации: Вы продолжаете работу в компании "Технологии будущего". На одной из встреч с аналитиком компании, Андреем, он рассказывает о необходимости визуализации данных для анализа. Андрей объясняет, что использование научной графикипомогает не только увидеть тенденции и закономерности в данных, но и более эффективно передавать результаты анализа другим отделам. Для этого компания использует библиотеку Matplotlib, которая позволяет создавать различные типы графиков и диаграмм.
"В Matplotlib мы используем объект, называемый рисунком(figure), на котором размещаются графики. Основные виды графиков включают гистограммыдля отображения распределения, диаграммы рассеяниядля анализа зависимости между переменными, линейные графикидля отображения трендов, круговые диаграммы для распределения категорий и тепловые карты для визуализации данных в матрице."
Проблемная ситуация: Вам предстоит понять, как визуализация помогает в анализе данных.
Исходные условия: Данные предоставлены в формате CSV, включающие числовые и категориальные значения для анализа. Работа выполняется в Jupyter Notebook, каждое задание выполняется в отдельной ячейке.
Форма выполнения задания: Индивидуальная работа.
Программные инструменты для выполнения:
- ПО: Jupyter Notebook
- Язык программирования: Python
- Библиотека: Matplotlib
Требования к результату выполнения задания: Предоставить файл .ipynb с выполненными заданиями, содержащий примеры визуализаций и комментарии.
Создайте файл в Jupiter notebook, назовите его фамилия_№группы.
1
Создание базового рисунка (figure): Создайте пустой рисунок и настройте его размер, чтобы привыкнуть к понятию рисунка.
Используйте plt.figure(figsize=(8, 6)) для создания рисунка. Настройте размер рисунка и выведите его, чтобы убедиться, что все работает корректно.
1
Гистограмма: Постройте гистограмму для числового столбца данных, чтобы увидеть распределение значений.
Используйте plt.hist() для построения гистограммы по выбранному столбцу данных. Настройте параметры, такие как количество бинов, и выведите график.
1
Диаграмма рассеяния: Постройте диаграмму рассеяния для двух числовых столбцов, чтобы проанализировать связь между переменными.
Используйте plt.scatter(x, y) для построения диаграммы рассеяния. Укажите, что ось x соответствует одному столбцу, а ось y — другому, и выведите график.
1
Линейный график: Постройте линейный график для анализа тренда числовых данных, например, изменение значений по времени.
Используйте plt.plot(x, y) для создания линейного графика, где ось x — это время (или другая переменная), а ось y — значения. Настройте график и выведите его.
1
Круговая диаграмма: Создайте круговую диаграмму, чтобы отобразить распределение категорий в выбранном столбце данных.
Используйте plt.pie() для создания круговой диаграммы. Укажите доли для каждой категории и выведите график.
1
Диаграмма размаха (boxplot): Постройте диаграмму размаха для анализа распределения данных и выявления выбросов.
Используйте plt.boxplot() для создания диаграммы размаха по выбранному столбцу данных. Настройте параметры и выведите график.
1
Тепловая карта: Постройте тепловую карту для визуализации корреляции между числовыми столбцами данных.
Используйте метод sns.heatmap() из библиотеки Seaborn, которая работает на базе Matplotlib, для построения тепловой карты. Выведите корреляцию для числовых столбцов данных.
1
Настройка осей и заголовков: Добавьте названия осей и заголовок к одному из графиков, чтобы сделать его более информативным.
Используйте plt.xlabel(), plt.ylabel(), и plt.title() для настройки осей и заголовка.
1
Настройка цвета и стиля линий: Измените цвет и стиль линии на линейном графике, чтобы сделать его более заметным и стильным.
Используйте аргументы color, linestyle, и linewidth в plt.plot() для изменения цвета и стиля линии. Выведите график с новыми параметрами.
1
Сравнительная гистограмма: Постройте гистограммы для двух разных столбцов данных на одном рисунке для их сравнения.
Используйте plt.hist() дважды для создания двух гистограмм на одном рисунке, укажите разные цвета для наглядности.
1
Построение графиков с легендой: Постройте линейный график с несколькими линиями и добавьте легенду для их различия.
Используйте plt.plot() для построения нескольких линий на одном графике и plt.legend() для добавления легенды.
1
Создание тепловой карты для категорий: Постройте тепловую карту, показывающую распределение категорий по частоте.
Используйте sns.heatmap() и передайте в нее частотную таблицу для создания тепловой карты, отображающей распределение категорий.
1
Question 14
14.

Загрузите файл с работой

Оцените свою работу с кейсом.
Следующий блок оценивается Вами и педагогом.
Question 15
15.

Question 16
16.

Question 17
17.

Question 18
18.

Question 1
1.

Выберите оценку проделанной работы:

Question 2
2.

Выберите оценку проделанной работы:

Question 3
3.

Выберите оценку проделанной работы:

Question 4
4.

Выберите оценку проделанной работы:

Question 5
5.

Выберите оценку проделанной работы:

Question 6
6.

Выберите оценку проделанной работы:

Question 7
7.

Выберите оценку проделанной работы:

Question 8
8.

Выберите оценку проделанной работы:

Question 9
9.

Выберите оценку проделанной работы:

Question 10
10.

Выберите оценку проделанной работы:

Question 11
11.

Выберите оценку проделанной работы:

Question 12
12.

Выберите оценку проделанной работы:

Question 13
13.

Выберите оценку проделанной работы:

1. Активность участия
0 баллов: редко участвует в обсуждениях и выполнении заданий, вносит минимальный вклад.
5 баллов: участвует в обсуждениях, вклад средний.
10 баллов: активно участвует в обсуждениях, вносит значительный вклад, проявляет инициативу.
2. Решение проблем:
0 баллов: Предложенные решения неэффективны или не соответствуют поставленным задачам.
5 балла: Решения частично эффективны, но требуют дополнительных обоснований и проработки.
10 баллов: Решения эффективны, логичны и полностью соответствуют задачам кейса.
3. Применения теоретических знаний
0 баллов: Теоретические концепции применяются некорректно или отсутствуют.
5 баллов: Теоретические концепции применяются, но есть неточности или недоработки.
10 баллов: Корректное и грамотное применение теоретических концепций, точное использование знаний.
4. Качество работы с кейсами
0 баллов: Анализ неполный, выводы поверхностные, отсутствие структурированного подхода.
5 баллов: Анализ достаточно глубокий, выводы частично обоснованы, подход структурирован, но требует уточнений.
10 баллов: Анализ всесторонний, выводы обоснованы, подход хорошо структурирован и аргументирован.