Кейс 7: Характеристика основных этапов процесса анализа данных
star
star
star
star
star
Last updated about 1 year ago
14 questions
Создайте файл в Jupiter notebook, назовите его фамилия_№группы.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Проверка пропущенных значений
Проверьте данные на наличие пропущенных значений и устраните их.
Используйте .isnull().sum() для проверки пропущенных значений. Замените пропуски в числовых столбцах медианным значением (.fillna(df.median())), а в категориальных — наиболее частым значением.
1
Выберит е оценку проделанной работы:
Выберит е оценку проделанной работы:
Вычисление средних значений
Руководитель аналитического отдела просит вас вычислить средние значения для ключевых показателей.
Используйте метод .mean() для расчета среднего значения для каждого числового столбца, выведите результаты и сделайте краткие выводы о характере данных.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Определение корреляции между показателями
Постройте корреляционную матрицу, чтобы понять взаимосвязи между переменными.
Используйте .corr() для расчета корреляционной матрицы и визуализируйте ее с помощью sns.heatmap() (Seaborn). Определите, какие переменные наиболее связаны друг с другом.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Создание визуализаций
Для наглядности данных подготовьте гистограммы и диаграммы рассеяния по ключевым показателям.
Используйте plt.hist() для построения гистограммы и plt.scatter() для создания диаграммы рассеяния по нескольким показателям, чтобы увидеть распределение и взаимосвязи.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Подготовка данных для модели
Отдел аналитики просит подготовить данные для предсказательной модели и выделить целевую переменную.
Выберите целевую переменную и признаки для модели, разделите данные на обучающую и тестовую выборки, используя train_test_split из Scikit-Learn.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Построение линейной модели
Создайте простую модель линейной регрессии для прогноза значений целевой переменной.
Подключите LinearRegression из Scikit-Learn, создайте и обучите модель с помощью .fit(), используя обучающую выборку. Выполните прогноз на тестовой выборке и сохраните результаты.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Оценка точности модели
Используйте метрику MSE для оценки качества модели и уточните её значения.
Подключите mean_squared_error из Scikit-Learn и рассчитайте MSE для предсказаний на тестовой выборке. Выведите результаты и проанализируйте точность модели.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Интерпретация результатов
Сделайте выводы по значимости показателей и возможному влиянию факторов на прогноз.
Используя коэффициенты модели (model.coef_), определите значимость различных признаков для предсказания целевой переменной. Сделайте выводы о том, какие показатели наиболее значимы для анализа.
1
Выберите оценку проделанной работы:
Выберите оценку проделанной работы:
Required
1
Загрузите файл с работой
Загрузите файл с работой
Required
1
1. Активность участия
1. Активность участия
Required
1
2. Решение проблем:
2. Решение проблем:
Required
1
3. Применения теоретических знаний
3. Применения теоретических знаний
Required
1
4. Качество работы с кейсами
4. Качество работы с кейсами