Data Scientist

  • Занятость:
  • График работы:

Опыт работы

Май 2020 —
март 2021
10 месяцев
Яндекс.Практикум
Data Scientist (обучение)
- работаю на Python;
- использую библиотеки: Pandas, Numpy, SciPy, Matplotlib, Seaborn, Scikit-learn, Lightgbm, Catboost, Xgboost, Keras, Shap;
- собираю данные в SQL, PySpark;
- знаю Git на уровне пользователя.

Проекты:

Отток клиентов банка
Задача: построить модель для предсказания оттока клиентов банка. Целевая метрика: F1.
Стек: Pandas, Matplotlib, Seaborn, Sklearn
Метод решения: выполнил предобработку данных. Провел первичный анализ данных. Преобразовал категориальные признаки методом OneHotEncoding. Сравнил методы по работе с дисбалансом классов - weight balanced, upsampling, downsampling.
Результат: лучшая метрика достигнута после метода upsampling. Выбрана лучшая модель случайного леса. Посчитана метрика ROC-AUC: 0.85. Достигнута целевая метрика F1: 0.63.


Выбор нефтяных скважин
Задача: построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль.
Стек: Pandas, Matplotlib, Seaborn, Sklearn
Метод решения: выполнил предобработку данных. Провел первичный анализ данных. Построил модель линейной регрессии для каждого региона. Сделал предсказание запаса сырья в каждом регионе. Техникой Bootstrap рассчитал распределение прибыли в регионах. Рассчитал доверительный интервал и вероятность убытков.
Результат: выбран лучший регион для разработки скважин.
https://github.com/IlyaMoshonkin/ds_projects/tree/master/select_oilwells

Предсказание температуры стали
Задача: построить модель предсказания температуры стали для оптимизации электропотребления. Целевая метрика: MAE.
Стек: Pandas, Matplotlib, Seaborn, Sklearn, LightGBM, CatBoost, Eli5, Shap
Метод решения: Выполнил предобработку данных, заполнил пропуски и удалил аномальные значения. Проведена работа по слиянию нескольких датасетов и извлечению признаков из сырых данных. Построены несколько моделей – линейная регрессия, градиентный бустинг.
Результат: Выбрана лучшая модель градиентного бустинга. Проведена интерпретация предсказаний модели с помощью Shap-value. Достигнута метрика MAE на тестовой выборке: 5.75.
https://github.com/IlyaMoshonkin/ds_projects/tree/master/steel_temperature

Определение возраста человека по фотографии
Задача: сделать модель предсказания возраста человека по фотографии. Целевая метрика: MAE
Стек: Matplotlib, Tensorflow, Keras.
Метод решения: Проведена работа по аугментации данных. Построена модель ResNet-50 методом transfer learning.
Результат: модель проверена на тестовой выборке. Достигнута метрика MAE: 7.46.
https://github.com/IlyaMoshonkin/ds_projects/tree/master/face_age_define
Январь 2014 —
март 2021
7 лет 2 месяца
ГАЗИНФОРМСЕРВИС
Ведущий инженер
Анализировал исходные данные для проектов систем безопасности. Разрабатывал документацию на системы в соответствии с техническими требованиями. Автоматизировал рутинные задачи в Excel, Autocad с помощью формул и командной строки. Помог системным аналитикам в разработке технических требований на программный комплекс для автоматизации проездов на территорию. Ключевые проекты:
1. Комплекс инженерно-технических средств охраны в МФК Лахта-центр.
2. Комплекс инженерно-технических средств охраны в МФК Минск.

Обо мне

tel: +7 911 016 27 29
mail: iliamosonkin@yandex.ru
telegram: ilyamoss
whatsapp: +7 911 016 27 29
https://www.facebook.com/ilyamoshonkinspb
https://www.linkedin.com/in/ilyamos/

Решил более осознано выбрать сферу деятельности. Искал активно развивающуюся и прикладную область. Меня заинтересовала индустрия анализ данных, у которой широкий спектр применения. Мне нравится, что машинное обучение помогает оптимизировать задачи бизнеса, приносить измеримый эффект. Верю в data-driven подход.

Отрабатываю навыки на платформах kaggle, stepik, codesignal, datacamp. Смотрю доклады ods.ai, karpov.courses, leands. Изучаю технологии для работы с большими данными: Hadoop, Hive, Hbase, Spark. Читаю блог Дьяконова. Изучаю алгоритмы и структуры данных (знаю на уровне книги Грокаем алгоритмы).

Успешно работал в команде над большими проектами, взаимодействовал со смежными отделами для достижения результата. Ответственно подхожу к планированию и выполнению рабочих задач. Готов погружаться в сложные задачи.

Люблю путешествовать, делать кадры с дрона, кататься на сноуборде, осваивать новые навыки.

Образование высшее

2015
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург
Инженерно-физический, Магистр техники и технологии по направлению Техническая физика
2013
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург
Инженерно-физический, Бакалавр техники и технологии по направлению Техническая физика

Знание языков

Русский — родной
Иностранные языки
АнглийскийA1 — Начальный

Гражданство, время в пути до работы

  • Гражданство:
    Нет
  • Разрешение на работу:
    Нет
  • Желательное время в пути до работы:
    Не имеет значения