Data Scientist

  • Занятость:
    Полная занятость
  • График работы:
    Полный день

Опыт работы

Сентябрь 2018 —
декабрь 2020
2 года 3 месяца
Работа в проектах
Data Scientist
• Preprocessing, Feature Engineering ( numpy, pandas), визуализация (matplotlib, seaborn, plotly)
• Задачи классификации и регрессии (ensembles, sklearn: GridSearchCV, Linear models, DecisionTree, KNN, RandomForest, SVM )
• Рекомендательные системы: на основе содержания ( pymorphy, TF-IDF, CountVectorizer), коллаборативная фильтрация (surprise: KNN, SVD, CoClustering), гибридные системы
• Computer vision: классификация, сегментация, object tracking (open-cv, OpenVINO, keras, tensorflow, pytorch)
• NLP: классификация текстов (pymystem3,pymorphy2,TF-IDF, LDA, SVD, word2vec)
• Прогнозирование временных рядов и выявление аномалии (statsmodels: MA, ARIMA ,GARCH, HMM)
Профиль на Git:
https://github.com/gavrilgavril/Netology_DS_course
Август 2018 —
февраль 2020
1 год 6 месяцев
Tplus
Разработчик QlikView
• Создание ETL-процессов, используя внутренние и внешние источники данных. Разработка и поддержка инфраструктуры для хранения и обработки данных.
• Разработка, коррекция, оптимизация и доработка отчетов в QlikView;
• Прием запросов на изменение/доработку, формирование и согласование с заказчиком ТЗ на данный функционал
• Настройка рассылки отчетов с помощью скриптов PowerShell/NPrinting;
• Разработка приложений. Настройка объектов визуализации QlikView
Июль 2016 —
июль 2018
2 года
Tplus
Старший аналитик
• Инициировал и начал внедрение BI-платформы QlikView:
- написание ТЗ
- взаимодействие с подрядчиком
- разработка собственных приложений
• Руководство коллективом из 2-3 аналитиков
• Оптимизация филиальной (офисной) сети (из 20 возможных локации офисов выбрать 5 время достижения, которых будет минимальным для всех клиентов ):
- получить координаты локации и клиентов
- с помощью Google Maps Geocoding API получить меру расстояния (минимальное время пешком или на общественном транспорте)
- решить задачу кластеризации ( k-means))
• Разработка продуктов на основе данных о энерго/теплопотреблении (промышленные аккумуляторы, индивидуальные тепловые пункты и др.)
• Обогащение и верификация данных компании на основе публичных и не очень источников
Февраль 2015 —
июль 2016
1 год 5 месяцев
Tplus
Аналитик
• Разработка методологии (и организация работы команды по её имплементации) оценки целесообразности подключения жилых домов к тепловым сетям компании:
- распарить данные о жилых домах из открытых
источников
- стандартизовать адреса домов уже подключенных к
сетям компании и полученных из открытых источников с
помощью API Яндекс-карт и получить их координаты
- сопоставляя два множества получить множество
неподключенных к сетям домов
- разработать методику проекции тепловых сетей с
плана на географическую карту
- разработать модель определения эффективности дома
к сетям (исходя из удаленности от сетей и экономики
теплостанций)
• Разработка интегрального оперативного отчета о
деятельности компании (выявление ключевых
потребностей в информации, разработка метрологии
сбора и визуализации показалетлей)
• Разработка блоков Стратегии компании и KPI

Обо мне

Профиль на Git: https://github.com/gavrilgavril/Netology_DS_course

Образование высшее

2019
Нетология
Data Science, Data Science
2014
Национальный исследовательский университет
Экономический факультет, Финансовые рынки и финансовые институты
2011
University of West Bohemia, Чехия
Экономический, Студент по обмену
2011
Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург
Высшая школа экономики и менеджмента, Экономика (Инвестиции)

Знание языков

Русский — родной
Иностранные языки
АнглийскийA1 — Начальный

Гражданство, время в пути до работы

  • Гражданство:
    Нет
  • Разрешение на работу:
    Нет
  • Желательное время в пути до работы:
    Не имеет значения