Data Scientist

  • Занятость:
    Полная занятость
  • График работы:
    Полный день

Опыт работы

Сентябрь 2018 —
декабрь 2020
2 года 3 месяца
Работа в проектах
Data Scientist
• Preprocessing, Feature Engineering ( numpy, pandas), визуализация (matplotlib, seaborn, plotly) • Задачи классификации и регрессии (ensembles, sklearn: GridSearchCV, Linear models, DecisionTree, KNN, RandomForest, SVM ) • Рекомендательные системы: на основе содержания ( pymorphy, TF-IDF, CountVectorizer), коллаборативная фильтрация (surprise: KNN, SVD, CoClustering), гибридные системы • Computer vision: классификация, сегментация, object tracking (open-cv, OpenVINO, keras, tensorflow, pytorch) • NLP: классификация текстов (pymystem3,pymorphy2,TF-IDF, LDA, SVD, word2vec) • Прогнозирование временных рядов и выявление аномалии (statsmodels: MA, ARIMA ,GARCH, HMM) Профиль на Git: https://github.com/gavrilgavril/Netology_DS_course
Август 2018 —
февраль 2020
1 год 6 месяцев
Tplus
Разработчик QlikView
• Создание ETL-процессов, используя внутренние и внешние источники данных. Разработка и поддержка инфраструктуры для хранения и обработки данных. • Разработка, коррекция, оптимизация и доработка отчетов в QlikView; • Прием запросов на изменение/доработку, формирование и согласование с заказчиком ТЗ на данный функционал • Настройка рассылки отчетов с помощью скриптов PowerShell/NPrinting; • Разработка приложений. Настройка объектов визуализации QlikView
Июль 2016 —
июль 2018
2 года
Tplus
Старший аналитик
• Инициировал и начал внедрение BI-платформы QlikView: - написание ТЗ - взаимодействие с подрядчиком - разработка собственных приложений • Руководство коллективом из 2-3 аналитиков • Оптимизация филиальной (офисной) сети (из 20 возможных локации офисов выбрать 5 время достижения, которых будет минимальным для всех клиентов ): - получить координаты локации и клиентов - с помощью Google Maps Geocoding API получить меру расстояния (минимальное время пешком или на общественном транспорте) - решить задачу кластеризации ( k-means)) • Разработка продуктов на основе данных о энерго/теплопотреблении (промышленные аккумуляторы, индивидуальные тепловые пункты и др.) • Обогащение и верификация данных компании на основе публичных и не очень источников
Февраль 2015 —
июль 2016
1 год 5 месяцев
Tplus
Аналитик
• Разработка методологии (и организация работы команды по её имплементации) оценки целесообразности подключения жилых домов к тепловым сетям компании: - распарить данные о жилых домах из открытых источников - стандартизовать адреса домов уже подключенных к сетям компании и полученных из открытых источников с помощью API Яндекс-карт и получить их координаты - сопоставляя два множества получить множество неподключенных к сетям домов - разработать методику проекции тепловых сетей с плана на географическую карту - разработать модель определения эффективности дома к сетям (исходя из удаленности от сетей и экономики теплостанций) • Разработка интегрального оперативного отчета о деятельности компании (выявление ключевых потребностей в информации, разработка метрологии сбора и визуализации показалетлей) • Разработка блоков Стратегии компании и KPI

Обо мне

Профиль на Git: https://github.com/gavrilgavril/Netology_DS_course

Образование высшее

2019
Нетология
Data Science, Data Science
2014
Национальный исследовательский университет
Экономический факультет, Финансовые рынки и финансовые институты
2011
University of West Bohemia, Чехия
Экономический, Студент по обмену
2011
Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург
Высшая школа экономики и менеджмента, Экономика (Инвестиции)

Знание языков

Русский — родной
Иностранные языки
АнглийскийA1 — Начальный

Гражданство, время в пути до работы

  • Гражданство:
    Нет
  • Разрешение на работу:
    Нет
  • Желательное время в пути до работы:
    Не имеет значения