ITFreelance.by
Поиск работы:
vk.com twitter.com Открытые проекты ITFreelance.by
Последнее:
Разработка игр
Написать сообщение Валерий Петрович Валерий Петрович
Валерий Петрович


О себе
Основной язык разработки Python, включая стандартные библиотеки обработки данных:
SciPy - библиотека для выполнения научных и инженерных расчётов;
NumPy - библиотека предназначенная для работы с многомерными массивами;
scikit-learn - библиотека машинного обучения;
Pandas - библиотека для манипулирования числовыми таблицами и временны́ми рядами;
Matplotlib — библиотека для визуализации данных двумерной (2D) и трехмерной (3D) графикой;
NLTK - пакет библиотек и программ для символьной и статистической обработки естественного языка;
XGBoost - реализация алгоритма градиентного бустинга на деревьях решений;
и множество других библиотек Python.


Big data:
Hadoop (MapReduce, Spark)
H20


Предобработка данных:
PCA - один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.
Нормализация данных
Ковариация, Корреляция, Корреляционная матрица - выявление связей между признаками, анализ корреляций


Алгоритмы машинного обучения:
Линейная регрессия - экстраполирование зависимости линейной функцией;
Логистическая регрессия - экстраполирование зависимости логарифмической функцией
Метод опорных векторов - перевод исходных векторов в пространство более высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве;
"Случайный лес" - ансамбль решающих деревьев;
Градиентный бустинг - последовательное построение ансамблей алгоритмов;
Ансамбли моделей - объединение разных алгоритмов для достижения наилучшего результата
Бустинг
Бэггинг
Стекинг
Алгоритмы кластеризации:
k-средних (k-means) - минимизация суммарного квадратичного отклонения точек кластеров от центров этих кластеров;
k-ближайших соседей (k-nearest neighbors) - определение класса, наиболее распространенного среди k соседей данного элемента, классы которых уже известны;
DBSCAN - алгоритм кластеризации, основанной на плотности распределения данных.
Поиск аномалий (Anomaly Detection)


Нейронные сети:
Сверточные нейронные сети
фреймворки - Keras, TensorFlow, PyTorch
CUDA - программно-аппаратная архитектура параллельных вычислений
LSTM и другие рекуррентные нейронные сети
GAN - генеративно-состязательные сети


Временные ряды:
Приведение временного ряда к стационарному
Тест Дики-Фулера
Выделение компонент. Разложение в ряд Фурье.
Сглаживание временных рядов
StatsModels - библиотека для работы со статистическими моделями
ARMA, ARiMA, SARiMA, Prophet - методы работы с временными рядами

К списку фрилансеров