28.01.2019 Выпуск 267 (28.01.2019 - 03.02.2019) Видео

Методы и алгоритмы решения задач классификации и рекомендации текстов

Обработка естественного языка (NLP) — активно развивающаяся научная дисциплина, занимающаяся поиском смысла и обучением на основании текстовых данных. Неважно, кто вы — опытный Data Scientist, или начинающий Python разработчик — вы всегда можете использовать текстовые данные для того, чтобы усовершенствовать продукт над которым работаете и расширить его функциональность. В докладе, на примере сайта кулинарных рецептов, будут описаны шаги преобразования и очистки данных. Исследованы методы классификации и определения сходства текстов на основе: Mean word2vec, Tf-idf weighted word2vec, Doc2vec, fastText, Word Mover’s Distance. Сравнение качества итоговых моделей. Также поговорим про внедрения в проект моделей классификации и рекомендаций

IT-новости про Python, которые стоит знать

Методы и алгоритмы решения задач классификации и рекомендации текстов​

Методы и алгоритмы решения задач классификации и рекомендации текстов