Собрали в одном месте самые важные ссылки
читайте нас в Telegram
В статье приведены соображение на тему поисковых движков с ранжированием.
plotly - библиотека для построения графиков. Данная библиотека позволяет строить интерактивные графиков. А в этой статье описан способ построения графиков-свечей.
Перекрестная проверка является важным инструментом в статистическом обучении для оценки достоверности вашего алгоритма. Несмотря на огромные возможности scikit-learn, он может возвращать ошибочные данные. Эта статья рассказывает в чем же проблема
Статья досконально описывает создание инструмента для проверки правописания. Авто показывает, что данный инструмент может убрать опечатки почти полностью
Статья показывает, как начать использовать scrapy для парсинга сайтов. Рассмотрен простой пример парсинга.
В статьи описан практический опыт разработчика, который видит в mock-объектах зло. Показал как можно писать тесты без mock
Ваша программа "тормозит"? Если алгоритмы уже написаны идеально, то стоит изучить как работает ваш код. Эта статья показывает какими инструментами надо воспользоваться, чтобы узнать как долго работают части вашей программы.
Это вторая часть статьи. В ней описан способ оптимизации нейронной сети. Этот метод называется - градиентный спуск.
Если пишите на R, а хотите на Python, то эта статья поможет поставить в соответствие синтаксис одного языка другому.
Наверное, о Pandas знают все, а Apache Spark, если на пальцах, - это hadoop, оптимизированный на обработку данных, которых очень много. В данной статье рассматриваются особенности главного объекта для представления данных двух этих систем.
В данной статье описан крайне подробный способ установке OpenCV 3.0 для Python версий 2.7 и 3 ветки. Особенность статьи, что OpenCV будет работать на Raspberry Pi
Знакомы с понятием "вероятностное программирование"? Если нет, то вам стоит изучить этот материал. В котором достаточное количество примеров.
PEP 484 (Python 3.5) добавил в язык type hint. Это расширение аннотаций функций, которые были добавлены в Python 3. Так вот, данная презентация расскажут - зачем вообще нужны были эти две возможности и как их использовать.
Anaconda - это дистрибутив, который содержит различные модули для Data Scientists. А conda - это утилита в этом дистрибутиве, которая позволяет управлять пакетами. В этой статье рассказано про применение conda для замены pyenv и virtualenv
В статье описан способ создания Skype бота, который сможет управлять Jenkins
В данной статье представлен широкий спектр ORM для Python, а также рассказано, что такое ORM и с чем его едят.
Очередная статья-сравнение двух популярных языков. В этот раз рассматривается широкий спектр задач, с которым сталкивается Data Scientist.
В статье отображен минимальный набор действий, который необходим чтобы найти медленные места в Python-коде.
Этот материал по шагам покажет, как начать строить графики во Flask.
В статье приведен список 30-ти лучший Data Scientists, а также отличный список туториалов по разным аспектам обработки данных.