IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     26.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи

Синтаксический анализ в NLTK

Здравствуйте. Это статья об синтаксическом анализе предложений, их представлении. Для разбора предложений будет использоваться пакет NLTK и язык программирования Python (версии 2.7).

     25.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи
     25.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи

Мониторинг событий git clone и git push на локальном GitLab сервере

Иногда возникает желание мониторить локальный GIT сервер на предмет кто (ФИО из LDAP), какой проект и откуда(ip-адрес) клонит или пушит.

Изучив документацию, стало ясно, что такого функционала из коробки нет, точнее есть, но в платной версии GitLab. Под катом мой опыт реализации мониторинга.

Мой рецепт не претендует на универсальность, я надеюсь он многим пригодится как, отправная точка.

     25.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи

Где перспективно и адекватно использовать Python

В этой статье мы с вами обсудим тот перечень направлений Питона, который я выделяю наиболее перспективными для приложения своих сил и времени для молодых специалистов. Данный вывод делается на основе моего анализа – изучение областей и инструментов питона и сравнивать их эффективность с аналогами на других платформах. 

     23.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи

Краткий курс машинного обучения или как создать нейронную сеть для решения скоринг задачи

Вопросы, которые разобраны в статье:

• Как собрать и подготовить данные для построения модели?
• Что такое нейронная сеть и как она устроена?
• Как написать свою нейронную сеть с нуля?
• Как правильно обучить нейронную сеть на имеющихся данных?
• Как интерпретировать модель и ее результаты?
• Как корректно оценить качество модели?

     23.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи
     23.10.2017       Выпуск 201 (23.10.2017 - 29.10.2017)       Статьи

«4 свадьбы и одни похороны» или линейная регрессия для анализа открытых данных правительства Москвы

В последних статьях мы рассмотрели пару задачек по классификации, в процессе потом и кровью добывая себе данные, теперь пришло время регрессии. Поскольку ничего светотехнического в этот раз под рукой не оказалось, я решил поскрести по другим сусекам.

Помнится, в одной из статей я агитировал читателей посмотреть в сторону отечественных открытых данных. Но поскольку я не барышня из рекламы «кефирчика для пищеварения» или шампуня с лошадиной силой, совесть не позволяла советовать что-либо, не испытав на себе.

     22.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Расширяем и используем Flatpages в Django. Встраиваем CKEditor

Cегодня я хотел бы вам рассказать о том, как сделать модель, которая хранит в себе обычные страницы, а не отдельные записи в базе данных (для ListView, TemplateView и тд). Речь пойдёт о том, как расширить и дополнить существующие в Django flatpages. Но хотелось бы рассказать о проблеме, с которой я столкнулся и почему решил поделиться данным функционалом. Часто возникает ситуация, когда в админке для администратора сайта нужно реализовать функционал самой обычной страницы (одна запись в БД – это одна страница, где прописывается url, контент и доп. инфа для конкретной страницы). Тем самым можно создавать прямо из админки новые страницы с любым url и контентом.

     21.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Пишем простой счётчик уникальных слов на Python с GUI на Tkinter

Данная статья написана для тех, кто только начал изучать Python. В ней я пошагово опишу создание простого счетчика слов из txt-файлов, применяя Tkinter. Исходный код написан под Python 2.7, в конце статьи я добавлю несколько комментариев относительно того, как перенести его под 3.6

     20.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

“Без data engineer-а ценность модели аналитика стремится к нулю” — интервью с дата инженером Николаем Марковым

Data Engineering становится все более популярным, многие компании постепенно открывают соответствующие вакансии. В связи с этим мы взяли интервью у дата инженера и преподавателя на программах “Специалист по большим данным” и “Data Engineer” Николая Маркова о том, что должны уметь data scientist-ы и data engineer-ы, чего им чаще всего не хватает и как найти свое место в анализе данных.

     20.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Code review по-человечески (часть 1)

В последнее время я читал статьи о лучших практиках code review и заметил, что эти статьи фокусируются на поиске багов, практически игнорируя другие компоненты ревью. Конструктивное и профессиональное обсуждение обнаруженных проблем? Неважно! Просто найди все баги, а дальше само сложится.

Так что у меня случилось откровение: если это работает для кода, то почему не будет работать в романтичных отношениях? Итак, встречайте новую электронную книгу, которая поможет программистам в отношениях со своими возлюбленными (обложка на иллюстрации слева).

     19.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Супер быстрое сопоставление строк на Python

Может помочь при счете TF-IDF с N-граммами

     19.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Каркас для Flask REST API Flask

Как написать каркас REST API на Flask.

     19.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Что опасного в pickle?

Легкое введение в Python pickle protocol, Pickle Machine и особенности работы

     19.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи

Нейронные сети для рекламодателей

Пишем прототип детектора логотипов