IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     01.09.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи

Функциональное программирование в питоне. Генераторы, как питонячий декларативный стиль

Говоря о Python, обычно используется процедурный и ООП стиль программирования, однако это не значит, что другие стили невозможны. В презентации ниже мы рассмотрим ещё пару вариантов — Функциональное программирование и программирование с помощью генераторов. Последние, в том числе, привели к появлению сопрограмм, которые позднее помогли создать асинхронность в Python. Сопрограммы и асинхронность выходят за рамки текущего доклада, поэтому, если интересно, можете ознакомиться об этом самостоятельно. Лично я рекомендую книгу "Fluent Python", в которой разговор начинается от итераторов, плавно переходит в темы о генераторах, сопрограммах и асинхронности.

     01.09.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи

Использование NLP для построения классификатора сарказма

В этой статье мы попробуем написать классификатор определяющий саркастические статьи используя машинное обучение и TensorFlow

 

Статья является переводом с Machine Learning Foundations: Part 10 — Using NLP to build a sarcasm classifier

     01.09.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи
     01.09.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Релизы
     01.09.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи

Как мы научили робота чувству юмора

В IT-кругах ходит такая шутка, что машинное обучение (machine learning, ML) — это как секс в среде подростков: все об этом говорят, все делают вид, что этим занимаются, но, на самом деле, мало у кого это получается. У FunCorp получилось внедрить ML в главную механику своего продукта и добиться радикального (почти на 40%!) улучшения ключевых метрик. Интересно? Добро пожаловать под кат.

     31.08.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи
     31.08.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи
     31.08.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи

Делаем параллельный корпус из книг с помощью sentence embeddings

При поиске параллельных корпусов для своих нужд, — это может быть обучение модели машинного перевода или изучение иностранного языка, можно столкнуться с тем, что их не так уж и много, особенно, если речь идет не об английском, а каком-то редком языке. В этой статье мы попробуем создать свой корпус для популярной языковой пары русский-немецкий на основе романа Ремарка "Три товарища". Любителям параллельного чтения книг и разработчикам систем машинного перевода посвящается.

     31.08.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Статьи

Компьютерное зрение на страже конфиденциальности

Профилактика – наше всё. Грамотная защита от утечек данных поможет предупредить негативные последствия, которые могут повлечь за собой многомиллионные потери. В современном мире каждая из организаций обрабатывает и хранит конфиденциальную информацию. Если речь идёт о крупных организациях, то объёмы конфиденциальной информации огромны. Состояние «безопасности» компьютера – это концептуальный идеал, достигаемый при соблюдении каждым пользователем всех правил информационной безопасности.

     31.08.2020       Выпуск 350 (31.08.2020 - 06.09.2020)       Видео

Mastering a data pipeline with Python / Robson Luis Monteiro Junior (Microsoft)

Building data pipelines are a consolidated task, there are a vast number of tools that automate and help developers to create data pipelines with few clicks on the cloud. It might solve non-complex or well-defined standard problems. This presentation is a demystification of years of experience and painful mistakes using Python as a core to create reliable data pipelines and manage insanely amount of valuable data. Let's cover how each piece fits into this puzzle: data acquisition, ingestion, transformation, storage, workflow management and serving. Also, we'll walk through best practices and possible issues. We'll cover PySpark vs Dask and Pandas, Airflow, and Apache Arrow as a new approach.

     29.08.2020       Выпуск 349 (24.08.2020 - 30.08.2020)       Статьи

Интерактивная визуализация алгоритмов на базе Jupyter

Jupyter уже давно зарекомендовал себя как удобную платформу для работы в различных областях на стыке программирования, анализа данных, машинного обучения, математики и других. Вот например очень известная книга по анализу данных, состоящая из Jupyter блокнотов. Поддержка , markdown, html дает возможность использовать использовать Jupyter в качестве платформы для удобного оформления научного-технического материала. Преимущество таких блокнотов заключается в интерактивности, возможности сопровождать сухой материал примерами программ, при этом эта интерактивность очень естественна и проста в использовании. В этой статье хотелось бы рассказать про возможность создания в Jupyter анимированных примеров работы различных алгоритмов и привести несколько из них с исходным кодом. В качестве кликбейта алгоритм Дейкстры.

     29.08.2020       Выпуск 349 (24.08.2020 - 30.08.2020)       Статьи

Бот в телеграм, озвучивающий ваши эмоции в сообщении

В этой статье я опишу своего бота в телеграм, который работает и сейчас.

     28.08.2020       Выпуск 349 (24.08.2020 - 30.08.2020)       Вопросы и обсуждения
     28.08.2020       Выпуск 349 (24.08.2020 - 30.08.2020)       Статьи
     27.08.2020       Выпуск 349 (24.08.2020 - 30.08.2020)       Статьи

Python и теория множеств

В Python есть очень полезный тип данных для работы с множествами – это set. Об этом типе данных, примерах использования, и небольшой выдержке из теории множеств пойдёт речь далее.