IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Тестируем собственную батарейку для Django с pytest и tox

Итак, у нас есть идея потрясающей и всем необходимой батарейки для Django. После того, как мы написали весь код мы готовы релизнуть нашу батарейку в PyPI. Однако перед этим мы должны разобраться с несколькими моментами

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Мы опубликовали модель, расставляющую знаки препинания и заглавные буквы в тексте на четырех языках

При разработке систем распознавания речи мы сталкиваемся с заблуждениями среди потребителей и разработчиков, в первую очередь связанными с разделением формы и сути. Одним из таких заблуждений является то, что в устной речи якобы "можно услышать" грамматически верные знаки препинания и пробелы между словами, когда по факту реальная устная речь и грамотная письменная речь очень сильно отличаются (устная речь скорее похожа на "поток" слегка разделенный паузами и интонацией, поэтому люди так не любят монотонно бубнящих докладчиков).

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Компиляция Python

Предположим, вы разработали приложение или библиотеку на Python и уже готовитесь передать его / её  заказчику. И в этот момент возникают вопросы, о которых многие даже не задумываются.

Во-первых, так может оказаться, что вы разработали супер крутой алгоритм, которого ни у кого нет, и показывать его хочется только избранным.

Во-вторых, возникает вопрос окружения - хочется быть уверенным, что заказчик справится с установкой правильной версии Python и всех вспомогательных библиотек, но это не всегда простая задача. Было бы удобно упаковать приложение в автономный исполняемый файл.

И, наконец, хочется,  чтобы конечное приложение работало быстрее, чем в среде разработки.

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Многозадачная модель T5 для русского языка

Модель T5 – это нейросеть, которая уже обучена хорошо понимать и генерировать текст, и которую можно дообучить на собственную задачу, будь то перевод, суммаризация текстов, или генерация ответа чат-бота.

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Сохранение озвучки книги средствами Google TTS и python

В последнее время я полюбил слушать аудиокниги. Однако те книги, которые я хочу слушать, никто не озвучивает. Не думаю что кому то будет интересна моя драматичная история о выборе лучшего tts, проблемы в процессе написания, солнце в монитор и т.п., так что я просто представлю вам уже готовое решение.

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Распознаем медицинские тексты

Это третья публикация в рамках цикла статей по изучению московской базы ковидных больных. В настоящей работе были созданы векторные представления медицинских терминов, которые теперь доступны на Github.

     06.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Аудио-графическое шифрование или как звук в картинку спрятать

Под покровом вечера пятницы, поглощая хмельные запасы нашей необъятной и листая любимый Хабр, я наткнулся на плеяды статей о шифровании. Что только куда не зашифровывали, от совсем уж банального шифра Цезаря до менее банального шифрования изображений в аудиофайл. Наслаждаясь достойным вечера чтивом, в голову зашел не разувшись интересный вопрос: "-А кто-нибудь звук в картинку прятал?". Зудящая жажда знаний заставила меня смахнуть с живота остатки кальмаровых колец и сесть за свою рабочую лошадку.

     04.10.2021       Выпуск 407 (04.10.2021 - 10.10.2021)       Статьи

Как бороться с сонливостью за рулём с помощью Python

Обнаружение сонливости водителя продиктовано потребностью безопасности – разработка приложения для обнаружения в режиме реального времени позволит избежать серьезных происшествий в тот момент, когда водитель переутомлен. По разным оценкам, около 20% всех уличных происшествий связаны с переутомлением, а на некоторых оживленных улицах – до 50%. Таким образом, совершенствование технологий распознавания и предотвращения сна за рулем может стать серьезным вызовом в области улучшения систем предотвращения аварий. При обнаружении сонливости, необходимо в тот же момент предупредить водителя о возможных неприятностях. Подобное обнаружение достигается при помощи детектирования состояния глаз водителя.

     03.10.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Моя маленькая помощь малым языкам

На территории России проживает большое количество народов, говорящих более чем на 270 языках. Около 150 языков насчитывает менее 1 тысячи носителей, а за последние 20 лет 7 языков уже исчезло.

     03.10.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Влияние загрязение воздуха на тяжесть течения Covid- 19

Продолжаю цикл статей основанных на анализе базы московских больных. В настоящей второй части я буду анализировать влияние загрязнение воздуха на тяжесть течения заболевания. В этом нам поможет сайт с открытыми данными г. Москвы, на котором представлена информация с небольшого количества метеорологических станций.

     03.10.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Посмотрите, как Google отслеживает ваше местоположение. С Python, Jupyter, Pandas, Geopandas и Matplotlib

В разделе продаж можно услышать аббревиатуру ABC: Always Be Closing. Always Be Closing означает заключение сделки с покупателем. Последнее десятилетие породило еще одну аббревиатуру ABCD: Always Be Collecting Data. 

     02.10.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Игра в собственные

Имеем набор данных в виде совокупности квадратных матриц, которые используются - вместе с известным выходом - в качестве тренировочного набора для нейронной сети. Можно ли обучить нейронную сеть, используя только собственные значения матриц?

     30.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Небольшой модуль для работы с dnevnik.ru на python

Это моя первая статья, и сегодня я хочу рассказать вам про свой первый модуль на python. Называется он dnevnikru. Я написал его для облегчения работы с сайтом дневника. Работает модуль по принципу парсера, а не получает данные через API. Идея написать такой модуль пришла мне после идеи написать телеграм бота для просмотра оценок и домашних заданий из Дневника.ру

     30.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Как настроить SQLAlchemy, SQLModel и Alembic для асинхронной работы с FastAPI

В этом руководстве предполагается, что у вас есть опыт работы с FastAPI и Postgres с помощью Docker. Вам нужна помощь, чтобы ускорить работу с FastAPI, Postgres и Docker? Начните со следующих ресурсов:

     29.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Дообучаем готовую нейросеть для классификации данных

В прошлой статье мы научились классифицировать данные без разметки с помощью понижения размерности и методов кластеризации. По итогам получили первичную разметку данных и узнали, что это картинки. С такими начальными условиями можно придумать что-то более серьёзное, например, дообучить существующую нейросеть на наши классы, даже если до этого она их никогда не видела. В iFunny на первом уровне модерации мы выделяем три основных класса

     28.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Интересное применение WordCloud

Хочу продемонстрировать вам, как я использовал библиотеку WordCloud для создания подарка для друга/подруги. Я решил составить облако слов по переписке с человеком, чтобы выделить основные темы, которые мы обсуждаем.

     28.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Первые шаги в aiohttp, часть 3: публикуем приложение в Интернете

Сегодня разберем заключительную часть цикла «Первые шаги в aiohttp». В первой статье мы создали и настроили проект, а во второй подключили базу данных. В этой части статьи мы рассмотрим размещение нашего веб-сервиса в Интернете, используя платформу Heroku.Асинхронное программирование — большая тема. Если хотите разобраться в ней подробнее, приходите к нам на курс.

     28.09.2021       Выпуск 406 (27.09.2021 - 03.10.2021)       Статьи

Мегаанализ распространения Covid-19 в Москве

В этой части целого цикла статей я представлю статистические данные. В последующих главах будет выполнено предсказание тяжести заболевания, влияния загрязнения воздуха и даже сделано фундаментальное открытие, обобщающее закон Гомперца на различные тяжести течения Covid- 19.