28.06.2021       Выпуск 393 (28.06.2021 - 04.07.2021)       Статьи

Перефразирование русских текстов: корпуса, модели, метрики

Автоматическое перефразирование текстов может быть полезно в куче задач, от рерайтинга текстов до аугментации данных. В этой статье я собрал русскоязычные корпуса и модели парафраз, а также попробовал создать собственный корпус, обучить свою модель для перефразирования, и собрать набор автоматических метрик для оценки их качества.В итоге оказалось, что модель для перевода перефразирует лучше, чем специализированные модели. Но, по крайней мере, стало более понятно, чего вообще от автоматического перефразирования можно хотеть и ожидать.

     28.06.2021       Выпуск 393 (28.06.2021 - 04.07.2021)       Статьи

Python: неочевидное в очевидном

Изучение любого языка - очень долгий процесс, в ходе которого могут возникать ситуации, когда очевидные с виду вещи ведут себя странно. Даже спустя много лет изучения языка не все и не всегда могут с уверенностью сказать “да, я знаю этот на 100%, несите следующий”.

Python - один из самых популярных языков программирования на сегодняшний день, но и он имеет ряд своих нюансов, которые на протяжении многих лет изменялись, оптимизировались и теперь ведут себя немного не так, как это может показаться, глядя на строчки незамысловатого кода.

     28.06.2021       Выпуск 393 (28.06.2021 - 04.07.2021)       Статьи

ML-обработка результатов голосований Госдумы (2016-2021)

Недавно я наткнулся на сайт vote.duma.gov.ru, на котором представлены результаты голосований Госдумы РФ за весь период её работы — с 1994-го года по сегодняшний день. Мне показалось интересным применить некоторые техники машинного обучения, а так же обычной статистической обработки для выяснения следующих вопросов.

     26.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Вопросы и обсуждения
     27.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Голосовой дневник на python с распознаванием голоса и сохранением в Mongo DB

Все больше растет популярность голосовых интерфейсов. Многие технологические компании-гиганты стремятся сделать своего голосового помощника. Но речевые технологии доступны и обычным пользователям. Каждый может использовать их в своих проектах и делать голосовые интерфейсы еще удобнее и популярнее .

Голосовой дневник - лишь один из примеров того, как можно встроить функции голосового интерфейса в повседневные действия.

     26.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Вопросы и обсуждения
     25.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Ещё одна статья о том, как писать на Питоне

Сегодня я сниму костюм аниматора и вместо развлечений расскажу вам немного за питон.Я довольно посредственный программист, но иногда мне удаётся усыпить что-нибудь бдительность, и меня считают сеньором. И вот как-то так получилось, что я стал делать много код ревью. Просматривая файл за файлом, я вдруг увидел, что люди и проекты меняются, а вот моменты, к которым я, зануда такая, придираюсь, остаются теми же. Поэтому я решил собрать самые частые паттерны в эту сумбурную статью и надеюсь, что они помогут вам писать более чистый и эффективный питон-код.

     24.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Разработка большого проекта за 6 месяцев: как не облажаться

Я Леша Половинкин, работаю руководителем Python-разработки в AGIMA. Сегодня сказ будет о том, как разработать в очень короткие сроки с нуля классифайд для авто (а попросту огромную доску объявлений с кучей прикрученных к ней сервисов) и совершить те ошибки, которые неизбежны.

     24.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Google Colorizing Transformer vs Deoldify

Продолжение заметок про оцветнение. Запустим уже несвежую, но ещё новую нейросеть и будем сравнивать со старичком Deoldify на множестве тестовых примеров, чтобы оценить скорость надвижения будущего.

     24.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Выращивание Магических Квадратов с помощью Python

В этой статье я опишу метод получения нормальных магических квадратов порядка nm, где n и m - положительные натуральные числа, при условии, что нам известен нормальный магический квадрат порядка n

Однажды, еще в школе, я заинтересовался магическими квадратами, как весьма хардкорной заменой судоку. По-сути, все свободное время в школе я проводил за составлением магических квадратов. Здесь и в дальнейшем, под магическим квадратом я подразумеваю нормальный магический квадрат.

     24.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи
     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Декодирование сигнала с видеофона 1988 года выпуска

В наши дни можно легко связаться по видеосвязи практически с любой точкой мира. Но потребовалось много времени, чтобы технология достигла такого уровня. Я покажу, какие решения использовали инженеры в 1988 году, чтобы вы могли не только говорить, но и видеть своего друга или партнера во время разговора.

     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Наглядно о том, как работает NumPy

Есть тексты, похожие на вино или динамит: с годами они не стареют, а напротив, приобретают вес и значимость. Сегодня к старту флагманского курса о Data Science мы решили поделиться переводом визуального учебного руководства о NumPy 2019 года, прочитав которое даже не слишком близкий к математике человек поймёт, как работает эта библиотека Python. Если вы не хотите долго объяснять NumPy, но делать это всё равно приходится, положите статью в закладки и она сэкономит ваше время.

     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Решаем систему линейных алгебраических уравнений с Python-пакетом scipy.linalg (не путать с numpy.linalg)

Аппарат линейной алгебры применяют в самых разных областях — в линейном программировании, эконометрике, в естественных науках. Отдельно отмечу, что этот раздел математики востребован в машинном обучении. Если, например, вам нужно поработать с матрицами и векторами, то, вполне возможно, на каком-то шаге вам придётся решать систему линейных алгебраических уравнений (СЛАУ). 

     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи
     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Разработка платформы управления данными. Доклад Яндекса

Яндекс Go разрабатывает платформу управления данными (DMP) как сервис для офлайн- и near real-time-обработки данных. Я постарался рассказать, какая мотивация нужна для создания собственного ETL-инструмента, как ETL и Data Warehouse превратить в DMP, какие проблемы возникают в процессе разработки и как мы их решаем.

     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

ABBYY NeoML 2.0: Python и многое другое

Прошел почти год с тех пор, как мы опубликовали на GitHub библиотеку для машинного обучения NeoML. О чем, конечно же, была статья на Хабре. Мы обещали поддерживать и развивать ее. Свое обещание мы сдержали, и на днях свет увидела вторая версия библиотеки!

     23.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

EDA становится проще, если есть SWEETVIZ

Sweetviz — это библиотека Python с открытым исходным кодом, которая генерирует отчеты с удобной визуализацией для выполнения EDA с помощью всего двух строк кода. Библиотека позволяет быстро создать подробный отчет по всем характеристикам набора данных без особых усилий. В возможности Sweetviz также входит целевой анализ, сравнение двух датасетов, сравнение двух частей датасета, выделенных по определенному признаку, выявление корреляций и ассоциаций, также sweetviz создает позволяет создавать и сохранять отчет как HTML файл.





Разместим вашу рекламу

Пиши: mail@pythondigest.ru

Нашли опечатку?

Выделите фрагмент и отправьте нажатием Ctrl+Enter.

Система Orphus