Собрали в одном месте самые важные ссылкичитайте авторский блог
Аналог похожего проекта videogrep. Построен на распознавании текста из голоса и поиске соответствующей позиции в ролике