Pull to refresh

BookTitres.com — изучайте языки по иностранной литературе в оригинале, слушая и читая

Reading time7 min
Views16K
Многие используют фильмы с субтитрами, чтобы слушать речь и одновременно читать. Хочу предложить альтернативу — слушать аудио книги и читать их текст с подстрочным переводом и доступом к каждой отдельной фразе. Они доступны онлайн на сайте BookTitres.com .

Самое интересное


Уже доступные для чтения книги вы можете найти в разделе "Слушайте и читайте" на сайте. Книга "Хоббит" закончена — это 11 часов аудио и 13800 фраз. Пройдя её полностью, вы ощутите заметное улучшение своего английского. Особенно, если будете повторять за чтецом каждую фразу. От других книг в основном сделаны несколько первых глав. Если хотите продолжения — ответьте на опрос и укажите желаемую книгу.

Я не столько преследую цели пиара, сколько хочу рассказать о самой идее и попросить советов, как её развивать. Вы можете оставить пожелания, заглянув на сайт по ссылкам выше. А если интересно почитать о возникновении идеи и её технической реализации, то загляните под кат.

В конце статьи приводятся вопросы, на которые мне бы очень хотелось получить ответы хабра людей.


Как появилась идея


Я всегда любил читать книги и испытывал тягу к иностранным языкам, но по ряду причин был ограничен в возможностях изучать и практиковать их. Не хватало терпения изучать учебники. Хотелось погрузиться в среду, читая иностранные книги в оригинале. Пытался читать параллельно книгу и перевод. Потом познакомился с методом Ильи Франка, где за каждой фразой оригинала идёт дословный перевод в скобках. Но всегда были сомнения — правильно ли я произношу слово? Часто заглядывал в словарь за транскрипцией, и это выматывало.

Что касается звука, отдельно без текста, то его было трудно воспринимать, так как основной канал восприятия — визуальный, через чтение.

Нравилось, когда текст и звук были вместе. Такую связку можно было встретить в фильмах с субтитрами на языке оригинала, или скачав книгу — аудио и текстовую версию. Но тогда возникали следующие сложности:

  • совмещать тексты оригинала и перевода;
  • совмещать тексты с аудио - иногда чуть отвлечешься, и теряешь "нить"
  • проблематично перематывать на ту фразу, которую не успел расслышать или хочется послушать несколько раз подряд; всегда зацепишь лишнее при перемотке;

В общем, уходило много времени и сил на это. Поэтому возникла идея, создать такой формат, в котором каждой фразе сопоставлялась бы связка:
отрывок аудио — текст оригинала — текст перевода

и потом можно было бы возвращаться к ним сколько угодно раз. Как это использовать в итоге?

Сделал 2 режима: плеер и текст.

В плеере можно включить всё аудио и смотреть текст как субтитры, или переключаться между фразами. А в режиме текста можно листать весь текст и при необходимости нажимать на фразы и слушать их.

Раз уж всё разделено на фразы, добавил и режим диктанта, в котором можно установить количество повторов каждой фразы и задержку перед ними.
Много повторов и маленькая пауза — удобно зазубривать материал ("зомбироваться", одновременно читая и слушая много раз подряд).
Большая пауза и мало повторов — можно писать диктант (слушаешь фразу, и пока длится пауза — пишешь её, потом следующую и т.д.)

 


Дело техники


В итоге всё свелось к созданию 3х текстовых блоков.

  1. секунды начала и конца фразы в аудио файле
  2. текст оригинала
  3. текст перевода

И, разумеется, указать ссылку на аудио. То, что отображено на скриншоте, начало книги "Большие надежды" Диккенса, выглядит в коде вот так:
<div class="time" data-audio_url="audio/gr_exp_01_1" id="ti-1">
0,388889 2,000000 1
2,484127 3,911565 2
4,290023 5,198639 3
8,081406 10,267120 4
10,396145 12,082993 5
12,421542 16,692517 6
16,861451 17,271202 7


Great Expectations
by Charles Dickens
Chapter 1
My father's family name being Pirrip,
and my Christian name Philip,
my infant tongue could make of both names nothing longer or more explicit than
Pip.


Большие надежды
Чарльз Диккенс
Глава I
Фамилия моего отца была Пиррип,
мне дали при крещении имя Филип,
а так как из того и другого мой младенческий язык не мог слепить ничего более внятного,
чем Пип,


 


Общедоступный скрипт


Все написанные мной скрипты доступны для скачивания в разделе "Создавайте книги". Там же будут публиковаться руководства, обновления и изменения. Помимо фронт-энда (плеера книг), есть так же режим редактора.

Конечный результат — html файл, простой в структуре, в котором хранится разбивка книги по фразам: их секунды и тексты на двух языках. Вы можете запускать файл книги почти во всех браузерах, в том числе и мобильных. Также, если закинуть файлы книги на Android, можно запускать книгу с телефона. Есть мобильная версия отображения и десктопная.

 


Рабочий процесс


Далее описывается коротко суть процесса, если хотите повторить процесс, смотрите видео руководсвто. Только процесс получения секунд фраз в AEGISUB ручным выделением, можете заменить автоматическим, полученным в программе Audacity. 
 

1. тайминг фраз

Программа Audacity содержит функци  Sound Finder, автоматически выдяляющую временные интервалы всех фраз в аудиофайле. Если хотите потрудиться руками и наверняка, то можно использовать программу субтитров AEGISUB.
 

2. Выстраивание текста по аудио

Когда секунды получены, на специальной странице они превращаются в квадратики с номерами, нажав которые вы слышите фразы. И по ним выстраиваете тексты. Сначала оригинал, потом перевод.



Создавать книготитры намного проще, чем обычные субтитры, потому что:

  1. в аудиокнигах почти нет посторонних шумов, только речь, и можно распознать интервалы фраз программными методами
  2. текст книги заранее есть, остаётся только переносить строки по аудио фразам
  3. перевод тоже заранее есть, и нередко он повторяет оригинал порядком следования фраз

Частный случай работы, когда за исходник текста берется "книга по методу Ильи Франка", а тайминг составляется вручную в программе AEGISUB, можете посмотреть в этом видео-руководстве: "Создавайте свои книги".
 

Главная сложность

Выделение фраз в аудио делается просто, автоматически (Audacity -> Analys -> Sound Finder), оригинал текста на любом языке легко распределить по аудио, имея даже нулевые знания языка (если вам знакома письменность, конечно), нужно просто слушать аудио и в нужных местах нажимать Enter, перенося текст на новые строчки.

А вот с подготовкой перевода сложнее. Когда у вас есть языковые знания (у меня по английскому, например), это сделать просто с некоторыми переводами книг.

Из 5 английских книг, что добавлены на сайте, 4 перевода идут след в след за оригиналом, по-фразово. И поэтому работа тоже сводится к переносу строк в нужных местах, нажатию Enter. (Это "Большие надежды", "Гордость и предубеждение", "Джейн Эйр" и "Алиса в стране чудес"). Иногда, в 1 из 50-100 случаев, приходится переставить фразы местами.

1 книга ("Жизнь Бенджамина Франклина"), не совпадает по фразам, её по сути приходится заново переводить — но зато перед глазами всегда есть смысловой перевод, это заметно облегчает работу.
 

Разбивка

На мой взгляд удобно разбивать аудио файлы на 5-минутные отрывки. На разных языках такой отрывок содержит в среднем 100 фраз и занимает около 2 мб. Такая порция удобна и для восприятия учеником и для загрузки на устройство почти при любом интернет-соединении. В работе, при создании книготитров, тоже удобен такой размер частей. 

 


Сотрудничество. Обладатели авторских прав


У меня не получилось установить контакт с Ильёй Франком (кажется, он очень редко смотрит почту), поэтому я решил не злоупотреблять его работами и сделал демо-версии из доступных на сайте отрывков книг на разных языках, которыми сам не владею. Хотелось бы, конечно, использовать потенциал их адаптированных книг, вдохнув в них так же звуковое сопровождение. Разумеется, по взаимной договорённости, соблюдая интересы их издательства.

А пока я решил сосредоточиться на книгах, находящихся в свободном доступе (авторы которых умерли 70 лет назад и ранее). Большинство книг на сайте как раз такие.  

Что касается современных книг, в западном праве, особенно англоязычных стран, я нашёл такое понятие как "добросовестное использование", когда ты используешь чужой контент в видоизмененной форме, что не мешает в конечном итоге правообладателям. Мне кажется его можно применить к нашему случаю, так как от аудиокниг на незнакомых языках людям мало пользы — уж очень большой уровень подготовки требуется, чтобы использовать их. А если снабдить их паузами (разбивкой по-фразам) и сопутствующими текстами, то интерес к ним значительно увеличится, добавится иноязычная публика.

Также меня вдохновило, что на youtube опубликованы аудиоверсии многих популярных книг с сотнями тысяч просмотров. Судя по всему их не блокируют… Не думаю, что мы реально принесли бы кому-то урон. А внимание к их продукции более широкой аудитории и дополнительные отчисления — вполне возможно.

Мне бы хотелось выслушать ваши советы по поводу сотрудничества с современными правообладателями книг: Гарри Потер, Властелин Колец, Игра престолов, Карточный домик — назвал первое, что пришло на ум. Насколько реально заинтересовать их? В любом случае, начать можно по системе торрентов, когда каждый может размещать что угодно, но по требованию правообладателей это сразу убирается. 

 


Сотрудничество. Кто будет делать книготитры? 


Немало людей занимаются переводами любимых стихов, песен, созданием субтитров, сканированием и распознаванием книг — чисто ради интереса. Добросовестные преподаватели нередко готовят импровизированные учебные материалы для студентов, вкладывая в это свой труд. 

Думаю, все эти люди могли бы заинтересоваться форматом книготитров. Они могли бы совместить тексты любимого произведения с аудио и переводом, опубликовать на сайте и поделиться с друзьями, учениками или просто "фанатами".

Недавно один спортивный судья изъявил желание подготовить международные правила судейства на английском языке в таком формате, чтобы потом пользуясь возможностями программы заучить их на английском и использовать для сдачи экзамена и в судейской практике.

Если преобразовать в такой формат популярные учебники, думаю это принесло бы много пользы учащимся и популярность сервису (если найти, чем заинтересовать правообладателей). 

Наверное, можно сделать отчисления денег и разные бонусы для добавившего материал, в зависимости от его популярности.
Мой идеал — сделать удобный интерфейс создания, хранения и публикации "книготитр" онлайн, через сайт. Куда любой желающий сможет разместить своё аудио и тексты. На данный момент достаточно добавить несложный код с секундами фраз, текстами и ссылкой на аудио, и он отображается в виде плеера и текста с пофразовой навигацией. Но регистрация пока не открыта. 

 


Сотрудничество — хабралюди


Помогите мне, пожалуйста, написав свои советы относительно:

  1. Дизайна и юзабилити программы и сайта
  2. Как оформить исходник скрипта (добавить на github, снабдить код комментариями, опубликовать его где-то, изменить и т.д.)
  3. Установить контакт с правообладателями книг
  4. Наладить сотрудничество с потенциальными пользователя сервиса: курсами иностранных языков, учениками, студентами, любителями литературы
  5. Разработать бизнес модель (как раскрутить сайт, какие книги изначально добавить, в каком количестве, как получать доход, распределять его между участниками проекта)
  6. Поддержать финансово на заранее оговорённых условиях

 
Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
+55
Comments49

Articles

Change theme settings