[Главная страница][Тезисы конференции]
ЦИФРОВАЯ «ГОВОРЯЩАЯ» КНИГА
: Утопия или реальность?Кунгуров А.М., кандидат философских наук, главный библиотекарь отдела
информации Свердловской областной специальной библиотеки для слепых,
Екатеринбург
Как гласит студенческая шутка, в университетах учат читать умные книжки и находить в них нужные места. Очевидно, что человек, ставящий перед собой задачу получения образования, должен осознавать, что наряду с овладением практическими навыками, образование предполагает освоение колоссальных объемов информации, и, как правило, в весьма сжатые сроки. А если этот человек не может самостоятельно воспринимать стандартный печатный текст, он должен решать для себя проблему альтернативных способов доступа к информации, в той или иной мере способных компенсировать невозможность визуального доступа к печатной продукции. Нельзя не обратить внимания и на то обстоятельство, что от студента требуется не только читать много, но и выбирать из большого объема только то, что нужно. Правомерен вопрос: отвечают ли современные средства невизуального доступа требованиям, без выполнения которых невозможна профессиональная работа с книгой? А главное, какие перспективы обещает нам прогресс в области информационных технологий? Изменится ли в свете этого прогресса облик традиционной «говорящей» книги, ставшей для многих незрячих чуть ли не единственным способом получения информации? Эти вопросы я и постарался затронуть в своем сообщении, используя публикации в зарубежной печати.
За 40 лет своего существования «говорящая» книга заняла лидирующее положение в плане доступа незрячих к информации. Однако, наряду с очевидными преимуществами, такими, как простота в использовании, относительно низкая стоимость производства, «говорящая» книга имеет и ряд существенных недостатков, главным из которых является отсутствие в фонограмме, содержащей текст книги, структуры самой книги. В случае с художественной литературой этот недостаток не является существенным, поскольку книгу мы читаем чаще всего от начала и до конца. Однако в тех случаях, когда приходится пользоваться так называемым структурированным текстом, «говорящая» книга оказывается неподходящей. В середине 90-х годов, с развитием мультимедиа, стало ясно, что существует реальная возможность создать такую «говорящую» книгу, которая по своим характеристикам ничем не будет отличаться от обычной книги. Бурное развитие информационных технологий обещает незрячим столь высокий уровень доступа к информации, что его вполне можно назвать идеальным.
Идеальный доступ к информации для незрячих пользователей должен быть таким же удобным, таким же независимым, таким же полным, таким же универсальным, каковым он является в сообществе зрячих людей. Именно для разработки технологии и стандартов нового поколения «говорящей» книги и был создан консорциум DAISY, куда вошли главным образом производители литературы для слепых и организации, занимающиеся информационным обслуживанием лиц с ограниченными возможностями. DAISY - это аббревиатура от Digital Audio-Based Information System (Информационная система, основанная на цифровой звукозаписи). Первоначально консорциум был основан, чтобы заменить существующую аналоговую технологию, затем задачи немного изменились, хотя название осталось. Задача консорциума DAISY состоит в том, чтобы разработать информационную технологию следующего поколения для людей с ограниченными возможностями, а также предусматривается разработать способы обмена информацией между библиотеками во всем мире.
То, что сейчас разрабатывает DAISY, на самом деле является мультимедийным представлением, поскольку звукозапись сама по себе структуры не имеет. Поэтому используется текст, чтобы внести в информацию структуру и точки навигации. В результате получаются размеченные файлы, использующие HTML. Также используется XML и разрабатываются все новые технологии в XML. Как известно, HTML версии 4.0, которой мы сейчас пользуемся, это последняя версия HTML. Отныне язык будет называться XML, поскольку он гораздо легче и его куда проще обрабатывать. На самом деле XML является упрощенным вариантом SGML, который был разработан уже давно, но он был слишком громоздок и неудобен в использовании. Поэтому будет XML. XML лучше. В нем также используется DTD, document type definition, (определение типа документа), которое идентифицирует компоненты документа. Ведь в книге есть абзацы и заголовки, объекты списков и прочие структурные элементы. Кроме размеченного текста, другим компонентом XML является SMIL (synchronized multi-media integration language) (синхронизированный язык интеграции мультимедиа). Это стандарт W3C [World Wide Web Consortium]. Поэтому все, что используется DAISY, основано на международных стандартах, базирующихся по преимуществу на рекомендациях W3C.
Так, что же такое цифровая «говорящая» книга, если абстрагироваться от специальных терминов? Это просто набор файлов, которые, вместе взятые, составляют мультимедийный документ. Один файл содержит полный текст книги с индексными тегами, которые описывают структуру книги. Индексирование производится с помощью языка разметки XML. Второй файл содержит звукозапись, которая была записана точно так же, как записывается кассета, за исключением того, что теперь запись отцифрована, и вероятно, позже, в процессе производства, сжата. И, наконец, имеется SMIL файл, который содержит необходимые данные, чтобы синхронизировать текст и звукозапись.
DAISY разработала 6 категорий книг. Первая очень простая, и в ней есть только заголовок. Это примерно то же самое, что и теперешняя «говорящая» книга, только в цифровом формате. Вероятно, одной из самых популярных категорий книг будет та, в которой есть полное оглавление, номера страниц, так что можно перемещаться по цифровой «говорящей» книге или переходить к любой странице, главе, разделу, подразделу, и перемещаться очень быстро попадая именно туда, куда вам нужно.
Другие категории книг будут включать полный текст. Идеальным, конечно, является вариант, когда у вас есть и полный текст, и полная звукозапись. Но это идеальный вариант. Кроме того, раз у вас есть полный текст, можно пользоваться брайлем.
Последняя категория книг - это просто текст. С ним не ассоциирована никакая звукозапись. Эту книгу можно будет читать с помощью синтезированной речи, брайлевского терминала, крупного шрифта или комбинации всех этих средств.
Стандарты, разработанные DAISY в настоящий момент - версия 2.0, были выпущены в сентябре 1998 года, и в этих рекомендациях освещены вопросы заголовков, номеров страниц и звукозаписи. Но это только часть. Версия 2.01, выпущенная в сентябре 1999 года, добавляет дополнительную функциональность, включая полный текст в XML и примечания, сноски, и описания рисунков, которые читатель может выключить по своему усмотрению.
Консорциум DAISY разрабатывает также средства производства. Очень скоро появится первый продукт. Он проходит последние испытания. Он будет называться LpStudio/Pro. Это будет полнофункциональное средство для производства цифровой «говорящей» книги от начала до конца. Эта студия разрабатывалась примерно полтора года, и большинство денег, собранных членами, консорциума, пошло на разработку программного обеспечения. Также ведется работа над аналого-цифровым преобразованием, с помощью которого можно будет отцифровать книги, записанные на магнитной ленте. Самая тяжелая часть состоит в том, чтобы вернуться назад и добавить структуру, чтобы у студентов была возможность навигации, которую они хотят видеть в своих учебниках. Механизм распределения, который сейчас рассматривается, это CD-ROM. Он очень широко распространен, и скорее всего, останется таковым еще очень долго. Распределение на CD-ROM - это то, что есть уже сейчас. Понятно, что в течение достаточно длительного периода времени придется поддерживать кассеты. Таким образом, в течение некоторого периода времени кассеты и CD-ROM будут существовать параллельно. Это неизбежно, поскольку создана такая мощная кассетная 4-дорожечная инфраструктура.
Конечно, долгосрочной целью является распределение через Интернет. В очень большой степени это зависит от развития этой сети, и по мере ее развития можно предполагать, что движение пойдет именно в этом направлении. Поскольку используются стандарты и технологии, основанные на Интернет, такой вид передачи действительно является встроенным.
Теперь, когда мы знаем, что представляет цифровая «говорящая» книга, позвольте бросить взгляд на то, к каким средствам проигрывания будет иметь доступ пользователь. Благодаря тому факту, что в самый богатый тип цифровой «говорящей» книги будет включаться полный индексированный текст книги, незрячий пользователь будет иметь доступ к широкому диапазону средств.
Прежде всего, что касается пользователей Брайля: Цифровая «говорящая» книга будет распространяться на компакт-дисках или через Интернет, и ее можно будет прочитать с помощью программного обеспечения на вашем компьютере, которое позволит распечатать книгу непосредственно, или выдать ее на брайлевский дисплей. Вы также сможете воспользоваться своим портативным читающим устройством, на которое можно будет закачать свою любимую книжку. Наилучшим примером такой читающей системы может быть Braille Lite, снабженный соответствующим программным обеспечением. Другим интересным примером такого устройства может послужить BookWorm (Книжный червь) от компании HandyTech из Германии. Это восьмисимвольная читающая система, предназначенная только для чтения документов. У нее прекрасные возможности навигации и функции прокрутки для просмотра документов.
Повторюсь, что благодаря включению в ЦГК полного текста книги, также можно использовать технологию синтеза речи. Как и их брайлевские собратья, будут доступны речевые портативные плееры. Для России ситуация несколько осложняется отсутствием технологий высококачественного синтеза русской речи, однако появившиеся в последнее время разработки позволяют смотреть в будущее с известной долей оптимизма.
Стоит заметить, что пользователи крупного шрифта также смогут пользоваться цифровой «говорящей» книгой, будучи обеспеченными соответствующим программным обеспечением. Для этой категории также будут доступны портативные устройства. Есть все основания надеяться, что функция увеличения изображения будет одной из основных функций в устройствах для чтения электронной книги, уже появляющихся на западных рынках.
Последней по списку, но не по значению, является категория звуковых плееров для цифровой «говорящей» книги. Эти плееры будут использовать звукозапись и синхронизацию с текстом, чтобы предоставить пользователю эффективность и удобство, необходимое при чтении книги. В этой категории можно выделить два типа плееров: программные плееры, которые можно использовать с персональным компьютером, и аппаратные плееры. Сейчас на рынке присутствуют три программных плеера. Первый называется Sigtuna. Он был разработан американской компанией Productivity Works по заказу Японского Общества Реабилитации Лиц с ограниченными возможностями. Это программное обеспечение распространяется бесплатно Японским Обществом Реабилитации. Вторая программа, PlayBack 2000, была разработана Labyrinten Data, шведской компанией, по заказу TPB, датской Библиотеки для Слепых. Она также будет распространяться бесплатно. И, наконец, Productivity Works предлагает свой собственный программный продукт для проигрывания, который называется LpPlayer. Хотя эти программы распространяются бесплатно или очень дешевы, они предоставляют большинство основных функций, которые могут понадобиться незрячим, чтобы прочитать роман, журнал и тому подобное. Но для студентов и профессионалов потребуется более мощное программное обеспечение, чтобы читать документы со сложной индексацией
Наконец, Arkenstone хотел бы включиться в этот следующий шаг в сторону лучшего доступа к информации. Arkenstone, совместно с другими партнерами в рамках консорциума DAISY, пытается найти гранты, чтобы адаптировать свое программное обеспечение к миру цифровой «говорящей» книги, чтобы обслуживать потребности лиц с затруднениями в обучении и с затруднениями в речи, которые так же будут пользоваться той же самой «говорящей» книгой, которую мы обсуждаем.
А теперь поговорим об аппаратных звуковых плеерах. Сейчас на рынке имеется два плеера для цифровой «говорящей» книги. Эти плееры сосредоточиваются на проигрывании звукового файла, как это делает магнитофон, они не используют текстовые файлы, но предоставляют широкий спектр функций навигации. Один из таких плееров называется Plextalk. Его производит знаменитая японская компания Plextor. Plextalk - это настольная модель, основанная на контейнерном дисководе для компакт-дисков. Преимущество контейнера заключается в том, что пользователь не должен непосредственно обращаться с CD. Контейнер - это защищенная коробочка, которую вы вставляете прямо в плеер.
Но есть еще один плеер для цифровой говорящей книги. Он называется Victor, и производится в Канаде компанией VisuAide. Президент компании, Жильс Пепин, относящийся к своему детищу с большим энтузиазмом, описывает его предысторию так: «В 1996 году Европейский Союз Слепых начал консультации с пользователями и библиотеками, чтобы установить характеристики идеального плеера для цифровой говорящей книги. В результате получился очень полезный документ, который назывался «Вступая в XXI век: требования пользователей к следующему поколению «говорящей» книги». В этом документе очень подробно изложены требования незрячих пользователей. Например, он утверждает, что плеер должен иметь 65 различных функций навигации и поиска, которые полезны, или крайне желательны, а также заявляет, что он не должен иметь более 8 клавиш. Иначе граждане преклонного возраста его испугаются. В нем также говорится, что батареек должно хватать, по крайней мере, на 12 часов. Он должен располагать дисководом для компакт-дисков. И, конечно же, он должен умещаться в кармане шорт. Затем была сформирована рабочая группа NISO. Мы были полны энтузиазма, поскольку у нас был шанс найти правильные критерии для разработки. Поэтому на первом заседании мы начали дискуссию об элементах питания. Должны ли они быть перезаряжаемыми; должны ли они быть стандартными элементами питания; может ли пользователь их заменять; должны ли это быть солнечные батареи; и так далее. После трехчасовой дискуссии кто-то сказал, что пусть с батарейками разбирается производитель. Затем мы перешли к чему-то более важному, а именно к определителю храпа. Да, мы целый час обсуждали тот факт, что многие читают в постели, и что плеер должен прекращать чтение, если пользователь заснет».
Переходя от истории создания к реальной разработке, Жильс Пепин говорит: «Прежде всего, нам хотелось, чтобы машина была как можно более компактной. Поскольку мы хотели, чтобы она была портативной, пришлось выбрать обычный дисковод для компакт-дисков, а не контейнерный. Мы решили, что незрячие смогут справиться с компакт-дисками, поскольку в течение долгого времени они весьма успешно обращались с музыкальными дисками. Наш продукт работает на перезаряжаемых элементах от 6 до 8 часов и весит менее 1 кг. Victor - очень гибкий плеер для цифровой «говорящей» книги. Когда мы его разрабатывали, мы сказали, что в ближайшем будущем технология изменится, поэтому нам нужен очень гибкий проект, поскольку в будущем могут появиться новые алгоритмы сжатия речи. Возможно, придется поддерживать новые форматы DAISY, NISO или Open E-Book. Возможно, придется добавлять новые функции, которые попросит пользователь. Поэтому мы разработали Victor на базе очень гибкой платформы. Он основан на процессоре RISC, который называется Strong Arm, и он работает под управлением операционной системы Linux. Victor - очень дружественной к пользователю».
Прогнозируя будущее развитие плееров для цифровой «говорящей» книги можно сказать, что они будут становиться все более портативными, дешевыми и мультифункциональными устройствами. Кроме того, в ближайшие годы мы также сможем увидеть, как продукты коммерческого назначения станут очень хорошими плеерами для ЦГК. Например, в Японии продолжается другой проект, состоящий в том, чтобы разработать программное обеспечение для проигрывания ЦГК, которое будет работать на новых игровых машинах под управлением Windows C. Музыкальные плееры для MPEG 3 в будущем могут стать очень хорошими плеерами для цифровой «говорящей» книги.
Итак, подведем некоторые итоги. Цифровая «говорящая» книга является громадным шагом в направлении обеспечения равного доступа незрячих к информации. После обзора реальных шагов, предпринятых в этом направлении на Западе, тем горше будет констатация факта, что российские пользователи находятся далеко от возможностей вкушения плодов цифровой «говорящей» книги. Брайлевские системы чтения российскому читателю не по карману, полноценного синтезатора русской речи до сих пор нет, а аппаратные плееры для цифровой «говорящей» книги, самый дешевый из которых, Victor, стоит 495 долларов, увы, нам также не по средствам. Средства на разработку отечественного оборудования аналогичного назначения не выделяются. Судя по всему, в нашей стране еще очень слабо осознается тот факт, что без полноценного доступа к информации незрячие в недалеком будущем будут окончательно вытеснены как из сферы образования, так и с рынка труда, а если учесть темп изменений, с которым даже люди с полноценным здоровьем справляются с трудом, то незрячие в нашей стране могут оказаться лицом к лицу с весьма неутешительными перспективами. В наибольшей степени может пострадать та категория лиц, которая по разным причинам не овладела системой Брайля, и по причине слабого зрения не может пользоваться визуальным доступом к информации. Еще раз хочется подчеркнуть, что осознание важности проблемы полноценного доступа к информации для незрячих, ставшего технически возможным во многих отношениях, необходимо как со стороны общественных организаций, защищающих интересы незрячих, так и со стороны учреждений, занимающихся информационным обслуживанием данной категории пользователей, а также со стороны самих незрячих. Только объединенные и должным образом скоординированные усилия всех элементов этой системы помогут исправить то положение, когда старые способы обеспечения социокультурной и профессиональной реабилитации незрячих разрушены, а новые не созданы. Можно, конечно, возразить, что, денег нет даже на обычную «говорящую» книгу, что уж тут говорить о цифровой! Все это, конечно, так, и все же говорить об этом надо, если мы хотим стать полноправными членами информационного сообщества, а не обитателями исторического заповедника, которые не смогли приспособиться к условиям изменившейся реальности.