146840.fb2
А что, если наговорить кучу самых разных слов и поручить компьютеру находить и воспроизводить нужные слова в нужной последовательности в процессе разговора? Получится ли правильная человеческая речь?
Вряд ли. Ведь одно и то же слово участвует в предложениях разного типа с десятком интонаций, сотнями вариантов произношения. Чтобы такая речь мало-мальски "ласкала слух", потребуется слишком большая куча вариантов произнесения слов и, следовательно, слишком длительный поиск нужного варианта. Все это окажется слишком дорого. Хорошо бы, задумались конструкторы, создать машину, которая бы не воспроизводила заранее записанные фрагменты, а говорила сама, то есть синтезировала речь, подобно человеку.
Историю говорящих машин следовало бы начать с глубины веков. Самые первые были тщательными моделями человеческого речевого аппарата. Кузнечный мех вдувал мощную струю воздуха в кожаную гортань, язычки и резонаторы, управляемые набором рычагов, вибрировали, и машина "говорила". Достоверно известна одна из конструкций такого типа, построенная В. фон Кемпелиа в конце XVIII века. Она неплохо имитировала человеческую речь, хотя не совсем правильно произносила некоторые звуки. В 1920 году Р. Пэджет демонстрировал акустическую модель речевого аппарата, которая удивляла слушателей целыми фразами, например: "О Лейла, я люблю вас!" или: "Алло, Лондон, Вы слушаете?" Изобретатель, манипулируя руками, очень искусно изменял форму резонирующей полости механической гортани - и одна фраза менялась на другую.
Как это неоднократно происходило в истории техники, механический принцип копирования благополучно завершил серию тщетных потуг и новая фаворитка человечества - электроника прочно уселась на его место.
Исследованиями было установлено, что подавляющая часть "звуковой энергии" человеческой речи сосредоточена в пяти типовых областях частот: от 200 до 3500 герц. Эта шкала разбивается на пять фонем, каждая из которых генерируется своей специально настроенной звуковой схемой. Управление частотой и амплитудой каждой схемы, а также очередностью их срабатывания поручается компьютеру. В результате определенных последовательностей включения генерирующих схем и возникают необходимые звуки "человеческого голоса".
Однако качество работы машины, полностью синтезирующей речь, в большой степени зависит от того, насколько удачно удается электронная имитация смеси переходных шумов между отдельными звуками, поскольку эти шумы играют определяющую роль для понимания языка вообще и, следовательно, искусственного языка в частности. Еще более усложняет все дело то, что они бывают чрезвычайно разнообразными, зависят от того, в какой последовательности произносятся гласные и согласные, от скорости и громкости произнесения слов и т. д. и т. п.
Еще недавно как великую экзотику демонстрировали кибернетики системы, полностью синтезирующие человеческую речь, а уже поступают сообщения о серийном выпуске говорящих часов, фотокамер и светофоров.
Это следствие появления на рынке близкого родственника современного микропроцессора - который назван voiceprocessor (от английского слова "voice" - голос).
Что-то вроде "процессор для синтеза голоса" или "голосистый процессор". Такое устройство программируется как обычный компьютер и может синтезировать электронную копию волнового спектра, возникающего при произнесении слов. Этим машина похожа на читающего, который, правда, не имеет понятия о смысле прочитанного.
Лингвистические способности роботов не только "оживили" безгласные вещи, но и помогают человеку в его "разговорной деятельности"; например, созданы карманные компьютеры, используемые в качестве помощников при переводе, которые "выговаривают" отдельные слова с правильным произношением на нужном языке; или целые роботы-переводчики, которые могут осуществлять перевод международных разговоров несложного бытового содержания. Такова, например, система перевода английский - японский. Память робота содержит около восьми тысяч фонем слов, четыреста идиом, примерно тысячу грамматических правил обоих языков. Она почти не отличается от аналогичных интеллектуальных переводчиков. Шагом вперед явилось ее объединение с распознавателем и синтезатором речи.
Одна из фирм в ФРГ, занимающаяся выполнением заказов по пересылке, давно использует в своей деятельности компьютер, который отвечает на звонок человеческим голосом, робот подтверждает получение заказа или же сообщает о невозможности его выполнения, закончив разговор, говорит "спасибо" и "до свидания".
Хорошо трудится вот уже почти два года "Карлуша" - крупная железнодорожная справочная система: абонент называет вокзал назначения и без промедления получает устную справку о поездах, следующих в данном направлении, времени и вокзалах, в которых можно сделать удобную пересадку.
Постоянно растущий объем информации требует новых путей и методов ведения информационно-справочной работы. Все острее ощущается нехватка людей, времени и средств для компетентных ответов на вопросы из всех областей знания. В будущем тут могут помочь лишь понимающие язык и могущие "изъясняться" роботы, снабженные "банками памяти".
Серьезные усилия, прилагаемые в области создания машин, понимающих человеческую речь и отвечающих людям, наглядно свидетельствуют о том, что речь при этом идет не о каких-то игрушках. Взаимодействие с машиной на языковом уровне позволит людям, не обладающим специальными знаниями, эффективно пользоваться компьютерами и роботами.
МИДИ, МИНИ, МИКРО...
В одном из номеров журнала "Техника - молодежи" была помещена красочная фотография: симпатичная девушка расположилась на удобном коврике 2X2 метра с пестрым современным рисунком. Подпись под фотографией гласила: "Так выглядит одна из секций большой интегральной схемы, размер которой в натуре составляет 250 микрон в поперечнике". Пестрота этого коврика объясняется тысячами нитей, квадратиков, прямоугольников, каждый из которых представляет собой транзистор, проводок или другой элемент микромодуля. На таком коврике переплетаются около миллиона электронных компонентов. Это в десять раз больше, чем их было в одном из первых компьютеров ЭНИАК - 30-тонном монстре, который начал работать в 1946 году. Несколько последних десятилетий инженеры практически ежегодно, грубо говоря, удваивали число электронных узлов в одном микрокристалле. При этом - примите как парадокс или как закономерность - с ростом плотности "упаковки" микроэлементов снижается их стоимость и размеры. К 1990 году инженеры намерены разместить в одном модуле 10 миллионов транзисторов. В результате столь потрясающей эволюции интегральные схемы стали сверхнадежными. Достаточно сказать, что ЭВМ на радиолампах такой же сложности вряд ли смогла бы проработать до первого отказа даже несколько секунд. Из-за предельной близости элементов схемы друг к другу электрические сигналы пробегают от одного элемента схемы к другому по таким коротким путям, что это почти не требует затрат электроэнергии и происходит за минимально возможное время. Отсюда качественные шедевры быстродействия и объема памяти. Современный микропроцессор реализует что-то около миллиона операций в секунду, а такого же размера блок памяти хранит около 64 тысяч единиц информации.
На рекламной фотографии изображены рядом два одинаковых по размеру муравья: один из них наш "лесной друг", другой - миниатюрный блок памяти, "вмещающий" толстую телефонную книгу.
Мода на пресловутые мини-юбки давно канула в прошлое, "мода" на мини-компьютеры буквально захлестнула нашу планету. Сейчас в мире эксплуатируется более двух миллионов мини-компьютеров, и их доля в общем объеме ЭВМ, по прогнозам специалистов, будет и дальше увеличиваться примерно на 35 процентов в год.
В Москве, на Ленинском проспекте, где находится фирменный магазин Министерства электронной промышленности "Электроника", можно увидеть не только самую современную магнитофонную, видеомагнитофонную и проигрывающую технику, но и новое чудо - персональную ЭВМ, которую можно приобрести в личное пользование. Большинство ее обладателей так и не ведает, как происходит работа этих ближайших родственников гигантских компьютеров, да и не нуждается в подобных знаниях.
Эта ЭВМ, снабженная дисплеем и клавиатурой пишущей машинки, пригодна для любых целей. Когда писалась эта книга, домашний компьютер помогал автору ее править, заменяя, вставляя или выкидывая на экране отдельные слова, строчки, абзацы и целые страницы текста, а затем с помощью специальной приставки отпечатал набело отредактированную рукопись. Он также ведал хранением используемых справок и фактов и корректировал правописание слов. Для этих целей он был оснащен специальной программой для обработки словесных текстов.
Брезжит на горизонте еще один "сладкий плод" антропоморфного электронного моделирования - фонетическая пишущая машинка, которая печатает произносимый текст с голоса со скоростью, превышающей возможность нормального его произнесения. Несколько моделей таких машинок уже сконструировал научный сотрудник Женевского университета Д. Граф. В таком устройстве голос человека, воспринимаемый микрофоном, преобразуется в электрические колебания соответствующих частот. После усилений речевой сигнал поступает на анализатор - 8 полосовых фильтров от 200 до тысячи герц, а затем на систему детекторов сравнения.
Система детекторов устроена так, что реле, соответствующее данному каналу, срабатывает тогда, когда уровень в нем больше среднего уровня в двух соседних каналах.
Когда система узнала произнесенный слог, включается блок, управляющий работой буквопечатающего устройства. Этот блок, пожалуй, самая хитрая часть фонетической пишущей машинки. Именно он заведует орфографией, то есть тем, чтобы слова были напечатаны не так, как они произнесены, а так, как они пишутся по законам конкретного языка. Интересно отметить, что печатная форма русских слов отличается от фонетической значительно меньше, чем, скажем, английских или французских. Это облегчает работу советских ученых, работающих над этой проблемой, и достигнутые успехи вселяют уверенность, что в ближайшее время появятся промышленные образцы компьютерных роботов-машинисток.
Еще одна мощная новинка компьютеризации - информационный робот, так называемая электронная домашняя газета. Зачем печатать газету, "портить" бумагу, если через день, буквально через несколько часов она станет "вчерашней". Телегазета - вот вечно динамичный и экономный вид издания, она существует всего в одном экземпляре и в то же время "издается" миллионным тиражом. Подобная система позволяет отображать на экранах телевизоров не только новости, но и тексты с разнообразной справочной информацией, с расписанием движения транспорта, сведения о репертуаре театров и кино, сводки погоды и т. п.
Футурологи утверждали, что телевизионные информационные газеты и справочники появятся после 1985 года. Однако болгарская электронная промышленность опередила все сроки. Уже действует экспериментальная система "Бултекст", которая способна по заказу из дома выносить на экран обычного телевизора 999 страниц справочного текста с иллюстрациями. Достаточно нажать клавишу приставки - и вы получаете возможность увидеть страницу вечерней газеты еще до того, как вам ее принесет почтальон. При этом не требуется ни мощных печатных машин, ни одного загубленного на бумагу деревца. Кроме того, в любое время дня вы узнаете погоду, расписание вылета самолетов, репертуар театров, результаты спортивных матчей. Можно еще проверить лотерейные билеты, заказать библиографические справки по новинкам литературы, "полистать" медицинские и технические справочники, словом, получить массу полезной информации.
Передачи ведутся из специальной студии, оборудованной ЭВМ с блоком памяти. При этом система "Бултекст" не занимает отдельного канала, домашняя компьютерная приставка позволяет убирать изображение идущей программы и вводить на экран с помощью машинописной клавиатуры текст любого запроса. В недалеком будущем удастся увеличить количество заказываемых страниц до шестнадцати тысяч. Даже энциклопедию можно будет листать, не заходя в библиотеку.
Высказывают мнение, что лет через двадцать значительная часть из нас будет работать на дому, используя компьютеры и вступая в деловые отношения с помощью электронной почты.
Для этого конструкторы разрабатывают экспериментальный телетерминал: комбинацию телефона, компьютерного терминала и телевизора с компактной клавиатурой и экраном. Настольное устройство отыскивает телефонные номера, делает вызовы, посылает и принимает послания и отображает хранящуюся информацию.
Такой робот-телефон в состоянии запомнить имена и фамилии тридцати ваших абонентов, произнесенных вслух громким голосом. Достаточно при этом однажды набрать их номер телефона, чтобы в дальнейшем вызывать нужных собеседников простым произнесением фамилии.
Как полагают специалисты, дистанционные копировальные устройства, до сих пор применявшиеся лишь в таких областях производства, как автоматизированное проектирование или подготовка управляющих программ для станков с числовым программным управлением, вскоре получат довольно широкое распространение. Мыслится это так. Нуждающиеся в "документированной" связи потребители подключат к своим телефонам копировальные установки. Документ или письмо, которое надо передать, закладывается в установку, после чего по телефону набирается номер адресата. Все остальное делается компьютером автоматически в течение нескольких минут. Документ прочитывается, информация кодируется в цифровой вид и передается на установку адресата, где снова превращается с помощью микропроцессора и чертежного устройства в документ.
Миниатюрная ЭВМ не только уютно расположилась у нас дома, но и "забралась в карман" современного специалиста не в переносном, а в самом прямом смысле. В ближайшем будущем там появится множество разнообразных и очень полезных электронных устройств.
Например, электронная "записная книжка" - миниатюрная комбинация пишущей машинки и компьютера.
В ней есть сорок слов внутренней памяти, по пятнадцать знаков каждое, и память легко можно расширить. Размер ее 30X5X0,5 см. Используется это устройство в служебных целях: составление памятных записок, рассылка приглашений, подсчеты, графики, расписание и прочее. Всю информацию можно в любой момент напечатать, подсоединив его к электронной пишущей машинке.
Другое устройство официально называют планирующим компьютером, а неофициально - электронным секретарем. Он "запоминает" тридцать семь сигнальных меток для контроля мероприятий за день: в заданное время раздается звонок, и на небольшом экране появляется сообщение. "Электронный секретарь" позволяет составить себе расписание на три года вперед.
И наконец, электронный переводчик - машинка не больше пачки сигарет. Набираешь слово на клавиатуре, и на зкранчике небольшого дисплея получаешь перевод на любой из десяти языков, да еще со звуковым сопровождением правильного произношения на иностранном языке.
Появился и наручный компьютер. Размером и формой он напоминает часы. Однако... Такую штуковину часами и не назовешь, ведь часы в соответствии со своим этимологическим смыслом должны отмерять часы, минуты, ну, наконец, секунды, и все. Конечно, некоторые показывают и число, и день недели - этим никого не удивишь.
Но вот та японская фирма, которая, выпуская на рынок новый образец товара, уже не захотела называть его часами. "Многоцелевой прибор времени" - глубокомысленно окрестила она его!
Такой "прибор" показывает и фиксирует секунды, минуты, часы, дни недели, число, месяц и даже год.
- Ну, это уж слишком, зачем год-то, ведь забыть его трудно.
Очень просто, если не фиксировать в памяти месяц, то число дней в месяце необходимо "переставлять" самостоятельно 30-31; 28-29. Если фиксировать месяц, то пересчет дней месяца происходит автоматически, за исключением календаря на февраль, ведь один раз в четыре года февраль имеет не 28, а 29 дней. Вот для этого нужно фиксировать год. Итак, пересчет всех параметров времени происходит автоматически, без вмешательства человека.
Кроме указанных функций, такой прибор имеет будильник - звуковой сигнал, который можно установить на любой час и минуту суток, и он разбудит вас мелодичным "динь-динь" или нежным "бип-бип-бип"... или даже сыграет любимую мелодию. Кроме того, эти "часы" в начале каждого часа легким "динь-динь" сообщают, что еще один час "канул в Лету". Можно зафиксировать и вызвать из памяти "второе время", скажем местное или московское. Кроме того, в часах находится секундомер с точностью до 1/100 секунды. Секундомер имеет специальную кнопку для считывания показаний, при ее нажатии бег цифр останавливается, а сам секундомер в это время работает. Моменты включения и выключения секундомера для самоконтроля сопровождаются звуковым сигналом "бип". Но вот и все, что касается функций времени. Немало, но это, впрочем, типовой набор современных "хороших" часов.
Теперь компьютер. Это обыкновенный калькулятор, он имеет 12 клавиш цифр и 5 клавиш действий +, -, :, X. Производимые операции +, -, :, X высвечиваются на дисплее - экране, где раньше были часы и мипуты. Еще можно использовать компьютер как записную книжку для всяких номеров: телефон, дата и тому подобное. И наконец, эти компьютеро-часы имеют... игру. Игру, в которую можно играть с компьютером (не зачатки ли это интеллектуальности?).
При нажатии на "игровую" клавишу на дисплее начинается бег цифр, цифры эти случайные, и игра состоит в том, чтобы сбить эти цифры до того, как они достигнут противоположного края экранчика часов. Чтобы сбить цифру, нужно набрать аналогичную в специальной позиции того же дисплея. Набор цифр осуществляется путем нажатия на одну из клавиш часов.
Причем, если на экране цифры появляются в случайном порядке, то в специальной позиции цифры появляются только в порядке возрастания: 1, 2, 3, ..., О, и зат м опять, начиная с 1 до 0. В несовпадении этих последовательностей и состоит изюминка игры. Часы играют несколько туров, причем следующий начинается только в том случае, если в предыдущем игрок набрал не менее определенной суммы очков, иначе компьютер сочтет вас слишком слабым игроком и не станет больше тратить на вас свой интеллект.
Если вы шли от тура к туру достойно, не набрав ни одного штрафного очка, - это значит, что вы сбили все цифры, не дав им дойти до противоположного края дисплея, компьютер несколько меняет стратегию игры, цифры теперь идут быстрее, и порядок их запуска становится все "противоположнее" естественному порядку набора: 1, 2, 3, 4... Если и эти трудности вы преодолели, включается третья стратегия игры, при которой цифры появляются уже на позицию ближе к противоположному краю, и возникает еще более хитрая их последовательность. Во время игры компьютер подбадривает правильное нажатие клавиши одобрительным "дзинь", а ошибочный набор печальным "динь", окончание тура и всей игры сопровождается своими особыми сигналами.
Игра сама по себе предназначена для игры, однако применять ее можно для следующих бытовых целей:
- тренировка внимания, реакции, сообразительности;
- сброс напряжения, расслабление, заполнение паузы;
- самооценка-самоконтроль: если игра ведется по постоянной стратегии, то сумма очков, набранная в каждый момент времени, характеризует общее состояние реакции, внимания и сообразительности.