Категории каталога
Мистификация или реальность? [286]
Интересности всякие) [3036]
Технологии [1056]
Компы (ПО) [133]
Компы (Железо) [179]
Разное [1574]
Материалы, попавшие сюда либо сдесь же и останутся, либо "породят" новую категорию, куда и перекочуют.
Паприколу)) [2649]
Юмор, сатира, приколы...
Мабила [77]
Наш опрос
Оцените мой сайт
Всего ответов: 1214
Главная » Статьи » Интересности всякие)

История китайской клавиатуры


Вероятно, каждый хотя бы раз в жизни задумывался о том, как выглядит китайская клавиатура. Признайтесь: вы представляли ее себе как целый орган — длиной в пару метров, с сотнями и тысячами клавиш? На самом деле, большинство китайцев используют обычную клавиатуру с латинской раскладкой. Они даже умудряются набирать с ее помощью тысячи и десятки тысяч иероглифов.

Но как они делают это? Перед тем как понять современные методы набора китайских иероглифов, давайте сначала заглянем в самую глубь истории. А там, между, прочим, много всего интересного :)

Но как они делают это? Перед тем как понять современные методы набора китайских иероглифов, давайте сначала заглянем в самую глубь истории. А там, между, прочим, много всего интересного :)



Медная пластина для печатания бумажных денег, изготовленная между 1127 и 1279 гг. Рядом — современный пробный оттиск c этой пластины.

Начнем с того, что книгопечатание (также как бумагу, порох и компас) изобрели именно в Китае. Еще в IV в. до н.э. китайцы использовали большие печати, вырезанные из твердого дерева, для печатания магических амулетов. В начале нашей эры применялись штампы для текстиля. Подобную технику можно было бы легко перенести и на издание книг, но китайцы пошли иным путем.

Впервые размножать текст начали в 175 году с помощью снятия оттисков с каменного клише на бумагу. Для этого на плиту с рельефной надписью накладывали тонкий лист смоченной в воде бумаги, который с помощью легкого постукивания вдавливался в углубления между иероглифами. После этого по листу проводили клубком пряжи, смоченным в туши: попадая на выпуклости, тушь точно воспроизводила текст. Этот способ, несмотря на трудоемкость, получил широкое распространение. Он используется до сих пор для снятия копий с каменных стел, надписи на которых выполнены классиками каллиграфии.


Снятие оттиска с каменной стелы

С VI в. стал применяться так называемый ксилографический способ книгопечатания. Для этого бумагу с написанными на ней иероглифами прикладывали к доске, покрытой рисовой пастой, хорошо впитывающей тушь. Текст отпечатывался в зеркальном отражении. После этого с доски осторожно срезали слой древесины, не покрытой тушью. Таким образом создавался объемный рисунок текста — матрица. Чтобы отпечатать текст, достаточно было смочить доску тушью при помощи щетки, а затем приложить к листу бумаги. Ксилографический метод позволял одному рабочему снимать до двух тысяч отпечатков в день! Этот метод используется до сих пор. В монастыре Дрепунг в Тибете я сняла крохотное видео о том, как происходит печать буддистских текстов с современных ксилографических досок:




После изготовления нужного количества оттисков матрица откладывалась до следующего употребления. Некоторые матрицы хранились столетиями.

В эпоху Тан (618–907) печатная продукция в Китае пользуется все большим спросом, начинает издаваться первая в мире газета и даже появляются специальные книжные рынки. Печатные матрицы позволяли воспроизводить различные иллюстрации и отражать все тонкости китайской каллиграфии, любой размер иероглифов и редко встречающиеся знаки. Если же нужно было исправить текст, в матрицу вставлялись деревянные штепсели.


Фронтиспис издания "Алмазной сутры" (868 г.), отпечатанного с ксилографических досок


Образцы ксилографических досок


Тибетские монахи печатают с ксилографических досок в монастыре Сера

Однако печать с помощью матриц была очень медленной и трудоемкой. Эксперименты с техникой книгопечатания продолжались.

И вот в эпоху Сун, а точнее в 1041-1048 гг., некий простолюдин Би Шэн изобретает наборный шрифт. Этот шрифт изготавливался из глиняных брусочков, на торце которых вырезались резцом рельефные изображения иероглифов. Затем брусочки обжигались для прочности в печи. При печатании брусочки закреплялись в железной форме с помощью пасты из воска, сосновой смолы и бумажного пепла. Прежде чем начать печать, форму нагревали, а когда паста размягчалась, поверх литер накладывалась доска для выравнивания. После изготовления на бумаге необходимых оттисков форму опять нагревали, литеры рассыпались, и их можно было использовать для набора другого текста.


Современная реконструкция изобретенного Би Шэном подвижного шрифта и страница, напечатанная с его помощью

Таким образом, Би Шэн нашел полное решение главных типографских проблем: изготовление, компоновка и раскомпоновка литер многократного употребления. Однако и этот способ книгопечатания имел недостатки. Основной проблемой была непрочность глиняных литер, которые к тому же были мало пригодны для воссоздания всех нюансов китайской каллиграфии.

На этом творческая мысль китайских техников не остановилась. В 1314 г. некий Ван Чжэнь впервые стал использовать для печати деревянные литеры и описал устройство наборных касс, позволяющее наборщику быстро найти нужную литеру. Ван Чжэнь указал, что следует использовать две кассы — для часто и редко употребляемых иероглифов. Кассы делались из дерева и представляли собой вращающиеся на подставке круглые столы, поверхность которых бортиками была разделена на множество секций. Каждая литера имела свой номер и помещалась в определенную секцию. Набор происходил так: чтец называл номер иероглифа, а наборщик, вращая кассу, выбирал нужный иероглиф и вставлял его в рамку, зажимая планкой.


Изображение двух касс Ван Чжэня


Современная копия вращающихся касс Ван Чжэня


Еще одна современная копия вращающихся касс Ван Чжэня

Тем не менее, наборное книгопечатание не стало для китайцев приемлемым решением и пользовалось гораздо меньшей популярностью, чем ксилография. Ничего удивительного, ведь, учитывая количество нужных для печати знаков, оно требовало гораздо больших усилий и ресурсов, чем печать с досок. Ирония судьбы: созданное в Китае наборное книгопечатание идеально подходило для европейских языков с их компактными алфавитами, но было изобретено Европой независимо в XV в. Зато китайская технология печати через уйгуров из Синьцзяна проникла на Кавказ, а оттуда в Малую Азию и в Александрию.


Образец наборного шрифта из металла


Современный образец наборного деревянного шрифта в музее-типографии




Работа современного мастера по изготовлению литер наборного шрифта

В Новое время зависть китайцев к давно и успешно автоматизировавшимся европейцам стала крепнуть все больше. Видимо поэтому и зародилась в головах китайских изобретателей идея печатной машинки, которая, как казалось, должна была облагодетельствовать несчастных писарей и печатников раз и навсегда.

История вопроса: печатные машинки

За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер.

Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде такой:

image
Печатная машинка фирмы «Шуангэ», 1947 год (принцип действия придуман японцем Киота Сугимото в 1915 году).

Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту.

В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.

image
Электромеханическая печатная машинка Линь Юйтана, 1946 г.

В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту!

Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен.

Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим.
(Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)

Структурные методы


Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.

Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно.

На самом деле все китайские иероглифы делятся на четыре группы:
  1. Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша).
  2. Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).
  3. Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.
  4. Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.

Ну вот, мы мысленно разбили иероглиф, который собираемся ввести, на графемы. Что дальше? Сначала посмотрим на раскладку уби:

image

На первый взгляд может показаться, что графемы расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема.

Ну что ж, начнём с самых простых для ввода графем — заглавных графем каждой клавиши (они выделены крупным шрифтом в таблице). Каждая из них представляет собой один их 25 часто употребляемых иероглифов, о которых шла речь выше. Чтобы ввести такой иероглиф, достаточно нажать четыре раза на соответствующую клавишу. Выходит, что 金=QQQQ, 立=YYYY и т. п.

image

Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю.

Сложнее всего вводить иероглифы, состоящие из двух или трёх графем. Поскольку их очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Чтобы их различать, разработчики придумали специальный код. Этот код состоит из двух цифр, первая — порядковый номер последней черты иероглифа, а вторая — номер группы иероглифа (вспомните четыре группы, на которые разделяются иероглифы).

К счастью, при наборе большинства часто используемых иероглифов не придётся думать о кодах, потому что иероглифы будут появляться на экране уже после первых двух или трёх нажатий. А 24 наиболее часто встречающихся знака можно и вовсе ввести одним нажатием (им поставлены в соответствие клавиши).

Недостатки структурного ввода очевидны: он сложный — выше была только дайджест-версия его описания! Чтобы освоить его, китайцы даже специальный мнемонический стишок придумали. Зато структурный метод открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 символов в минуту. Поэтому профессиональные наборщики используют именно его. И не забываем: 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту!

Для структурного ввода чаще всего используют самую обычную клавиатуру QWERTY — ведь расположение иероглифов на ней все равно приходится учить. Но иногда можно встретить и вот такие клавиатуры с графемами на клавишах:

image

Правда, я за все свое время пребывания в Китае таких клавиатур не видела :)

Фонетические методы

Печатных машинок, использующих эти методы набора, попросту не существует — своим появлением фонетические методы обязаны исключительно компьютерам. Ведь используя фонетический метод, вы вводите не сам иероглиф, а его произношение — и система уже находит нужный иероглиф. Но вот проблема: в китайском языке столько знаков, что одному и тому же произношению могут соответствовать десятки иероглифов. Нужный иероглиф, как правило, приходится выбирать вручную из списка, что делает процесс ввода довольно медленным. На помощь приходят предиктивные системы наподобие T9.

Наиболее распространенный фонетический метод — знаменитый пиньинь (Pinyin). На его основе построена система фонетического ввода, которая входит в стандартный Asian Language Pack системы Windows (начиная с версии XP — до этого ее приходилось ставить дополнительно). Посмотрим, как она работает.

Например, мы хотим ввести слово «блоггер» — ванминь.
Набираем сначала wang (или wang3 с указанием тона, чтобы уменьшить количество вариантов). После нажатия пробела подставляется иероглиф с чтением ван. Но это не тот ван, что нам нужен. Жмем на него правой кнопкой:

image

Вылезает длинная строка соответствий. Мы можем, ломая глаза, искать там наш ван или просто ввести второй слог слова — min. Система умная — она сама найдет в словаре слово ванминь и автоматически выберет нужный ван и нужный минь. Банзай, мы сделали это!

image

Системы ввода Google Pinyin и Sogou Pinyin пошли дальше — они запоминают пользовательские предпочтения и подсказывают на основании контекста нужные слова.
Вот пример того, как Google Pinyin анализирует, казалось бы, зубодробительную последовательность

image

и выдает правильный вариант набора:
Я видел, как Ван Чжичжи играл в одном матче с Яо Мином (речь идет о двух китайских баскетболистах NBA). Особенно приятно, что имена написаны правильно.

На Тайване существует и альтернатива пиньинь-системе — ввод по чжуинь (Zhuyin). Используется не латинский алфавит, а слоговая азбука cо значками наподобие иероглифов. Поскольку значков в азбуке немного, их легко раскидать по клавиатуре. В Гонконге есть свой вариант романизации для местного диалекта — ютпхин (Jyutping), он тоже активно используется для фонетического ввода.

Основным недостатком систем фонетического ввода является довольно низкая скорость печати — около 50 знаков в минуту (сравните с уби цзысин с его 160 знаками в минуту). Дело в том, что ввод иероглифа по методу пиньинь происходит, в среднем, за шесть нажатий клавиш, тогда как при вводе по уби цзысин будет достаточно четырех. К тому же, слепой набор данным методом невозможен. И потом, нужно знать пиньинь/чжуинь, что далеко не всякому китайцу подходит, потому как с первого класса школы знания (если и были) успели немножко подвыветриться. Да и не всегда легко вспомнить, как читается какой-нибудь редкий иероглиф. Поэтому в Китае всё большую популярность набирает уби цзысин. Тем не менее, пиньинь выучить все равно проще, чем структурные методы. Ну а иностранцу такая система просто как бальзам на душу.

Как мы видим, для фонетического ввода нам также не потребуется какая-то специальная клавиатура — достаточно любой клавиатуры с латинской раскладкой QWERTY. Ну, например, вполне подойдет та, которая находится перед вами :)

Гибридные методы

Эти методы представляют собой некую комбинацию фонетических и структурных методов ввода. Простейший пример — метод иньсин (Yinxing — «звучание и форма»). Иероглиф набирается путем ввода транскрипции и указания на графический элемент. Ограниченный набор графических элементов разнесен по клавиатуре, так что запомнить их теоретически не сложно.

На практике системы гибридного ввода постепенно вымирают. Они требуют от пользователя одновременно знания сложной комбинаторики структурных систем и хорошего владения транскрипцией. Проще уж освоить в совершенстве что-то одно.

Так есть ли «стандартный» метод?

А вот и нет. В КНР наибольшей популярностью пользуются структурный метод уби и фонетический пиньинь. На Тайване любят фонетический метод чжуинь (поскольку многие учили в школе именно его, а не пиньинь) и морально устаревший структурный метод цанцзе (Cangjie). Он был изобретен еще в 1976 г. и сохранил с тех пор все свои недостатки: этим методом очень сложно вводить пунктуационные знаки, нужно всегда угадывать правильный способ разбивки иероглифа и помнить сложную раскладку (многие тайваньцы даже наклеивают ее от безысходности на монитор). В Гонконге цанцзе учат в школе и явно предпочитают его всем остальным методам.

Методы, основанные на распознавании

Получается, что ни один из перечисленных методов клавиатурного ввода не является идеальным. Неудивительно, что китайцы решили уцепиться за свою последнюю надежду — распознавание. Сейчас распознавание как речи, так и рукописного ввода входит в стандартный Language pack Windows 7. Предполагается, что перед использованием лучше перевести систему в «обучающийся режим» как минимум минут на 15, чтобы дать ей время привыкнуть к вашему почерку и особенностям речи.

Но методы, основанные на распознавании, так и не получили широкого распространения. Ввод с помощью клавиатуры по-прежнему считается более надежным.

Распознавание устного китайского осложняется тем, что не так велика доля людей, говорящих с идеальным произношением. Диалектные особенности вылезают то тут, то там и портят всю картину. Об иностранцах, для которых освоить четыре тона — уже подвиг, и говорить не приходится.

Рукописный ввод иероглифов представляется делом попроще, к тому же сейчас существует множество PDA, поддерживающих этот метод ввода. Но и этот метод не достиг широкого применения. Дело в том, что китайцы в большинстве своем пишут нечленораздельным курсивом и перестроиться на медленное вырисовывание каждой черты им бывает сложно. Часто проблема в том, что они просто не помнят нормальный порядок черт, потому что привыкли писать сокращенные формы! Вот и выходит, что ввод, основанный на распознавании, годится в основном для изучающих язык, чем активно пользуются онлайн-словари. Например, на сайте популярного Nciku всем желающим предлагается нарисовать нужный иероглиф с помощью мыши, а затем выбрать из предлагаемых системой вариантов:

image

И все-таки она существует!


image
Экспериментальная китайская клавиатура, бессмысленная и беспощадная.

Ведь именно так вы ее себе представляли?
Да, да, китайские клавиатуры с тысячами клавиш существуют. Правда по понятным причинам они не идут в серийное производство, оставаясь неким артефактом.
Но, согласитесь, все-таки приятно осознавать, что такая клавиатура где-то есть!

(В статье использованы изображения с сайтов www.killdark.com, bbs.tiexue.net, www.nipic.com, www.51766.com, www.e-museum.com.cn, www.hudong.com, www.dp918.com, history.rsuh.ru и en.wikipedia.org.)

Юля Дрейзис,
руководитель группы лексикографических описаний китайского языка
Категория: Интересности всякие) | Добавил: marina (10.10.2010)
Просмотров: 2385 | Рейтинг: 5.0/1 |
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Суббота, 18.04.2026, 04:06
Приветствую Вас Гость
Форма входа
Мини-чат
200
Поиск
Друзья сайта
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0