4 заметки с тегом

транслит РСС

Пара слов об эсемесках, набранных латиницей

1 августа 2008, 12:34

Я никогда не использую j для передачи звука "й", так как для меня j — это "дж". Проблем с тем, что y обозначает и й, и ы нет. Окончания -ий и -ый я записываю, соответственно, как -iy и -yi (novyi).

Твёрдый знак в латинице не нужен, так как сочетания yo, ya, yu и так читают как надо, а сочетания "ъе" заменяется на ye (zhdu u podyezda).

Мягкий знак я обозначаю апострофом только в случаях, когда иначе слишком велика вероятность, что слово прочтут неверно (лень придумывать пример, так бывает крайне редко). Почти всегда я его просто опускаю, в том числе в окончании -ться.

Букву ё я записываю:
  • как yo в случаях, когда она передаёт звуки [йо] (rota, podyom, yo moyo!);
  • как ö в случаях, когда она передаёт звук [о] и смягчает предшествующую согласную, которая без того звучала бы твёрдо (tvördo);
  • как o в случаях, когда она передаёт звук [o] и не изменяет звука предшествующей согласной (nu cho, ty skoro?).

SuperBiDiTranslit: The Acid Test

25 июня 2005, 23:49

Вот это - полигон для тестирования SuperBiDiTranslit. Вроде бы я его сделал.

Known issues:
  • правило "Если в скобочном контексте передан символ, который не имеет там особого смысла, то он понимается as-is" пока что не поддерживается
  • не поддерживается передача с сохранением регистра символов ни в одну из сторон (енкодер этого не поддерживает by design, а декодер - временно)
  • не поддерживается передача всяких там Unicode'овских символов (by design)
Чекбокс "BiDi?" означает, что вы хотите закодировать вашу строку, потом декодировать и убедиться, что получилось то же самое. Если его снять, то вы сможете потестировать только декодинг. Это нужно, чтобы посмотреть, что получится, если подсунуть декодеру строку, которую енкодер не смог бы сгенерить в принципе.

Если при BiDi-тесте результат будет отличаться от исходной строки, то он будет подсвечен красным. Если при тесте декодера при разборе строки произойдёт ошибка, там появится надпись PARSE ERROR. В обоих случаях большая просьба сказать об этом мне.

Спасибо.

Update: Ну конечно, сразу нашёлся ублюдок, который решил это заспамить, блин.

Update 2: Устроил для этой штуки стресс-тест: прогнал через неё весь код e2 туда и обратно. Он не изменился. Потом закинул его в zip и снова прогнал туда-сюда. Снова всё в порядке. Прикрутил всё это к e2. Можно теперь тестировать прямо здесь, в поиске по сайту.

SuperBidiTranslit

23 июня 2005, 18:17

Друзья. Перестаньте лениться и посмотрите вот сюда. Расскажите мне, что там не так.

Мнения типа "это нахрен никому не нужно" меня интересуют мало. Пожалуйста, будьте конструктивны.

Спасибо.

Поиск в e2, проблемы транслитерации

17 июня 2005, 17:53

Как вы знаете, в e2 поиск работает прямо из адресной строки. Когда вы пишете запрос, он постится в search_service, который его приводит к виду, принятому в адресной строке, и редиректит туда браузер.

При этом поддерживается русский язык - используются вот эти (или очень похожие на них) правила транслитерации. Неприятность тут в том, что эти правила не рассматривают ничего кроме цифр и букв. А ведь в поиске человек может написать всё, что угодно. В этих ситуациях e2 начинает чувствовать себя неважно.

Это нельзя назвать большой проблемой, но всё-таки неприятно. А хочется, чтобы было приятно. Поэтому я решил, что надо придумать такие правила транслитерации туда-сюда, чтобы всё работало безотказно. И вот что у меня получилось.

Буду очень благодарен всем, кто скажет что-нибудь полезное по этому поводу.