4 заметки с тегом
транслит РСС
Пара слов об эсемесках, набранных латиницей
1 августа 2008, 12:34
Я никогда не использую j для передачи звука "й", так как для меня j — это "дж". Проблем с тем, что y обозначает и й, и ы нет. Окончания -ий и -ый я записываю, соответственно, как -iy и -yi (novyi).
Твёрдый знак в латинице не нужен, так как сочетания yo, ya, yu и так читают как надо, а сочетания "ъе" заменяется на ye (zhdu u podyezda).
Мягкий знак я обозначаю апострофом только в случаях, когда иначе слишком велика вероятность, что слово прочтут неверно (лень придумывать пример, так бывает крайне редко). Почти всегда я его просто опускаю, в том числе в окончании -ться.
Букву ё я записываю:
Твёрдый знак в латинице не нужен, так как сочетания yo, ya, yu и так читают как надо, а сочетания "ъе" заменяется на ye (zhdu u podyezda).
Мягкий знак я обозначаю апострофом только в случаях, когда иначе слишком велика вероятность, что слово прочтут неверно (лень придумывать пример, так бывает крайне редко). Почти всегда я его просто опускаю, в том числе в окончании -ться.
Букву ё я записываю:
- как yo в случаях, когда она передаёт звуки [йо] (rota, podyom, yo moyo!);
- как ö в случаях, когда она передаёт звук [о] и смягчает предшествующую согласную, которая без того звучала бы твёрдо (tvördo);
- как o в случаях, когда она передаёт звук [o] и не изменяет звука предшествующей согласной (nu cho, ty skoro?).
SuperBiDiTranslit: The Acid Test
25 июня 2005, 23:49
Вот это - полигон для тестирования SuperBiDiTranslit. Вроде бы я его сделал.
Known issues:
Если при BiDi-тесте результат будет отличаться от исходной строки, то он будет подсвечен красным. Если при тесте декодера при разборе строки произойдёт ошибка, там появится надпись PARSE ERROR. В обоих случаях большая просьба сказать об этом мне.
Спасибо.
Update: Ну конечно, сразу нашёлся ублюдок, который решил это заспамить, блин.
Update 2: Устроил для этой штуки стресс-тест: прогнал через неё весь код e2 туда и обратно. Он не изменился. Потом закинул его в zip и снова прогнал туда-сюда. Снова всё в порядке. Прикрутил всё это к e2. Можно теперь тестировать прямо здесь, в поиске по сайту.
Known issues:
- правило "Если в скобочном контексте передан символ, который не имеет там особого смысла, то он понимается as-is" пока что не поддерживается
- не поддерживается передача с сохранением регистра символов ни в одну из сторон (енкодер этого не поддерживает by design, а декодер - временно)
- не поддерживается передача всяких там Unicode'овских символов (by design)
Если при BiDi-тесте результат будет отличаться от исходной строки, то он будет подсвечен красным. Если при тесте декодера при разборе строки произойдёт ошибка, там появится надпись PARSE ERROR. В обоих случаях большая просьба сказать об этом мне.
Спасибо.
Update: Ну конечно, сразу нашёлся ублюдок, который решил это заспамить, блин.
Update 2: Устроил для этой штуки стресс-тест: прогнал через неё весь код e2 туда и обратно. Он не изменился. Потом закинул его в zip и снова прогнал туда-сюда. Снова всё в порядке. Прикрутил всё это к e2. Можно теперь тестировать прямо здесь, в поиске по сайту.
SuperBidiTranslit
23 июня 2005, 18:17
Друзья. Перестаньте лениться и посмотрите вот сюда. Расскажите мне, что там не так.
Мнения типа "это нахрен никому не нужно" меня интересуют мало. Пожалуйста, будьте конструктивны.
Спасибо.
Мнения типа "это нахрен никому не нужно" меня интересуют мало. Пожалуйста, будьте конструктивны.
Спасибо.
Поиск в e2, проблемы транслитерации
17 июня 2005, 17:53
Как вы знаете, в e2 поиск работает прямо из адресной строки. Когда вы пишете запрос, он постится в search_service, который его приводит к виду, принятому в адресной строке, и редиректит туда браузер.
При этом поддерживается русский язык - используются вот эти (или очень похожие на них) правила транслитерации. Неприятность тут в том, что эти правила не рассматривают ничего кроме цифр и букв. А ведь в поиске человек может написать всё, что угодно. В этих ситуациях e2 начинает чувствовать себя неважно.
Это нельзя назвать большой проблемой, но всё-таки неприятно. А хочется, чтобы было приятно. Поэтому я решил, что надо придумать такие правила транслитерации туда-сюда, чтобы всё работало безотказно. И вот что у меня получилось.
Буду очень благодарен всем, кто скажет что-нибудь полезное по этому поводу.
При этом поддерживается русский язык - используются вот эти (или очень похожие на них) правила транслитерации. Неприятность тут в том, что эти правила не рассматривают ничего кроме цифр и букв. А ведь в поиске человек может написать всё, что угодно. В этих ситуациях e2 начинает чувствовать себя неважно.
Это нельзя назвать большой проблемой, но всё-таки неприятно. А хочется, чтобы было приятно. Поэтому я решил, что надо придумать такие правила транслитерации туда-сюда, чтобы всё работало безотказно. И вот что у меня получилось.
Буду очень благодарен всем, кто скажет что-нибудь полезное по этому поводу.
