Подписка на блог

В Телеграме помимо ссылок на заметки делюсь околодизайнерскими наблюдениями.

В Твиттере помимо ссылок на заметки пишу всякую чушь.

В Тумблере и Же-же есть автоматические трансляции. Если не работает, напишите мне: ilyabirman@ilyabirman.ru.

По РСС и Джейсон-фиду трансляции для автоматических читалок

Транслит

Пара слов об эсемесках, набранных латиницей

Я никогда не использую j для передачи звука «й», так как для меня j — это «дж». Проблем с тем, что y обозначает и й, и ы нет. Окончания -ий и -ый я записываю, соответственно, как -iy и -yi (novyi).

Твёрдый знак в латинице не нужен, так как сочетания yo, ya, yu и так читают как надо, а сочетания «ъе» заменяется на ye (zhdu u podyezda).

Мягкий знак я обозначаю апострофом только в случаях, когда иначе слишком велика вероятность, что слово прочтут неверно (лень придумывать пример, так бывает крайне редко). Почти всегда я его просто опускаю, в том числе в окончании -ться.

Букву ё я записываю:
  • как yo в случаях, когда она передаёт звуки [йо] (rota, podyom, yo moyo!);
  • как ö в случаях, когда она передаёт звук [о] и смягчает предшествующую согласную, которая без того звучала бы твёрдо (tvördo);
  • как o в случаях, когда она передаёт звук [o] и не изменяет звука предшествующей согласной (nu cho, ty skoro?).
 51 комментарий    7   2008   буква ё   транслит

SuperBiDiTranslit: The Acid Test

Вот это — полигон для тестирования SuperBiDiTranslit. Вроде бы я его сделал.

Known issues:
  • правило «Если в скобочном контексте передан символ, который не имеет там особого смысла, то он понимается as-is» пока что не поддерживается
  • не поддерживается передача с сохранением регистра символов ни в одну из сторон (енкодер этого не поддерживает by design, а декодер — временно)
  • не поддерживается передача всяких там Unicode’овских символов (by design)
Чекбокс «BiDi?» означает, что вы хотите закодировать вашу строку, потом декодировать и убедиться, что получилось то же самое. Если его снять, то вы сможете потестировать только декодинг. Это нужно, чтобы посмотреть, что получится, если подсунуть декодеру строку, которую енкодер не смог бы сгенерить в принципе.

Если при BiDi-тесте результат будет отличаться от исходной строки, то он будет подсвечен красным. Если при тесте декодера при разборе строки произойдёт ошибка, там появится надпись PARSE ERROR. В обоих случаях большая просьба сказать об этом мне.

Спасибо.

Update: Ну конечно, сразу нашёлся ублюдок, который решил это заспамить, блин.

Update 2: Устроил для этой штуки стресс-тест: прогнал через неё весь код e2 туда и обратно. Он не изменился. Потом закинул его в zip и снова прогнал туда-сюда. Снова всё в порядке. Прикрутил всё это к e2. Можно теперь тестировать прямо здесь, в поиске по сайту.
 3 комментария    3   2005   исследования   транслит   Эгея

SuperBidiTranslit

Друзья. Перестаньте лениться и посмотрите вот сюда. Расскажите мне, что там не так.

Мнения типа «это нахрен никому не нужно» меня интересуют мало. Пожалуйста, будьте конструктивны.

Спасибо.
 9 комментариев    3   2005   исследования   транслит   Эгея

Поиск в e2, проблемы транслитерации

Как вы знаете, в e2 поиск работает прямо из адресной строки. Когда вы пишете запрос, он постится в search_service, который его приводит к виду, принятому в адресной строке, и редиректит туда браузер.

При этом поддерживается русский язык — используются вот эти (или очень похожие на них) правила транслитерации. Неприятность тут в том, что эти правила не рассматривают ничего кроме цифр и букв. А ведь в поиске человек может написать всё, что угодно. В этих ситуациях e2 начинает чувствовать себя неважно.

Это нельзя назвать большой проблемой, но всё-таки неприятно. А хочется, чтобы было приятно. Поэтому я решил, что надо придумать такие правила транслитерации туда-сюда, чтобы всё работало безотказно. И вот что у меня получилось.

Буду очень благодарен всем, кто скажет что-нибудь полезное по этому поводу.
 4   2005   исследования   программирование   транслит   Эгея