Про псевдо-ЧПУ

В западном интернете постепенно тоже начинают понимать, что пользоватям не интересен .aspx и прочий?мусор=в&урлах, и переходить на более короткие и чистые урлы. Однако уже в нескольких местах я заметил кретинистические псевдочеловекопонятные урлы, которые нужно истребить. ПЧПУ — это урлы, в которые наряду с бессмысленной технической шелухой запихивается ещё и человеческая часть. Например, такие урлы сейчас делают на Дискогсе:

Кроме того, что в урле по-прежнему содержится шелуха (1193791), даже человеческая его часть — это обман:

По этому адресу оскорбительно (по отношению к Битлам) лежат «Руки вверх». А если часть, начинающуюся со слова release, стереть, то получим 404. Зачем вводить людей в заблуждение, имитируя нормальные урлы, когда система всё равно кривая и калечная?

Человекопонятный урл — это не просто такой урл, в котором понятно, что написано; должен быть понятен принцип, система формирования урлов, чтобы я мог написать адрес и попасть на нужную страницу, как я это с лёгкостью делаю на Википедии. Если слабо сделать как на Википедии (когда и урлы человеческие, и возможные наложения разрешаются дисамбигуационными страницами), то лучше не заниматься ерундой, а сделать урл хотя бы коротким и оставить просто /1193791.

Подписаться на блог
Отправить
Дальше
33 комментария
Роман 2009

На ласт.фм восхитительные урлы.

Скар 2009

Дисамбигуационные страницы? Совершенно излишнее слово!

Михаил 2009

Не понимаю, кому какое дело до вида урлов. Их же в адресной строке не набирают, и в ссылках чаще всего не видят.

Алексей 2009

Кстати, убило в «руках вверх» — стиль «аэро хаус» и «электроника»)

Ярослав 2009

«Дисамбигуационная страница» — это, как я понимаю, официальный термин русскоязычной Википедии?

В Википедии всё было бы совсем замечательно, если бы в урле не надо было писать wiki.

Константин Тумалевич 2009

Такие урлы еще применяют для дополнительного употребления ключевого слова, поисковики это любят.

Kalan 2009

Ярослав, «disambiguation page» — термин английской Википедии. В русской в шаблонах говорят «страница разрешения неоднозначностей» или просто «неоднозначность», а на внутреннем жаргоне — «дисамбиг».

Вообще глоссарий Википедии — интересная штука, почитайте.

Kalan 2009

Кстати, конфигурация MediaWiki без /wiki/ в адресах возможна, но пока не решаются убирать, потому что слишком много сразу сломается в таком случае.

И ещё — мне не нравится, как e2 коверкает поисковые запросы. http://ilyabirman.ru/meanwhile/search/chto+!nibud'+ishhu+!zd!es'/ — ну вот как это, например, добавить в браузер для быстрого поиска? %%...search?q=chto+нибудь+ищу+zdесь%% в этом плане куда удобнее и практичнее, и пофиг, что старые браузеры покажут вереницу процентов. Правда, без UTF-8 могут быть трудности.

Игорь 2009

Не обманывайтесь. Эти ПЧПУ придумывают не для людей, а для поисковых систем, ибо совпадения по тексту URL сильно ими ценятся.

Pure_BY 2009

@ Kalan (#8)

+1. Это как продолжать делать убогую графику в новых версиях какой-то игрушки, «чтобы она на старых компьютерах тоже работала». Но мне кажется, сделано это не с задумкой, а как workaround того, что e2, скорее всего, такую фичу не саппортает. Не даром же все спец-символы в комментариях тоже пропадают.

Но Илья над этим, по-моему, работает.

gihar 2009

Для 99% пользователей все равно что в урле, как пользователь говорю.
и только 1% интересно, что там. Остальные просто жмут на ссылки.

Николай Товеровский 2009

gihar, как вы это определили?

Megakazbek 2009

Kalan, а что такого сломается, если в википедии разрешить не писать wiki/?

Kalan 2009

Megakazbek, Википедия же существует не сама по себе, вокруг неё обрастает куча скриптов и ботов разной степени удалённости. /wiki/ можно уже назвать давней традицией, на которую все привыкли рассчитывать (хотя и есть методы работать более универсально).

Сейчас это работает так: если человек забудет написать /wiki/, ему покажут 404 и через 5 секунд редиректнут. Боты пусть разбираются сами.

Денис 2009

дисамбигуационными страницами

Что-что? Илья, будьте добры, поясните для ваших непросвещенных читателей сей термин.

Виктор 2009

По определению Дмитрия Смирнова

ЧПУ — это УРЛ, в котором нет непонятных для пользователя элементов. То есть ЧПУ — это не какая-то «добавочная понятность», которую все стараются внести в УРЛ, а всего-навсего отсутствие лишнего мусора.

http://nudnik.ru/entry/3098

:)

Vadim 2009

Вот уже два человека в комментариях написали, что до адресной строки никому нет дела. Мне лично довелось четыре часа убеждать одного сайтостроителя, что читаемость url’a имеет значение. А может это не они мыслят, как гастарбайтеры из анекдота, а мы неправы?

Виктор 2009

Vadim, есть несколько принципов пострения URI. Первый — иерархический. Как на этом сайте.

Третий — всякая ерунда в стиле «PHP» когда видны «viewforum.php?id=...».

И второй — RESTful-стиль.
В нём, например, в URI кодируется controller/action/id

Так получается вид поста будет blog/show/125 (для заметки номер 125).
ЧПУ? Я скажу — да. Илья скажет «нет», как я думаю. Поскольку, если мы сотрём 125 — по попадём на «404 Not Found».

Т. о. для Ильи Бирмана ЧПУ-адрес — это адрес иерархического вида (как я думаю).
Для Дмитрия Смирнова — адрес «без фигни».
Для поисковиков важно, чтобы в URI встречалось ключевое слово запроса.

Сложный вопрос :)

Vadim 2009

Угу. Вот только лично я склонен думать, что адресная строка в браузере существует не для «чего-то там вообще», и даже не для поисковика, а для пользователя. Иначе — давайте удалять её нахрен, как архаический пережиток.

homm 2009

#8 Kalan 2 мая 2009, 00:40

ну вот как это, например, добавить в браузер для быстрого поиска?

Правой кнопкой, Create search...

Роман Добровенский 2009

Насчет «disambiguation page» — предлагаю термин «уточняющая страница». Слова «дисамбигуация» я как-то не знаю.

Артём Курапов 2009

Помоему тут просто техническая проблема. Я сам до полноценного ЧПУ при развитии движка достаточно долго шёл, именно потому что раньше был стиль controller/action

Андрей Шинкаренко 2009

Этот текст в урлах можно рассматривать как комментарии — посмотрел на урл и стало понятно, что в нем. Комментарий не заменяет сам урл и не пытается стать ЧПУ (который требует другой логики), просто приятное дополнение к старым не-ЧПУ, и не может быть злом :)

Ярослав 2009

Kalan, что мешает разработчикам Википедии установить мгновенный редирект с / на wiki/?

Kalan 2009

Ярослав, #24:
Мгновенный в смысле «301 Moved Permanently»? То, что люди тогда на это начнут рассчитывать, а рассчитывать на это нельзя (в webroot’е есть ещё куча интересных вещей — скрипты, всякая мелкая графика и прочее). Ошибки (коей является упущение части урла) надо не поощрять, а стараться исправлять.

Artemy Tregubenko 2009

Фраза «чтобы я мог написать адрес и попасть на нужную страницу, как я это с лёгкостью делаю на Википедии» запала мне в голову : ) На самом деле даже в нынешнем виде ЧПУ для этой цели плох, можно сделать лучше: http://blog.arty.name/2009/sinergiya-chpu-i-poiska/

Илья Бирман 2009

Да, здорово.

Чистович 2009

Господа в комментариях имеют склонность забывать, что ЧПУ — эт о «человекопонятные», и поэтому ссылаться на проблемы поисковой оптимизации совершенно неуместно.

Также выскажу своё мнение, что разница между en.wikipedia.org/wiki/Something и vasya.blog.ru/posts/Something состоит в том, что первый урл можно угадать, а второй нет. То есть во втором случае куда как менее важно, стоит в урле текст или число. Хотя остаётся ещё ситуация, когда человек наводит мышку на ссылку и смотрит, куда она ведёт...

P.S. Я не отмечался в эпическом посте про читателей, но я читаю. Через Google Reader.

tenshi 2009

только ленивый не писал о псево-чпу ;-)
http://smileg.akmedia.ru/?article:uuu.hell — урл набрал по памяти B-)
ещё есть непонимание различия чпу и псевдостатики. многие думают, что если вместо /article/?id=123 напишут /article/123/ то тут же обретут чпу...
по этому урлу всё-равно не понятно, о чём статья, читал ли ты её раньше и стоит ли переходить по ссылке. а это очень важно, когда автор поста вставляет ссылку на случайное слово в своём предложении, не приводя при этом название самой статьи.

Кирилл Мошков 2009

Есть и такое мнение: человекопонятность адреса не означает обязательного удобства его употребления.
Как вам такой адрес, вполне понятный (и рабочий):

http://www.cityjazz.ru/catalog/products/cd/rossijskie-dzhazovye-muzykanty/miroshnichenko-roman-temptation-cd

tenshi 2009

я его пол минуты только пытался прочитать... какая уж тут человекопонятность?

Артур Гнусмусов 2009

Господа, with all due respect, хочу заметить: погрузившись в дебри рассуждений о читабельности урлов, вы совершенно забыли, что урл как слово суть ссылка на нужную человеку информацию, и это слово вполне конкретного языка со вполне конкретными алфавитом и грамматикой. Попытка «обчеловечить» урл есть попытка фиксации в этом языке подмножества слов, близкого (в смысле вполне конкретного математически описабельного расстояния) к естественному языку рядовых юзеров. В идеальном для рядового юзера случае адресом должно служить слово естественного языка. И это уже реализовано — «адрес» вводится в строке поисковика, а роль дисамбига успешно выполняет страница результатов его работы. Осталось дождаться более «живого» интернета, в котором все линки будут такими ссылками записываться... а пока мы этого ждем, предлагаю реализовать обчеловечиватель урлов (не являющийся поисковиком) или воспользоваться им, если такой уже существует... :)

Артур Гнусмусов 2009

Ещё: знаю людей, для которых «http://» — это непонятная «шелуха», также знаю людей, которые ни разу не сидели за компом и не знают о существовании интернета... так что рассуждения о степени допустимой человечности урла, как обычно, относительны (относительно оснащенности сознания наблюдателя, который их наблюдает-интерпретирует, инструментами для их распознавания).

Илья Бирман 2009

Рассуждение об удобстве расположения клемм аккумулятора автомобиля точно так же можно «уничтожить», рассказав о людях, которые никогда не открывали капот, или вовсе не видели автомобиль. Это всё совершенно неинтересно. Очевидно, что любой инструмент должен быть удобен и понятен для того, кто им так или иначе пользуется, а не вообще для кого угодно.

Артур Гнусмусов 2009

#32 Илье: разумеется, я просто обращаю ваше внимание на то, что нужно указывать, для кого вы делаете урлы более понятными — специалистам в области ИТ, наверное, и так не составит труда понять и использовать для своей пользы даже?мусор=в&урлах. Если от него «избавляться», то это просто задача некоторой оптимизации записи урла с учетом существующих ограничений на синтаксис и т. п.

Мои книги