Про псевдо-ЧПУ

В западном интернете постепенно тоже начинают понимать, что пользоватям не интересен .aspx и прочий?мусор=в&урлах, и переходить на более короткие и чистые урлы. Однако уже в нескольких местах я заметил кретинистические псевдочеловекопонятные урлы, которые нужно истребить. ПЧПУ — это урлы, в которые наряду с бессмысленной технической шелухой запихивается ещё и человеческая часть. Например, такие урлы сейчас делают на Дискогсе:

Кроме того, что в урле по-прежнему содержится шелуха (1193791), даже человеческая его часть — это обман:

По этому адресу оскорбительно (по отношению к Битлам) лежат «Руки вверх». А если часть, начинающуюся со слова release, стереть, то получим 404. Зачем вводить людей в заблуждение, имитируя нормальные урлы, когда система всё равно кривая и калечная?

Человекопонятный урл — это не просто такой урл, в котором понятно, что написано; должен быть понятен принцип, система формирования урлов, чтобы я мог написать адрес и попасть на нужную страницу, как я это с лёгкостью делаю на Википедии. Если слабо сделать как на Википедии (когда и урлы человеческие, и возможные наложения разрешаются дисамбигуационными страницами), то лучше не заниматься ерундой, а сделать урл хотя бы коротким и оставить просто /1193791.

Дальше
33 комментария
Роман 2009

На ласт.фм восхитительные урлы.

Скар 2009

Дисамбигуационные страницы? Совершенно излишнее слово!

Михаил 2009

Не понимаю, кому какое дело до вида урлов. Их же в адресной строке не набирают, и в ссылках чаще всего не видят.

Алексей 2009

Кстати, убило в «руках вверх» — стиль «аэро хаус» и «электроника»)

Ярослав 2009

«Дисамбигуационная страница» — это, как я понимаю, официальный термин русскоязычной Википедии?

В Википедии всё было бы совсем замечательно, если бы в урле не надо было писать wiki.

Константин Тумалевич 2009

Такие урлы еще применяют для дополнительного употребления ключевого слова, поисковики это любят.

Kalan 2009

Ярослав, «disambiguation page» — термин английской Википедии. В русской в шаблонах говорят «страница разрешения неоднозначностей» или просто «неоднозначность», а на внутреннем жаргоне — «дисамбиг».

Вообще глоссарий Википедии — интересная штука, почитайте.

Kalan 2009

Кстати, конфигурация MediaWiki без /wiki/ в адресах возможна, но пока не решаются убирать, потому что слишком много сразу сломается в таком случае.

И ещё — мне не нравится, как e2 коверкает поисковые запросы. http://ilyabirman.ru/meanwhile/search/chto+!nibud'+ishhu+!zd!es'/ — ну вот как это, например, добавить в браузер для быстрого поиска? %%...search?q=chto+нибудь+ищу+zdесь%% в этом плане куда удобнее и практичнее, и пофиг, что старые браузеры покажут вереницу процентов. Правда, без UTF-8 могут быть трудности.

Игорь 2009

Не обманывайтесь. Эти ПЧПУ придумывают не для людей, а для поисковых систем, ибо совпадения по тексту URL сильно ими ценятся.

Pure_BY 2009

@ Kalan (#8)

+1. Это как продолжать делать убогую графику в новых версиях какой-то игрушки, «чтобы она на старых компьютерах тоже работала». Но мне кажется, сделано это не с задумкой, а как workaround того, что e2, скорее всего, такую фичу не саппортает. Не даром же все спец-символы в комментариях тоже пропадают.

Но Илья над этим, по-моему, работает.

gihar 2009

Для 99% пользователей все равно что в урле, как пользователь говорю.
и только 1% интересно, что там. Остальные просто жмут на ссылки.

Николай Товеровский 2009

gihar, как вы это определили?

Megakazbek 2009

Kalan, а что такого сломается, если в википедии разрешить не писать wiki/?

Kalan 2009

Megakazbek, Википедия же существует не сама по себе, вокруг неё обрастает куча скриптов и ботов разной степени удалённости. /wiki/ можно уже назвать давней традицией, на которую все привыкли рассчитывать (хотя и есть методы работать более универсально).

Сейчас это работает так: если человек забудет написать /wiki/, ему покажут 404 и через 5 секунд редиректнут. Боты пусть разбираются сами.

Денис 2009

дисамбигуационными страницами

Что-что? Илья, будьте добры, поясните для ваших непросвещенных читателей сей термин.

Виктор 2009

По определению Дмитрия Смирнова

ЧПУ — это УРЛ, в котором нет непонятных для пользователя элементов. То есть ЧПУ — это не какая-то «добавочная понятность», которую все стараются внести в УРЛ, а всего-навсего отсутствие лишнего мусора.

http://nudnik.ru/entry/3098

:)

Vadim 2009

Вот уже два человека в комментариях написали, что до адресной строки никому нет дела. Мне лично довелось четыре часа убеждать одного сайтостроителя, что читаемость url’a имеет значение. А может это не они мыслят, как гастарбайтеры из анекдота, а мы неправы?

Виктор 2009

Vadim, есть несколько принципов пострения URI. Первый — иерархический. Как на этом сайте.

Третий — всякая ерунда в стиле «PHP» когда видны «viewforum.php?id=...».

И второй — RESTful-стиль.
В нём, например, в URI кодируется controller/action/id

Так получается вид поста будет blog/show/125 (для заметки номер 125).
ЧПУ? Я скажу — да. Илья скажет «нет», как я думаю. Поскольку, если мы сотрём 125 — по попадём на «404 Not Found».

Т. о. для Ильи Бирмана ЧПУ-адрес — это адрес иерархического вида (как я думаю).
Для Дмитрия Смирнова — адрес «без фигни».
Для поисковиков важно, чтобы в URI встречалось ключевое слово запроса.

Сложный вопрос :)

Vadim 2009

Угу. Вот только лично я склонен думать, что адресная строка в браузере существует не для «чего-то там вообще», и даже не для поисковика, а для пользователя. Иначе — давайте удалять её нахрен, как архаический пережиток.

homm 2009

#8 Kalan 2 мая 2009, 00:40

ну вот как это, например, добавить в браузер для быстрого поиска?

Правой кнопкой, Create search...

Роман Добровенский 2009

Насчет «disambiguation page» — предлагаю термин «уточняющая страница». Слова «дисамбигуация» я как-то не знаю.

Артём Курапов 2009

Помоему тут просто техническая проблема. Я сам до полноценного ЧПУ при развитии движка достаточно долго шёл, именно потому что раньше был стиль controller/action

Андрей Шинкаренко 2009

Этот текст в урлах можно рассматривать как комментарии — посмотрел на урл и стало понятно, что в нем. Комментарий не заменяет сам урл и не пытается стать ЧПУ (который требует другой логики), просто приятное дополнение к старым не-ЧПУ, и не может быть злом :)

Ярослав 2009

Kalan, что мешает разработчикам Википедии установить мгновенный редирект с / на wiki/?

Kalan 2009

Ярослав, #24:
Мгновенный в смысле «301 Moved Permanently»? То, что люди тогда на это начнут рассчитывать, а рассчитывать на это нельзя (в webroot’е есть ещё куча интересных вещей — скрипты, всякая мелкая графика и прочее). Ошибки (коей является упущение части урла) надо не поощрять, а стараться исправлять.

Artemy Tregubenko 2009

Фраза «чтобы я мог написать адрес и попасть на нужную страницу, как я это с лёгкостью делаю на Википедии» запала мне в голову : ) На самом деле даже в нынешнем виде ЧПУ для этой цели плох, можно сделать лучше: http://blog.arty.name/2009/sinergiya-chpu-i-poiska/

Илья Бирман 2009

Да, здорово.

Чистович 2009

Господа в комментариях имеют склонность забывать, что ЧПУ — эт о «человекопонятные», и поэтому ссылаться на проблемы поисковой оптимизации совершенно неуместно.

Также выскажу своё мнение, что разница между en.wikipedia.org/wiki/Something и vasya.blog.ru/posts/Something состоит в том, что первый урл можно угадать, а второй нет. То есть во втором случае куда как менее важно, стоит в урле текст или число. Хотя остаётся ещё ситуация, когда человек наводит мышку на ссылку и смотрит, куда она ведёт...

P.S. Я не отмечался в эпическом посте про читателей, но я читаю. Через Google Reader.

tenshi 2009

только ленивый не писал о псево-чпу ;-)
http://smileg.akmedia.ru/?article:uuu.hell — урл набрал по памяти B-)
ещё есть непонимание различия чпу и псевдостатики. многие думают, что если вместо /article/?id=123 напишут /article/123/ то тут же обретут чпу...
по этому урлу всё-равно не понятно, о чём статья, читал ли ты её раньше и стоит ли переходить по ссылке. а это очень важно, когда автор поста вставляет ссылку на случайное слово в своём предложении, не приводя при этом название самой статьи.

Кирилл Мошков 2009

Есть и такое мнение: человекопонятность адреса не означает обязательного удобства его употребления.
Как вам такой адрес, вполне понятный (и рабочий):

http://www.cityjazz.ru/catalog/products/cd/rossijskie-dzhazovye-muzykanty/miroshnichenko-roman-temptation-cd

tenshi 2009

я его пол минуты только пытался прочитать... какая уж тут человекопонятность?

Артур Гнусмусов 2009

Господа, with all due respect, хочу заметить: погрузившись в дебри рассуждений о читабельности урлов, вы совершенно забыли, что урл как слово суть ссылка на нужную человеку информацию, и это слово вполне конкретного языка со вполне конкретными алфавитом и грамматикой. Попытка «обчеловечить» урл есть попытка фиксации в этом языке подмножества слов, близкого (в смысле вполне конкретного математически описабельного расстояния) к естественному языку рядовых юзеров. В идеальном для рядового юзера случае адресом должно служить слово естественного языка. И это уже реализовано — «адрес» вводится в строке поисковика, а роль дисамбига успешно выполняет страница результатов его работы. Осталось дождаться более «живого» интернета, в котором все линки будут такими ссылками записываться... а пока мы этого ждем, предлагаю реализовать обчеловечиватель урлов (не являющийся поисковиком) или воспользоваться им, если такой уже существует... :)

Артур Гнусмусов 2009

Ещё: знаю людей, для которых «http://» — это непонятная «шелуха», также знаю людей, которые ни разу не сидели за компом и не знают о существовании интернета... так что рассуждения о степени допустимой человечности урла, как обычно, относительны (относительно оснащенности сознания наблюдателя, который их наблюдает-интерпретирует, инструментами для их распознавания).

Илья Бирман 2009

Рассуждение об удобстве расположения клемм аккумулятора автомобиля точно так же можно «уничтожить», рассказав о людях, которые никогда не открывали капот, или вовсе не видели автомобиль. Это всё совершенно неинтересно. Очевидно, что любой инструмент должен быть удобен и понятен для того, кто им так или иначе пользуется, а не вообще для кого угодно.

Артур Гнусмусов 2009

#32 Илье: разумеется, я просто обращаю ваше внимание на то, что нужно указывать, для кого вы делаете урлы более понятными — специалистам в области ИТ, наверное, и так не составит труда понять и использовать для своей пользы даже?мусор=в&урлах. Если от него «избавляться», то это просто задача некоторой оптимизации записи урла с учетом существующих ограничений на синтаксис и т. п.

Мои книги