Помогите разобраться

Если у вас нет блога, — представьте обратное. А то у меня тут есть несколько вопросов:

  1. Нужна ли блогу древовидная система кейвордов?

Аргумент «за»: когда по некоторому кейворду (например, «идиоты») накапливается очень много заметок, то поиск по нему перестаёт быть хоть сколько-нибудь эффективным — нужно разделить «идиотов» на подкатегории «комментатор Саша», «Ээльмаа», и т. д. Через несколько месяцев плоская система кейвордов абсолютно перестаёт работать.

Аргумент «против»: если кейворды становятся самостоятельными объектами, которые нужно создавать, выстраивать отношения между ними и т. д., то блогер просто не будет ими пользоваться — это становится слишком сложно. Если же сделать, что кейворды создаются автоматически при их «упоминании», то тогда, по мнению Смирнова, просто никто не будет утруждать себя созданием дерева, — кейворды, несмотря на возможности движка, так и останутся плоскими.

А вы что думаете?

  1. Кстати, в моём представлении, каждый кейворд должен быть уникальным, то есть не может быть «программирование/web» и «дизайн/web» одновременно. Кто считает иначе и почему?

Я считаю так, потому, что если бывает «программирование/web» и «дизайн/web», то, значит, web — самостоятельное явление, и, следовательно, он должен быть корневым кейвордом, а заметки должны маркироваться как «программирование; web» и «дизайн; web».

  1. Допустим, древовидная система кейвордов есть. Как сделать максимально удобным её использование?. Что должно быть в форме «написать новую заметку»?

Вариант. Рядом со строкой ввода «Keywords» отображается список всех уже существующих кейвордов (по алфавиту? в виде дерева?). Если кликнуть на кейворд, он добавляется в
строку ввода (в виде «php» или «программирование/web/php»?). Можно вручную дописать новые кейворды (если указано в виде «php», то кейворд создаётся в корне, а если в виде
«программирование/web/php», то где указано? а если такой кейворд уже есть в другой категории?).

Какие еще мысли по этому поводу у кого возникают — делитесь, интересно.

Кстати, какой (какие?) кейворд должен быть у этой заметки?

Подписаться на блог
Отправить
Дальше
24 комментария
Spectator 2004

«Кстати, какой (какие?) кейворд должен быть у этой заметки?» — Конечно же, «идиоты» :)

Foster 2004
  1. Это будет полезная фича.
  2. Согласен с тобой.
  3. Поскольку других админок блогов я не видел, то говорю за «регистер» Смирнова.
    При добавлении записи на странице есть выпадающее меню «кейворды». Нажимаем на какой-нибудь и во втором поле появляется выбор вторичного (вложенного) кейворда.
Илья Бирман

Про 3: нет, это в Региcтре коряво сделано, потому, что выпадающий список ведёт себя не так, как во всех остальных программах в мире, он не предназначен для вставки. У меня тут в минвайле просто список отображается в строчку и можно ткнуть на нужное слово — оно вставляется. Намного удобнее и красивее, по-моему.

artreal 2004

Фасетная классификация не поможет?

Илья Бирман

Что это?

Baka 2004
  1. Лучше множественные у каждой заметки
    (web, программирование, php, идиоты).
    (Если кто не знает, php можно использовать и без web.)
    И можно искать по сочетанию слов:
    (идиоты, php).
    Кстати, всё равно они нужны — чтобы заметку про баги Мозиллы
    («идиоты/мозилла» и «браузеры/мозилла/баги»)
    находить и среди «идиотов», и среди «мозилл».
  1. Если ключевые слова уникальные, то древовидность идёт лесом («pun intended») —
    имя (последнее) неявно содержит весь путь от корня дерева — тогда просто называем «программирование__web__php» в плоских КВ и где-то
    показываем название полностью, а где-то — только хвост.

«во всех остальных программах в мире,»

Вы видели ВСЕ программы в мире?
А MovableType?

Илья Бирман
  1. Множественность — это очевидно. Это не «лучше», это просто должно быть. Я спрашиваю про сами кейворды. Кстати, оттого, что php можно использовать отдельно от веб, он не становится самостоятельным кейвордом. Мы же не все понятия пытаемся категоризовать, а кейворды конкретного блога. Я, например, однозначно отношу php в программирование /web, потому, что я его не использую иначе.
  1. Судя по вашим примерам, вы не совсем понимаете, зачем нужна древовидность. Главный смысл, что чем более глубокий кейворд мы указываем, тем меньше заметок мы видим (то есть, тем более релевантен результат). То, что имя содержит неявно весь путь есть благо. Если бы это было не так, то было бы неясно что отображать по адресу someblog.ru /keywords /php. Такой адрес должен автоматически переводиться в /keywords /programming /web /php, должен вести к заметкам с кейвордом программирование /web /php.

Moveable Type я не смотрел, не интересно.

Spectator 2004

Кстати, фасетная классификация — действительно выход.

nickpo 2004

...И робкий вопрос с галёрки: а кто-нибудь отслеживал реальный процент пользующихся механизмом кейвордов? Что-то мне подсказывает, что структура — древовидная, плоская или любая другая — может быть реально востребована лишь в таком блоге, аудитория которого состоит из программеров. Обычному «гуманитарному» читателю такая фича принципиально недоступна: его мозги работают иначе — и штатного хорошо работающего поиска вполне достаточно...

artreal 2004

Увы, аська у меня отключена. Коварные происки прокси :(

РезиновыйЗапаЛ 2004

Можно Резиновый крякнет в кустах?

Nickpo вообще-то дело говорит. Мне, как просто пользователю, было бы интереснее не древо, а ассоциированность (связь). Например, залетаю я на заметку под ключами «веб/идиоты/Россия». А рядом мне пишут [Еще по смыслу — «программирование/идиоты/Россия»+ «базы данных/идиоты/Россия»+«интерфейс/идиоты/Россия»]. Почему? Патамучто веб, программинг, базы и интерфейс в общем-то компутерные технологии. Остальное и без разъяснений понятно.

Просьба на шорох по кустам сильно не стрелять. Берегите патроны на настоящих монстров.

nickpo 2004

Нет, ежели кому охота вместо обсуждения серьёзного вопроса в очередной раз выяснить, кто какой монстр, — я, конечно, не возражаю.

А по сути: дело не в конкретных словах-ключах, они могут быть любыми, их набор зависит от разнообразия интересов блоггера — кому-то «веб-базы-интерфейс», а кому-то «динозавры-птеродактили-йети». Дело в том, чтобы изобрести нечто интуитивно понятное СРЕДНЕМУ юзеру, не предрасположенному к вебострою и прочему программингу.

То, что предлагаете вы — это некий аналог древовидного форума. Очень ясно и понятно человеку с образованием МИРЭА, но темный лес и сплошное неудобство для гуманитария.

РезиновыйЗапаЛ 2004

Nickpo, Вы не монстр. Мечтать можете, но Вы не монстр.

Еще раз повторяю — Вы высказали здравую идею о востребованности древа кейвордов. Она правильна в том, что работают по нему немногие.

Далее. Мое предложение не может быть расценено как организация древа кейвордов. Это, вероятнее всего, вариант визуальной подачи связной информации в самой заметке и не более. А подача для гуманитариев вещь очень даже важная.

Ну а за разборками Резиновый запросто может к КрасноГлазыМ наведаться. Один клик — ЗапаЛ у Вас.

nickpo 2004

Абстрагируясь от твоего рискованного тона, замечу, что я пока не увидел главного — именно предложения. Каким образом будут определяться ассоциации? Теоретически под это дело годился бы этакий карманный Рамблер «Люди, искавшие блабла, ищут и вот это, это и это»... Но как его вычленить и в сайт засунуть?

РезиновыйЗапаЛ 2004

«Но как его вычленить и в сайт засунуть?» — я, типа, программист крутой? Все вопросы им, им все вопросы чего и как куда засунуть.

Резиновый робко крякнуть уже не может? Или он становиться похож на Спектатора — чего не скажи, все вызывает у окружающих всплеск эмоций.

«Абстрагируясь от твоего рискованного тона...» — ага, у меня с одного бока Энигма выстанывает, с другого Bob Marley накатывает War. Так что будем включать погромче? Nickpo, давайте не будем...

Zliy.Pes 2004

Угу, а ещё сделать процентное задание релевантности поста к кейвордам:
идиоты — 50%
россия -20%
веб — 30%

и на основании уровня релевантности (пользователь может менять) искать релевантные посты.

по-моему так: к посту относить несколько ключевых слов, а отдельно по ключевым словам строить дерево.

Zliy.Pes 2004

Илья, это не наезд, но по-моему несекурно:

http://ilyabirman.ru/etc/meanwhile/entries/040410.txt

Особенно с точки зрения емейл-грабберов, которых могут и специально натравить.

Илья Бирман

Ага, спасибо. А как вы это обнаружили?

said 2004

Человек, когда ищет, вряд ли пользуется неким «древовидным» представлением. Я, например, везде ввожу «пхп вэб» и это, как правило, работает. Резюме: не важно, как это организовано внутри сайта. Важно, чтобы человек, введя «пхп вэб» получил то, что ожидает, то есть пересечение списка статей, ссылающихся на «пхп» и списка статей, ссылающихся на «вэб». Вообще, я проблемы не вижу. Ну, нарисуете Вы этой заметке кивёрды «пхп, идиоты, комментарий». Честно-честно, найдутся те, кто нужное найдет. Ну, а кто не найдет... Вы, Илья, в самом деле хотели облЕгчить жизнь ВСЕМУ человечеству?

said 2004

И я не согласен, что допустим ПУТЬ. Я не знаю заранее, как Вы представляете причинно-следственнуб связь: ПХП-идиоты либо идиоты-ПХП. Я, скорее всего, сам разберусь. Поэтому, ПУТЬ благо НЕ ЕСТЬ.

Илья Бирман

Не «php /идиоты» и не «идиоты /php», а «php; идиоты».

Путь нужен в случаях, когда есть объективная причинно-следственная связь, например «программирование /php», «идиоты /Ээльмаа»

said 2004

Повторюсь. Даже Я, признанный НЕГУМАНИТАРИЙ, настолько привык к тому, что все под гуманитариев подстраиваются, что мне САМЫМ ЕСТЕСТВЕННЫМ будет на дерево, а произвольный набор кивёрдов, которые пусть и определяют дерево, но мне отдадутся СПИСКОМ. В качестве релевантности можно юзать близость (вплоть до нулевой) включений соответствующих кивёрдов в дереве. При более, чем двух кивердов можно юзать многочисленные алгоритмы, коеи столь широко распостранены, что не составляет труда к ним обратиться... Вот.

Илья Бирман

Во всей вашей теории про гуманитариев я, честно говоря, смысла так и не увидел. Для того, чтобы что-то искать по кейвордам, вам не придётся знать как конкретно они расположены в дереве.

zahhar 2004

Рискну навлечь на себя гнев богов, но кейворды в блоге читателям не нужны нафик. Владельцу блога они ещё как-то могут помочь, а для посетителя важен грамотный поиск. Потому владелец блога может организовывать свои кейворды как его душе угодно — линейно, древовидно, фасетно. А для пользователя должна быть только достаточно интеллектуальная форма поиска (тексовое поле + кнопка, никаких языков запросов или расширенных поисков).

А вот если говорить о т. н. «knowledge base» системах, то там применение ключевых слов существенно расширяется и там они более уместны.

ё 2004

«кейворды в блоге читателям не нужны нафик».

что за хня? как блогочитатель, робко лепечу: нужна.
ибо пользую их кейворды и нахожу удобными.

nickpo 2004

Децкий сад... Вы ещё пятками подеритесь.
Речь не о том, используются ли кейворды вообще — ясно, что используются. А о том, кто их использует, много ли вас таких и достаточно ли ваша группировка значима, чтобы думать над отдельным «ку» для вас.

kukutz 2004

Смотрел, как в НПЖ сделано?

Astur 2004
  1. Кейворды без нормального (поле ввода и кнопка) поиска — это хило.
  2. «Обычный юзер» воспринимает кейворды как «предметный указатель» привычный юзеру из книжек. Следовательно, деревья — нафиг, а при поиске по кейвордам предлагать, как вариант, «близкие по смыслу» (например «идиоты» ~= «дураки; отморозки ...»).
    (Пункт 2 проверен на нескольких десятках подопытных юзеров)

PS: А ты не пробовал меньше писать про идиотов ;-)

Мои книги