Движки и их признаки

Есть куча движков блогов, форумов, вики-сайтов, гостевых книг, интернет-магазинов, а ещё есть много разных ЦМСок. Все они имеют свои признаки, которые можно с тем или иным успехом вытащить из генерируемого ими ХТМЛ-кода (или откуда-нибудь ещё).

Вот элемент head у меня на блоге:

<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />
<meta name="robots" content="index, follow" />
<base href="http://ilyabirman.ru/meanwhile/" />
<title>Блог Ильи Бирмана: Микс из &laquo;Гаража&raquo;
  от 12&nbsp;сентября</title>
<link rel="stylesheet" type="text/css" href="system/design/wiki.css" />
<link rel="stylesheet" type="text/css" href="system/design/main.css" />
<link rel="alternate" type="application/rss+xml" title="Блог Ильи Бирмана"
  href="http://ilyabirman.ru/meanwhile/rss/" />
<link rel="alternate" type="application/rss+xml" title="Комментарии"
  href="http://ilyabirman.ru/meanwhile/comments/rss/" />
<link rel="search" href="http://ilyabirman.ru/meanwhile/search/" />
<link rel="next" href="http://ilyabirman.ru/meanwhile/~2/" id="link-next" />
<script type="text/javascript" src="system/ctrl-navigation.js"></script>
</head>

Глядя на это, робот уже может вычислить, что тут стоит e2: он подключает ЦССки с хрефом вида system/design/(что-то там).css; подключает два РССа с адресом сайта плюс /rss/ и /comments/rss/; имеет навигационные ссылки на search, next.

Ещё на страницах, сгенерированных e2, как правило встречается подстрока:

<span title="e2 (версия)">Движок&nbsp;&mdash;
<a href="(ссылка на сайт)">e2 (название релиза)</a>
</span>

Кроме того, e2 шлёт ХТТП-хедер X-Powered-By: e2 (версия).

Прошу тех, кто знаком с какими-нибудь другими продуктами, написать мне, как их можно признать механическим способом. Нужно как можно больше продуктов. Спасибо.

Подписаться на блог
Отправить
Дальше
17 комментариев
homm 2008

NetCat можно опознать по именам файлов, хранимых в системе, типичное имя файла в файловой системе выглядит так:
/netcat_files/403/120/h_84442867d4596cc71a2167410ffe5090
Но шанс, что фалы будут на кадойс странице мал, нужно анализировать внутренние страницы, например каталоги прдуктов с картинками.
Еще можно опознать по формам добавления, они ведут на адрес /netcat/add.php

BOLK 2008

WordPress: наличие входа /wp-login.php
Drupal: Существование любого файла из дефолтного оформления, например: /admin/themes/_default/img/icons/icon_key.gif

BOLK 2008

cubiQue (фирма Laconix): наличие на странице /admin/login.php строки: <meta name=«home_url» content=«http://www.laconix.net/cubiQue»>

nex 2008

HostCMS: шлет заголовок X-Powered-By: HostCMS
Joomla очень часто оставляет <meta name=«generator» content=«Joomla! 1.5 — Open Source Content Management» />
многие движки можно опознать, если зайти example.com/admin/

BOLK 2008

Регистр: при заходе на /add.php видим: You have no rights to access this page. Sho! Sho! Go away!

BOLK 2008

Битрикс, вероятно, можно узнать по:
— выставлению заголовка «P3P: policyref=»/bitrix/p3p.xml», CP=«NON DSP COR CUR ADM DEV PSA PSD OUR UNR BUS UNI COM NAV INT DEM STA«»
— заголовку вида «X-Powered-CMS: Bitrix Site Manager (DEMO)»

BOLK 2008

Timelabs CMS выдаёт X-Powered-By: TimeLabs CMS v.1.294

фирма не существует, но на этой CMS ещё делают сайты

BOLK 2008

Если сайт выдаёт 403 на lib/mession.inc, но на lib/mession-404.inc выдаёт 404, то это старый framework «Казанского Портала» (на нём работают несколько крупных сайтов Казани).

extremus 2008

X-Powered-By: XS2 v1.35.0.080814-1923
Движок называется XS2 (http://solutecs.com).

Kalan 2008

MediaWiki :)
Более новые версии надёжно опознаются через <meta name=«generator» content=«MediaWiki 1.*» />.
Более старые можно признавать по наличию где-нибудь (в <head>) скрипта .../common/wikibits.js и картинки .../common/images/poweredby_mediawiki_88x31.png (где-нибудь ближе к концу).

Николай Товеровский 2008

Я пользуюсь DokuWiki. В генерируемом коде есть <meta name=«generator» content=«DokuWiki Release 2008-05-05» />.

Devgru 2008

Вордпресс тоже выставляет Generator.

Ilya 2008

Wordpress на странице добавляет элемент, к примеру, <meta name=«generator» content=«WordPress 2.6.1» />, а в ссылках со страницы обычно присутствуют файлы с путями /wp-content/ и /wp-includes/

Nucleus CMS в заголовке пишет Generator Nucleus CMS v3.24

Oleg Andreev 2008

«Кроме того»

шутку оценил =)

Ягер Атари 2008

DJEM, если создатель специальным образом не изменял маску создаваемых файлов, создает урлы вида /xxx/yyy/document666.phtml, где 666 — id документа. Плюс серверная точка входа системы в девяносто пяти процентах случаев присутствует и приветствует по адресу /cgi-bin/djem/djemserver.

Artem Krotkov 2008

Я думаю, что опиратся на метатег «generator» — не стоит. Даже в том же WordPress’е я могу туда написать, что угодно.

Сложнее всего менять структуру папок. Вы же и писали, что отследить можно по пути подключаемых файлов. Думаю это самый универсальный вариант — изучать структуру файлов и смотреть на файлы шаблона и стилей...

Слава 2008

Invision Power Board: ссылки вида lofiversion/someting.php.

Мои книги