Doomed to Wordpress

Serious Reflections During the Life of Jeremy Fisher

   

Subscribe
Subscribe to a syndicated feed of my weblog, brought to you by the wonders of RSS.

Flavours
There's more than one way to view this weblog; try these flavours on for size.

  • index
  • circa 1993
  • RSS
  • Links
    These are a few links to my other sites.

  • Ставропигиальныя Пластинки
  • Анкылым
  • Русское Шрифтовое Зало
  • Gopher (Proxied)
  • More about Gopher
  •        

    2015/10/10 robots

    Я и раньше много размышлял о бесполезности файла robots.txt. Что злоумышленника он всё равно не остановит (и даже даст подсказку, куда лезть), а порядочного человека лишит возможности найти поисковиком документы, которые тем не менее вполне доступны публично (иначе зачем было бы возиться с robots.txt). Кроме того, убогий общепринятый синтаксис этого файла и не позволяет скрыть нужное с приемлемой гибкостью — из-за чего придуманы расширения, которые понимает тот или иной конкретный поисковик. В итоге мы вообще не застрахованы от индексирования более-менее сложных адресов всеми остальными.

    Сегодня искал в инете последнюю версию шрифта Old Standard. Он есть в Дебиане, я как-то не особо им пользовался, предпочитая самодельные аналоги, но потом обнаружил, что шрифт сделан с толком, содержит многое из того, чего в самодельных шрифтах не хватало, прочитал документацию и убедился, что создатель шрифта Алексей Крюков ориентировался на правильные образцы, работал со знанием дела и вообще шрифт как будто для меня и сделан. Меня только смущало не очень ровное расположение символа COMBINING TILDE над буквой œ (что в моём стихе "Французы" должно было означать назализацию ё). Решил узнать, есть ли более новая версия, в которой это могло быть исправлено. Везде указан официальный сайт шрифта — http://www.thessalonica.org.ru. Но там только рекламная страница хостинг-провайдера. На каком-то форуме прочитал, что уже несколько лет назад страница не работала (почему тогда домен до сих пор существует? кто за него платит? и Гугл, кстати, подмены не замечает и сайт находит). Ладно, иду на archive.org, а там — видите ли, этот сайт не сохранился у нас, так как robots.txt это запрещает. Смотрю, и в кэше Гугла и Яху ничего нет, по той же причине. Смотрю robots.txt, а там и правда:

    Host: thessalonica.org.ru
    User-Agent: *
    Disallow: /
    

    Конечно, может быть, это хостер после удаления сайта поставил эту гадость, чтобы удалить контент из поисковиков. Но жаль, что такая возможность вообще существует.

    permanent link