:: urbansheep (urbansheep) wrote,
:: urbansheep
urbansheep

  • Music:

Что можно сделать с помощью поисковика: решаемые Гугл-Десктопом задачи

Довольно очевидно, что через Гугл-десктоп можно много чего искать, но пока не попробуешь, точно не узнаешь. А значит — пробуем.

Сохранение истории просмотра страниц с помощью Firefox+Slogger

Индексирование нужных веб-страниц и создание копий в офлайне через Firefox гораздо удобнее всего, что может предложить IE. kukutz, познакомившись со Slogger, тоже говорит, что это полностью удовлетворяющее задаче „personal web proxy“ решение. Что это такое и как работает?

Slogger — штепсель, устанавливаемый в файрфокс, и позволяющий сохранять веб-страницы как в автоматическом, так и в ручном режиме. При этом ведётся лог в любой удобной форме — вплоть до того, что можно писать его в XML или HTML-формате, получая на выходе историю просмотра и сохранения страниц.

Раньше это было удобно лишь для того, чтобы сохранять в офлайне какие-то документы, которые не доверяешь фурлу, теперь же с гугл-десктопом это всё превращается в увлекательный процесс „скопируй всё лучшее из интернета к себе“ (до тех пор, конечно, пока гугл-индекс не превратится в чудовище, отжирающее у системы десятки сотен мегабайт).

Для Slogger уже есть Slogger Examples — несколько крайне полезных примеров того, как можно сохранить в виде лога контекст просмотра (то есть страницы, которые были просмотрены в то или иное время) и восстанавливать их, используя поиск локального гугла.

Чем это лучше IE? Больше возможностей контролировать процесс. Возможность сохранить нужные файлы целиком вручную. Так как это не стандартная история просмотра браузера, то сохранённые копии не будут удалены через несколько дней, а останутся, пока не надоест.

Гугл и Миранда

Гугл-десктоп индексирует только AOL AIM-транскрипты, что меня совершенно не интересует. С другой стороны, есть такая вещь, как Message Export:

Этот самый экспортёр автоматически сбрасывает все входящие сообщения в текстовый файл, отдельный на каждого пользователя. Соответственно, гугл-десктоп индексирует эти текстовые файлы, и мы получаем то, что и хотели — поиск по истории переписки, и не по одному, а по всем пользователям. Здесь начинает становиться весело, и мы думаем дальше.

upd: Оказалось, что в txt-файлах кириллица не индексируется. Так что идея вложить в индекс хистори миранды на какое-то время откладывается.

Поиск по книгам и сохранённым сайтам

... или F#ck CHM

Гугл-десктоп, как выяснилось, прожевал лежавшее у меня локально в виде отдельных html-файлов руководство по MySQL. И, соответственно, теперь обеспечивает по нему полнотекстовый поиск — в дополнение к Оглавлению, которое даёт возможность быстро найти нужную главу. Но это ещё не главное.

Главное вот что: теперь можно спокойно расконвертить из CHM сотни html-книг, лежащих у меня в архивах, и работать с ними через локальный гугл-поисковик, объединяющий это всё информационное безобразие в большую и вполне удобную гипертекстовую библиотеку, позволяющую просмотреть все материалы по тому или иному запросу или набору ключевых слов. Раньше в каждом из CHM-файлов был свой собственный индекс (или не было, или не полнотекстовый), а если нужно искать что-то в целой теме, то по всем книгам особенно не наищешься.

Теперь достаточно взять в руки KeyTools, развинтить набор файлов, и готов кроссбраузерный html, который можно смотреть через Firefox, Оперу, или Lynx (если не насовали скриптов). Gecko для CHM больше не нужен. Вот это счастье.

Поиск по Льву Толстому

  • ubs: The Best Search Idea Since Google: Amazon.com's announcement this week of its new "search inside" feature—allowing full-text searches of over 120,000 books in its new digital archive—will probably turn out to be one of those transformative Web moments when a tool suddenly appears and six months later you can't imagine life without it.

Искать можно и по зеркалу библиотеки Мошкова. И, наконец, можно сохранить копию своего журнала и искать по ней гуглом. Или не своего журнала, неважно. Поиск будет, в отличие от LJS, охватывать не только сами посты, но и комментарии, так что работать с каким-нибудь Многотредовым Кошмаром ©, вроде записей в openmeta, будет намного-намного проще.

На очереди — поиск по почте Бата (можно сделать, экспортнув всё в текстовые файлы, но каждый день экспортировать утомительно, если не писать только сразу фильтр, который будет сохранять копии всей входящей почты в большое хранилище, срезая вложения).

Не хватает ещё, пожалуй, возможности поковыряться в индексе и посмотреть. как и что можно сделать с ним изнутри, но это, наверное, дело времени. Новые приключения в Стране Управления Личными Данными впереди.

 search_techniques
 search_engines
 info_organization

Subscribe
  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 38 comments