:: urbansheep (urbansheep) wrote,
:: urbansheep
urbansheep

[ B ] Популярно о датамайнинге: Spidering и Google hacks

Специально для тех любопытных, которые привыкли выкручивать всё до последней гайки и собирать из этой кучи деталек что-то своё. Тонкости индексации, язык запросов, тёмные углы, нетривиальные решения, параллельные сервисы и просто то, о чём интересно и полезно знать, но совершенно не приходит в голову спрашивать.

Google Hacks
The combination of Google's API and over 3 billion pages of constantly shifting data can do strange things to your imagination and give you lots of new perspectives on how best to search. This book goes beyond the instruction page to the idea of "hacks"—tips, tricks, and techniques you can use to make your Google searching experience more fruitful, more fun, or (in a couple of cases) just more weird.

Spidering Hacks
There are several facets of spidering: searching for and finding the information, gleaning and gathering, repurposing and repackaging, and sharing it with peers. On the flip side, there's also ensuring that your own site's information is spider-friendly.





Subscribe
  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 1 comment