:: urbansheep (urbansheep) wrote,
:: urbansheep
urbansheep

  • Music:

[ utx ] оптимизация рефёреров

Убил только что левый „случайно образовавшийся“ индекс по реф-полям, и общий объём индексов уменьшился на треть. Теперь снова возник вопрос о том, как оптимизировать хранение ссылок на записи — из всей строки вида http://www.livejournal.com/users/urbansheep/859640.html нам нужен идентификатор пользователя и идентификатор записи. Это две пятых от всего объёма, остальные три пятых — мусор.

Веселье начинается при необходимости определиться — будет ли этот сервис работать только для LJ или он всё-таки пойдёт дальше, как запланировано? Если он работает только в сфере LJ (а это большого смысла не имеет), то остаются в стороне все желающие использовать ютх совместно с вики-друпалом-своими статическими страницами и movable type'ом.

Выход — введение понятия „формат“: при поступлении рефёрера проверяется, если он укладывается в один из „форматов“, запись усекается до значимой части, и отдельно указывается, к какому формату она относится, чтобы при выводе можно было восстановить запись без сложностей. В случае унифицированных систем (тот же LJ/UJ/DJ) изменение глобальной системы записи (как это было в случае с переходом от /talkread.bml?journal=user_id&itemid=item_id) не изменит записи в базе, а, значит, не появится дубликатов, записей с разными адресами, ведущими на одну реальную запись.

И что делать, спрашивается?

Subscribe
  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments