:: urbansheep (urbansheep) wrote,
:: urbansheep
urbansheep

  • Music:

[ utx ] UTF8-миграция

А, между прочим, нужно было подумать заранее, и хранить поля в юникоде, а не в win1251. Потому что теперь нужно будет грохнуть все названия записей, и вытянуть их все обратно заново. На данный момент COUNT(DISTINCT url) = 10683, при этом, по разным причинам, в базе сейчас 905 записей, у которых не закачаны заголовки (по-моему, это не учитывает записи, которые закрыты френдс/приват-режимом).

На самом деле, заранее-то, конечно, я подумала, но использовать поиск по базе, где текст лежит в win1251, мне показалось проще, а также дешевле хранение данных, которые ограничиваются однобайтовым представлением, вместо „от двух байт для любого не-ascii символа, и выше“. По идее, базе всё равно, что искать — LIKE "%однобайтовые кракозябры в 1251%" или LIKE "%многобайтовые кракозябры в UTF8%"... Попробуем — узнаем.

Полный же переход на UTF означает, что мне придётся переписать и разрабатываемый ютх-Арлин в юникод, пытаясь ещё и понять, что будет приходить в полях форм, и как с этим всем работать. Неприятно.

 
 

Subscribe
  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 9 comments