June 25th, 2004

girls

[ utx ] UTF8-миграция

А, между прочим, нужно было подумать заранее, и хранить поля в юникоде, а не в win1251. Потому что теперь нужно будет грохнуть все названия записей, и вытянуть их все обратно заново. На данный момент COUNT(DISTINCT url) = 10683, при этом, по разным причинам, в базе сейчас 905 записей, у которых не закачаны заголовки (по-моему, это не учитывает записи, которые закрыты френдс/приват-режимом).

На самом деле, заранее-то, конечно, я подумала, но использовать поиск по базе, где текст лежит в win1251, мне показалось проще, а также дешевле хранение данных, которые ограничиваются однобайтовым представлением, вместо „от двух байт для любого не-ascii символа, и выше“. По идее, базе всё равно, что искать — LIKE "%однобайтовые кракозябры в 1251%" или LIKE "%многобайтовые кракозябры в UTF8%"... Попробуем — узнаем.

Полный же переход на UTF означает, что мне придётся переписать и разрабатываемый ютх-Арлин в юникод, пытаясь ещё и понять, что будет приходить в полях форм, и как с этим всем работать. Неприятно.

 
 

  • Current Music
    hiphop barrio — Up, Bustle and Out
souloveme?

[ utx ] Блокирующие вопросы: авторизация исходящая, авторизация входящая

[1] Собраться с мыслями по-шукшински свинцовой опой и понять, как работает теперь авторизация в LJ, и почему время от времени крошка тахо нарывается на какие-то странные сообщения об ошибках, выдаваемых LJ.

mental-note: как только „странное сообщение об ошибке“ получено, его надо скинуть в файл для изучения в дальнейшем. Или почтой отправлять? Голубиной?

И вообще, непонятно, как и чем надо авторизовываться в этом лж. Свинцовую опу придётся тратить ещё и то ли на PEAR::HTTP_Request (если брать cookie вручную, прописывать их в запрос, и с ним ходить), то ли на HTTP_Client (что, скорее всего, и придётся делать, так как журналовские cookie сгорают через некоторое время вне зависимости от того, стоит ли у тебя вечная авторизация, или нет).

[2] Понять, как авторизовывать внешние интерфейсы, вроде надстройки над лже-клиентом, при обращении к нашей базе и при попытке редактировать/обновлять её. Чем они отличаются от юзера? Как хранить их сессии и хранить ли? Загадка на загадке, причём низкоуровневые всё какие-то.

 

  • Current Music
    Ursula 1000 - [All Systems Are Go Go #14] Fever 99 / Mo' Hor
souloveme?

Любовь моя, UTF в MySQL

Нам тут рассказывает анонимный собеседник об эмоциях других разработчиков. Прочитав это — две мысли.

  • Бля, ИНДЕКСЫ! (С интонацией, как в анекдоте про „Бля-а-а, КРОКОДИЛ!“)
  • ... так, пронесло, у меня индексы только по полям с "a-z0-9_" и ни одного полнотекстового. Если будут делаться абстракты, то... То... делать тебе, лапа, индексы руками и изобретать велосипед.

Есть нетривиальный ход: используя служебное положение, подключить себе Постгрес, и после этого уже спокойнее размышлять о UTF8, транзакциях и знакомиться с новыми багами, теперь уже постгресовыми.

  • Current Music
    Ursula 1000 - [All Systems Are Go Go #06] Hell, Yeah! / Jadell
souloveme?

[ Q ] З.ж.б.ч

Кстати, moedusa нередко называл (и называет, в те редкие моменты, когда у него появляется больше тридцати секунд на разговор со мной) меня „злой, жестокий, бессердечный человек“.

Having inside a warm and fuzzy feeling of being a bastard.

  • Current Music
    Ursula 1000 - [All Systems Are Go Go #07] The Connection / Hardwire