Пора пришла обновить версию wordpress’a, но мне этого показалось мало, я вспомнил, что у меня есть сохраненный в яндексе архив старых записей, и было непростительно оставлять их там, поэтому было решено обновить версию движка, а заодно импортировать те записи.
Для начала нужно было сохранить все 24 страницы с яндекса к себе на диск, для этого с помощью flash get’a я задал пакетное задание, и через две минуты все странички с записями были у меня.
Далее передо мной было два пути: поиск данных через регулярные выражения, попытаться разобрать html странички через DOM.
Я выбрал второй способ, ибо итак уж очень часто использую регулярные выражения :). Для того, чтобы импортировать *.htm странички, мне пришлось вырезать из них лишние теги nobr, wbr (с этим прекрасно справился Eclipse с функцией «replace all»), ну а далее дело php. В итоге у меня получился такой скрипт, который генерировал для меня sql-запрос для добавления записей.
Через пару минут он уже был успешно импортирован в бд, ну а результат вы можете видеть уже сейчас
ps. да, не обошлось без глюков, т.к. безжалостно резались все html-теги, поэтому некоторые посты придется править вручную.
Comments are closed, but trackbacks and pingbacks are open.