Как скачать чужой живой журнал целиком. Как сохранить пост из ЖЖ в красивый PDF файл (лайфхак). Как скачать блог с помощью LJSM

Кому как, а для меня с моей параноей этот вопрос очень важен. Интернет не вечен, да и к тому же не стабилен. То, что ЖЖ может "накрыться" в любой момент и никто не возместит полученного морального ущерба - наверняка написано в лицензионном соглашении, под которым мы все поставили свою виртуальную подпись, заводя свой аккаунт.

Кстати, если кто хранит подборку закладок на чужие дневники (memories) - попробуйте проверьте - наверняка сейчас некоторые записи стали недоступны. Бывает, их удаляют. Бывает, меняют права доступа. А бывает - закрывается и весь дневник пользователя.

Я нашёл несколько способов сохранения своего (или чужого) дневника:

1) вручную сохранить каждую страницу в любимом броузере;
2) натравить на livejournal.com один из Offline Browser"ов;
3) заказать на спец сайте предоставляющем такую услугу сохранение своего дневника;
4) или использовать специализированную утилиту.

Способ первый - кондовый

Открываем очередной пост и жмем "Файл/Сохранить как..."

Плюсы: не надо ничего искать - всё в наших руках. Сохраняются и комментарии и картинки и избранное и информация о пользователе.

Минусы: вся работа ручная. Если дневник большой - замаешься сохранять.

Способ второй - усовершенствованный первый

Берём Offline Explorer, Teleport Pro или какой ещё загрузчик сайтов, настраиваем проект и качаем. Лучше всего в качестве корневой взять страницу "Календарь".

Плюсы: опять же, сохраняются и комментарии и картинки и избранное.

Минусы: надо разбираться с настройками программы для скачивания. К тому же, структура ЖЖ достаточно разветвлённая (это если постов много). И надо тщательно настроить проект, чтобы в него не попадали ненужные страницы (другие дневники, справка ЖЖ, посторонние сайты со всем содержимым и т.д.).

Способ третий, LJBook

Идём на LJBook (http://ljbook.com) и просим сохранить наш дневник.

Плюсы: на выходе - книжка в PDF (а если заплатить денежку, так ещё и с картинками в большом разрешении). Книжка имеет удобное содержание и активные сслыки на онлайновый оригинал.

Минусы: нужно отдавать свой пароль в чужие руки. Глючит с русским текстом - может это только с моим журналом, но у меня вышел совершенно нечитаемый документ.

Способ четвёртый

Есть несколько спец программ для сохранения ЖЖ. Перечислю найденные и опробованные мною:

Плюсы: грузит комменты, картинки, закладки (memories), по количеству настроек не уступает другим программам. Может синхронизировать локальную копию журнала, загружая только недостающие записи. Может загружать записи за определённый период времени. Создаёт удобный файл с содержанием дневника. Есть утилита для верстки файла-книжки со всеми записями. Может переводить дневник из UTF-8 в обычный ASCII код. Линуксоидам радость - утилита работает не только под Виндами.

Минусы: нет графического интерфейса - только командная строка. Путает порядок некоторых записей (тех, которые в пределах одного месяца опубликованы "задним числом").

Windows GUI утилитка, 508 Кб, автор вроде из Англии, http://ljbackup.yamnet.co.uk .

Плюсы: поиск по скачанному, экспорт в различные форматы и с настройкой, какие записи экспортировать (приватные, публичные, для друзей). Может делать содержание с настройками группировки записей (по году/месяцу/дню). Сохраняет отдельно комментарии, отдельно исходные записи.

Минусы: не заточен под UTF-8 вообще и русский язык в частности. То есть все тексты будут выглядеть следующим образом "‚РѕРј, что выброшен ар". Не скачивает картинки и избранное. Почему-то не сохраняет комментарии - выдает ошибку "download corrupt".

Плюсы: Поддерживает русский язык. Имеет хорошую поисковую систему (с учётом морфологии русского языка), вот только результаты выдает в неочевидном виде - надо вручную открывать файл Search/Results.html и обновлять его после каждого поиска. Может обновлять записи с комментариями. Сохраняет многостраничные и свёрнутые комментарии. Программа находится в горячей фазе разработки. Автор - русскоязычный, значит будет русский интерфейс.

Минусы: загрузка скрытых или подзамочных записей зависит от настроек ЖЖ и Internet Explorer"a (срок окончания авторизации на сайте ЖЖ должен быть неограниченным). Программа не сохраняет избранное. Неочевиден порядок нажатия кнопок для получения нужного результата (можно ли вызвать "GET" не нажимая перед этим "INDEX" и можно ли независимо от этого скачать картинки?). Нет индексного файла с содержанием дневника. Дневник не может быть отсортирован по дате добавления записи и не учитывает публикацию "задним числом". Большой файл со всеми записями сохраняется без картинок (все ссылки - на оригинальные файлы в Интернете).

Выводы

В итоге я пользуюсь консольной утилитой LJSM - создал один раз ярлык для загрузки своего журнала, так что в настройках ковыряться пришлось только один раз:

Ljsm.exe -i 3 -d 2004/1:2005/12 -u kibizoid:***** kibizoid - сохраняет журнал
ljsm.exe -r -m -I -i 3 -d 2004/1:2005/1 -u kibizoid:***** kibizoid - сохраняет избранное

Однако, если развитие программки не остановится, в скором времени я перейду на нее - поисковая система в ней хорошая.

Возможно я немного отстал от жизни, но узнал об этом способе только на днях путем собственных экспериментов. Для чего это нужно? Данный способ позволяет сохранять посты из жж в файл pdf со всеми картинками и ссылками. Но самое главное, он не сохраняет все ненужное оформление дизайна жж. Это работает и с отложенными записями. К примеру, пишите вы пост и вам нужно согласовать его с партерами или заказчиком перед публикацией в жж. Вы сохраняете его в отложенные записи, далее конвертируете в pdf и отсылаете на согласование заказчику. Все очень презентабельно и солидно.
Еще один вариант использования, можно накачать нужное количество постов с описанием мест, сохранить их ридер на планшете или офлайновый Яндекс-диск. В путешествии в любой момент достать и прочесть нужную информацию либо посмотреть фотографии.


Начнем. Сразу оговорюсь, что у меня Mac. Буду показывать как это делается в браузере Safari, но насколько знаю в хроме под виндой такое тоже возможно. Главное уловите суть, а там уже сами пробуйте.

Для наглядности я взял свой с всемирной выставки в Милане Expo 2015 о российском павильоне. В нем есть и текст и 38 достаточно больших фотографий. Будем его сохранять в файл pdf.

1. Итак, вот как он выглядит у меня в жж. В браузере safari есть чудо-кнопка которая переводит пост в режим просмотра. Кнопка указана стрелкой. Нажимаем её:

2. После нажатия на эту кнопку остается в просмотре только пост, без лишнего блогерского дизайна:

3. Следующим шагом идем ФАЙЛ-ПЕЧАТЬ. Открывается меню печати. По умолчанию у вас будут стоять настройки принтера. Скорее всего формат бумаги А4. Тут нужно понимать, что если вы оставите формат А4, то весь длинный пост разобъется на множесво листов А4-го формата. Причем разобъется коряво. К примеру, в конце листа если не будет вмещаться фотография, то он оставит описание чуть ниже середины листа, а фото перенесет на следующий лист. Очень некрасиво. Я предлагаю сделать вот что. Заходим в формат бумаги и выставляем ручные параметры листа. Ширину оставляем 297мм.(А4), а вот высоту ставим такую, чтобы весь пост уместился на одном листе. Смотрите левый выделенный столбик. Для моего поста на 38 фото понадобилась высота 10,000 мм. Формат pdf отлично масштабируется и никакого труда не составит его раскрыть по ширине и спокойно скролить вниз.
ВАЖНО: обязательно уберите галочки с "Напечатать фон" и "Напечатать колонтитулы"
Итак, мы выставили параметры печати, но печать нам не требуется. Нам нужно сохранить файл. Жмем на синюю стрелку в левом нижнем углу(как на скрине):

4. После нажатия на стрелку выпадет меню, где нужно выбрать "Сохранить как PDF". Все. Выбираете папку сохранения. Можете сразу закинуть на яндекс-диск и потом на планшете перевести эту папку в офлайн режим. У вас появится доступ ко всем фалам в этой папке без доступа в интернет. Но имейте в виду, что память планшета уменьшится ровно на размер этой папки:

5. В pdf сейчас этот пост открывается вот так. Очень удобно. Это отдельный файл который весит 17 мегабайт:

Если вы хотите открыть его на вашем компьютере и посмотреть как он сохранился, то вот ссылка для скачивания файла PDF с этим постом об Экспо.

Сравните качество фото и удобство прочтения.

На этом все.

p.s. кстати, этот способ может пригодиться не только для сохранения постов жж, но и других материалов в интернете.

p.s.s для винды, а именно для Google Chrome . Тут рассказывается как установить плагин в хром который активирует режим чтения и из него же можно отправить на печать(в режиме печати изменяем принтер на "сохранить в pdf)

August 2nd, 2011

Current Music: Solar Fields - Ropeburn

Вроде бы и понятно, что ddos-атаки относительно безвредны и все посты в любимом блоге в конечном итоге уцелеют и рано или поздно станут доступны. Но тем не менее хочется чтобы архив был стопроцентно сохранен и был доступен всегда, независимо от помирающего блогосервиса. Поэтому, решено было создать архив моего блога на базе моего же сайта.

Сохранено абсолютно все. За исключением десятка удаленных фотографий (раньше фотохостингом служил мой сайт, а потом я все потер), еще не работают аудио и видео записи, они занимали слишком много места. Для удобства разбито по месяцам. Поиск пока что не работает, впрочем, я не уверен что он там вообще сильно нужен. Как приятный бонус - доступны все скрытые посты, которых, о боги, у меня целых три:) Трафик я постарался минимизировать. Но в среднем, одна страница архива года эдак 2010 весит 5-8 мегабайт. Меньше - нельзя, там же фотки.

А вообще, хочу я вам рассказать, как же все-таки можно сделать архив своего блога в ЖЖ.

Итак, я уже касался этого вопроса во время первой атаки. Теперь хочу вернуться. Так уж вышло что приперло мне сделать полный архив моего блога. Все-таки хочется сохранить все свое словоблудие в удобной для дальнейшего прочтения форме. И так уж вышло, что удобного инструмента в этой деле НЕТ. То есть вообще нет. Есть только несколько костылей разной степени кривизны.

1.1 Способ первый. Offline Explorer.

Скажу сразу, если вашему блогу не менее пяти лет и вы выбрали этот способ - вы либо мазохист, либо вы все-таки мазохист:) Но способ. как не крути - самый привлекательный. на первый взгляд. как видно из названия - прога выкачивает любой сайт полностью или частично и сохраняет его для последующего просмотра в оффлайне. сразу хочу сказать - ЖЖ она сохраняет чуток криво, однако, все ссылки работают и вы фактически не почувствуете разницы. То есть Offline Explorer скачает вам полностью работоспособную копию вашего блога, можно будет походить по ссылкам, заглянуть в архив, перейти по тегам и тд. и тп. но на диске будет твориться чудовищный сука хаос из файлов и папок! Копия моего блога выкачивалась где-то часа два, заняла 500 с лишним мегов и кто знает сколько бы оно еще качалось если бы я не прекратил это непотребство. 500 мегов - это СЛИШКОМ много. Поэтому способ хоть и красив, но никуда не годится.

Если вы все-таки его выбрали - дерзайте. Отключите скачивание с посторонних серверов (только xxxxx.livejournal.com и ничего большего), в фильтре отключайте скачивание архивов, видео, музыки, разрешите скачивать изображения со сторонних сайтов. Плюс глубину скачивания установите на 0 (тобишь выкачивается всё). Еще не забудьте зайти в свой блог через браузер в окне программы и авторизоваться в нем. Иначе подзамочные посты не скачаются. Ну и запаситесь терпением, разумеется.

Где скачать: прога платная, хотя и стоит своих денег. Искать... ну хотя бы и на торрентах.

1.2 Способ второй. Минимализм в абсолюте.

Тут используется прога с названием LJSM . Скажу сразу - командная строка это нихрена не юзер френдли. Почему кто-то до сих пор делает проги, управляемые из командной строки - для меня загадка. Это феерический долбоебизм и отсутствие элементарного уважения к конечному пользователю. Но тем не менее, LJSM - чуть ли не самая толковая в деле скачивания блогов ЖЖ, несмотря на то, что для того чтобы запустить скачивание своего (или чужого) блога вам придется представить себя труЪ-юзером MS DOS из 90х.

Она выкачивает каждый пост в отдельный файл, при желании вместе с картинками, аватарками и комментариями. Плюс - создает файл-оглавление со ссылками на все посты. Довольно удобно, но нельзя допустим сделать набор постов за месяц или за год - прога умеет только распихивать посты по файлам. А еще у скачаных постов слишком аскетичный дизайн - просто черный текст на белом фоне и аватарки. Но с другой стороны - это же архив. Главный плюс тут - объемы. В отличие от Offline Explorer архив у меня получился всего в 40 мегабайт. Третий безусловный плюс - прога сразу же подключается к ЖЖ-шным серверам и начинает качать. Ее почему-то не блокируют в то время как “LJ Archive”(см. далее) тупила два дня, но так и не подрубилась.

О том как ей пользоваться и где ее качать - читайте чуть ниже.

1.3 Способ третий. Золотая середина.

LJ Archive - это нечто среднее между LJSM и Offline Explorer. С одной стороны она специально заточена под ЖЖ и выкачивание исключительно постов. С другой стороны - минимализмом тут и не пахнет, имеется удобный интерфейс, разные сортировки, статистика и все такое прочее.

Неудобства:
1. Посты выкачиваются относительно быстро, сохраняется форматирование текста, картинки подгруживаются из инета, плюс - скачиваются комментарии. Но не выкачиваются аватарки комментирующих. Это что, так трудно было реализовать?! Даже сверхаскетичная LJSM это умеет. Вроде бы - ничего особенного, но с аватаркой, френд “обретает лицо”, он мигом идентифицируется в нагромождении текстов. Вобщем, это тупость, так нельзя делать.
2. Нельзя выкачать картинки вместе с постами. Это еще более тупо. Прога-то для архивирования блога, а архивирует по факту только тексты.
3. Не сохраняется оформление блога. Не критично, но тот дизайн, что предлагает LJ Archive - это пардон, вырвиглазный пиздец. И хорошо хоть цвета можно настроить ручками, а то бы было совсем грустно.

Удобства:
1. Относительно нормальный человеческий экспорт. То есть посты можно читать не только из окна программы, но и из браузера, произведя экспорт в html. Причем можно выбрать как экспортировать - все в один файл (за 5 лет? я даже пробовать не хочу:) или разбить его по месяцам или даже дням.
2. Компактность. Весь архив хранится в одном файле, а так как картинки не скачиваются - объем у этого файла минимальный.
3. Удобство. Удобство поиска, календарь, статистика - все дела.

2.1 Как архив делал я.

1. Скачал и установил LJ Archive. Произвел синхронизацию с блогом - посты скачались.
2. Настроил более-менее приятное глазу оформление.
3. Произвел экспорт в HTML с разбивкой по месяцам - в указаной папке создалось куча файлов. В каждом - посты за определенный месяц.
4. Открыл первый файл в браузере и подождал пока загрузятся все картинки.
5. Сохранил полностью загруженную страницу средствами браузера (Ctrl+S). В результате получилась точно такая же страничка, но со всеми картинками, которые теперь хранятся вместе с ней.
6. Повторил данную операцию для всех остальных файлов архива.
7. Как вариант - можно установить PDF-принтер (например DoPdf) и вместа пятого пункта - отправлять на него каждую страницу. В результате получатся pdf-файлы. Если настроить сжатие картинок хотя бы 144dpi - объем файла на выходе вас приятно удивит. Главный минус тут - если в блоге много фотографий большого размера - скорее всего pdf будет некрасивым и притормаживающим.
8. Доработка напильником. Блог в таком виде весил аж 100 мегабайт. Для домашнего архива - это нормально, для архива, доступного из сети - это никуда не годится. Конвертация в pdf с хорошим сжатием графики - это выход, но для сети это не слишком удобно. Тормозит, зараза:) Поэтому пришлось пошаманить с картинками, благо все они хранились централизовано, в одной папке. Во первых - я уменьшил их все на 50%, во-вторых - я сжал все jpg. Выигрыш получился неплохой - в 2 раза. А теоретически можно и в 3. Но я решил выбрать золотую середину.
9. Полученный набор html-страничек закачал на сайт, сделал страницу-оглавление, прикрутил лайтбокс и собственно всё.

2.2 Как скачать блог с помощью LJSM.

Скачивается все просто. Если вы как и я пользуетесь Total Commander - то все просто. Заходите в папку с программой и набираете в командной строке тотала следующую команду:

Если вы, о боже мой, пользуетесь проводником - придется чуток заморочиться.
1. Нажимаем Windows+R. Или “Пуск->Выполнить”. Но в Висте или Win7 этого пункта нет.
2. Набираем команду cmd
3. Переходим в каталог с LJSM. Но вы ведь никогда не работали в DOS? Ладно, ща объясню. Проще всего будет в самом начале создать на диске С папку LJSM и положить туда файл ljsm.exe. Знач так. Вот в этом черном окне надо вбить всего 2 простые команды.
Вводим команду CD C:\ Нажимаем Enter. Появляется строчка с:\>
Вводим команду CD C:\LJSM Нажимаем Enter Появляется строчка с:\>LJSM>
Отлично, значит вы переместились в папку LJSM.
4. Убеждаемся что интернет работает, а ЖЖ не ддосится.
5. Вбиваем следующую команду:

ljsm -u username:password username

Пример 1: ljsm -u frost123:222222 frost123
Выкачивается все содержимое моего блога (при условии что я - frost123)

Пример 2: ljsm.exe -i3 -d 2011/1:2011/12 -u frost123:22222 frost123
Выкачивается все содержимое моего блога с января по декабрь 2011 года, включая всю графику (-i3) (при условии что я - frost123)

Нажимаем Enter. Если все вбито правильно - по черному окошку поползут строки, а через некоторое время в папке LJSM начнут создаваться папки с выкачанными постами. Когда работа будет завершена - окошко закроется. Или не закроется и напишет отчет.

2.2.1 Почему же я все-таки этого не сделал:

Потому что в LJSM нельзя сгруппировать посты по месяцам. То есть можно, но вручную, в любом текстовом редакторе, а это - огромный объем работ. К тому же, программулина не выкачивает добрую половину картинок. Возможно это мои траблы с инетом, но отследить ошибки не представляется возможным. Ну и напоследок - слишком аскетичный и ненастраиваемый дизайн страниц на выходе. Можно править все ручками, но мне откровенно влом ковыряться в html-коде каждого файла.

Ну вы поняли. Казалось бы - такой старинный и обширный блогосервис, а элементарного инструмента для нормального человеческого экспорта нет и возможно даже не будет. Но, включив фантазию и задействовав кору головного мозга, можно все-таки извернуться и получить более-менее приемлемый результат.

Для чего нужно сохранять Живой Журнал на компьютере?
Ну например, что бы без интернета можно было полистать посты, комментарии к ним. Вдумчиво и спокойно.
На всякий пожарный ещё можно, архив вашего журнала будет под присмотром. Вещь-то вполне и ценная:)

Как сохранять?
Есть несколько программ позволяющих сохранить Живой Журнал на локальном компьютере.
Одну из них мы рассмотрим подробно. И так. Знакомьтесь! ljArchive - архиватор и синхронизатор Живых Журналов.
Скачиваем ljArchive (потому, что на сайте проекта грузится архив без программы, или )

(ОБНОВЛЕНИЕ)
А здесь есть версия с работающим сохранением комментариев http://www.memory-prime.de/lja/ljarchive_setup.zip

Для работы ljArchive может понадобиться Microsoft .net framework

Установка ljArchive

Запускаем скаченный ljArchive и нажимаем "Next"

Здесь нажимаем "I Agree"

Компьютер спрашивает в какую папку установить программу. Оставляем всё как есть
(хотя если нужно выбираем другую папку) и нажимаем "Install"

Здесь снимаем галочки с двух отмеченных пунктов. Нажимаем "Finish"

Поздравляю! ljArchive установлен!

Запуск и настройка ljArchive

Запускаем ljArchive Пуск --> Программы --> ljArchive --> ljArchive
В верхнем меню "File" открываем пункт "New Archive"

В открывшемся окне, пишем название вашего блога, что бы вышло как на рисунке.
Больше менять ничего не нужно. Архив вашего Живого Журнала будет сохранён в папку "Мои документы"
Нажимаем "Next"

Здесь вписываем название вашего ЖЖ и пароль к нему. Если вы хотите скачать и посты и комментарии к ним.
Убедитесь, что рядом с "Download comments" стоит галочка. Нажимаем "Next"

Нажимаем "Finish"

Если всё указано верно, ljArchive автоматически скачает ваш Живой Журнал.

А чтобы листать Ваш ЖЖ с кофмортом включим список записей, где показаны даты ваших постов, заголовки и начало текста.
Для листания записей используйте зелёные кнопочки со стрелками. Для перехода сразу на нужную запись - нажмите по её заголовку в списке записей.

Вы можете воспользоваться поиском . По записям, комментариям или и там и там сразу.

Для поиска нужных записей и комментариев, вы можете воспользоваться встроенным календарём

Периодически запускайте ljArchive , что бы он мог дополнить (синхронизировать)
архив вашего ЖЖ свежими записями. При запуске ljArchive сам подключается к вашему блогу и скачивает
последнии посты. Если этого не поизошло - нажмите кнопку указанную на рисунке.

Пуск --> Программы --> ljArchive --> ljArchive
или двойной клик по самому архиву в папке "Мои документы"


В следующий раз, я расскажу о некоторых дополнительных настройках и интересных возможностях ljArchive .

Суповцы испортили все праздники куче народа. Вся френдлента от них стонет.
Да и вообще из ЕлеЖывого Журнала нормальных пользователей выживают. Статистики теперь не посмотришь, а я через статистику в том числе вылавливала новых френдов. Скоро навяжут новую форму френдленты (она мне категорически не нравится). Народ опять разбегается куды только можно. Полтора года назад я сбежала на дайри. Там мало таких интересных постов, как в ЖЖ, но там не бывает катастрофических улучшений. Форма новой записи там кажется мне удобнее. Там очень удобно организовать опрос (я провела опросы по 600 именам). Там легко настроить дизайн дневника, не зная совершенно никаких программных хитростей (я меняю там дизайн раз в месяц в зависимости от настроения). Там уютно. Там я бессовестно зафлуживаю дневник перепостами из ЖЖ и с Лиру (здесь я это все-таки стесняюсь делать), и мне это прощают.
Одновременно я попробовала сбежать на Лиру, но там нифига не разобралась с настройками и бываю там только наскоками.
Если суповцы таки угробят ЖЖ, лично мне будет очень грустно. Я мало делаю постов в ЖЖ, но долго собирала френдленту. Это именно то, что я хочу читать каждый день. В ней много разного народа, кое-кого я знаю лично, но многих - только по постам жж. И тем не менее, каждый из моих френдов в моих глазах - особенный.

Ну вот это сегодня подвернулось в ленте.
Пусть будет на всякий случай:

Оригинал взят у bigstonedragon в Как скачать чужой ЖЖ

Александр Николаевич Житинский – это уже не первая смерть в моей френд-ленте. Не знаю, будет ли ЖЖ хранить эти журналы как монумент, или рано или поздно сотрет их с лица Земли ЖЖ. Посему давно уже подумывал, что хорошо бы их сохранить себе на комп, дабы было откуда и впредь мудрые и интересные мысли черпать. Но средств подходящих не встречал – много программ, чтобы делать бэкап своего журнала, но не попадалось ни одного, чтобы сохранять журналы чужие.
И вот тут как специально наткнулся на ссылку, которая обеспечивает нужный сервис! Причем программа давняя уже – 2006 год, и очень простенькая – 125 КБ всего. Но дело своё делает!
Заметил три недостатка: во-первых, скачивает только текстовую часть дневника, без картинок; во-вторых, скачивает не весь дневник за один раз, а лишь один год или один какой-нибудь месяц (или несколько месяцев) одного года. И в третьих, делает это достаточно медленно – пашет второй день, скачала всего первые четыре года дневника Житинского (правда, с перерывом на ночь).
Кроме того, если дневник был начат не с начала года (например, Житинский завел его в апреле 2001), то за первые месяцы (январь-апрель в моём случае) в конечный файл попадают записи последнего года (2012 в моём случае).
Однако, несмотря на все эти недостатки, меня выдаваемые результаты всё равно устраивают!
Если кому ещё интересно – вот ссылка для скачивания: