Почему конвертируется pdf в word. Конвертируем PDF файл в Word документ. При конвертации документа с помощью Microsoft Word зависает программа. В чем, может быть проблема

Под этим термином подразумевается перенос данных, содержащихся в исходном файле в полноценный, редактируемый текст Word. Под привычным названием Word подразумеваем любой идентичный ему редактор, например, бесплатный Writer от Libre Offiсe. Конвертация из Word в PDF как правило понятна. Эта функция встроена в текстовые редакторы и не вызывает нареканий. Перевести же файл из PDF в Word бывает практически невозможно.

С конвертацией «простых » файлов PDF, данные которых полностью состоят из текста, как правило ничего сложного. Примером такого файла может быть PDF, созданный из текстовых данных, непосредственно в редакторе типа Word.
Вот несколько вариантов конвертирования, первые два способа применимы offline :

Третий — отличный способ online конвертирования:

А вот как перевести «сложный» , состоящий из комбинированных данных файл PDF в Word ? Такие файлы встречаются не редко. И именно с ними возникают трудности. Предыдущие способы тут совершенно не годятся. Изображение, входящее в состав сложного файла никак не редактируется вместе с текстом. Вот пример сложного файла:


Задача — преобразовать все данные исходного файла в полноценный, редактируемый текстовый файл формата Word. Есть два реальных, неплохих online способа решения этой задачи:

Пожалуй, с них, как с наиболее интересных, и начнем.

PDF в Word онлайн конвертером Convertio

Пробуем «Способ распознать текст на изображении:» , описанный в предыдущей публикации: Напомню, что мы пользовались онлайн конвертером с созвучным названием Convertio. Там все просто. Заходим на сайт (это ссылка именно на нужную страницу), загружаем наш файл и включаем преобразование. Вот сразу результат!

Абсолютно все содержимое исходного файла перенесено из пдф в ворд. Текст прекрасно редактируется. Есть и ошибки преобразования.

  1. Видно, например, что вместо исходного слова РЯЗАНЬ получилось РЯЗАНВ.
  2. Часть текста распознана в виде таблицы.

Но в целом, задача неплохо решена! Хочется только обратить внимание на две детали.

  • Первое, это то, что не всякий раз, когда требуется перевести PDF в Word конвертер поступает именно так, как нужно. Иногда он пытается упростить задачу, и по умолчанию делает тот же вариант, что и Adobe Acrobat DC при переводе в Word. В итоговом файле получается картинка плюс текст, а не сплошной текст.Помогает перезагрузка страницы браузера. Хорошим знаком того, что Convertio понял, чего Вы от него хотите будет вот такое сообщение после того, как Вы загрузите в него нужный файл:
  • Второе. Количество бесплатных преобразований из пдф в ворд ограничено десятью файлами в день. Проще всего оплатить, особенно, если пользуетесь этой функцией часто. Есть разные тарифные планы. Ну а если не часто, то очень просто, очистить в своем браузере cookie, сменить IP адрес . Потом перезагрузить страницу сайта и продолжить работу со следующим десятком документов.

Периодически, по мере сил и возможности проверяю сервисы, которые рекомендую в статьях. На февраль 2019 года Convertio в тестовом (бесплатном) режиме работает довольно неплохо.

PDF в Word онлайн конвертером docs.zone

На февраль 2019 года docs.zone при окончании конвертации дает скачать результат без регистрации и подписки на платный тариф в 20$ за год без ограничений по количеству документов. Пользуйтесь!

Наиболее мощный алгоритм в этом конвертере OCR, его и выбираем. Или сразу переходите по этой ссылке .

Загружаем наш сложный файл. Не обращаем внимание на назойливые предложения зарегестрироваться, включаем преобразование. Вот такой получился результат.


Можно сказать, что идеально.

  1. Ошибок не нашел, может Вы заметили?
  2. В отличии от Convertio никаких таблиц вместо текста. Кроме того, платный тариф навязывают, но не требуют. Пользоваться можно без ограничений по времени и количеству документов.

Можно сказать, что оба онлайн конвертера с задачей справились. Они сохраняют формат текста. Они умеют распознавать изображение как текст. У Convertio присутствуют ошибки. Задача перевода PDF в Word выполнена. Твердая четверка для Convertio и похоже, пятерка с плюсом для docs.zone.

PDF в Word в бесплатном Adobe Reader

Сначала попробуем, что получится при попытке конвертировать наш сложный исходник из pdf в Word. Начинаем с самого простого действия. Открываем файл, далее, нажимаем: «Файл», затем «Сохранить как другой…», выбираем «Текст…».

Вот результат. Собственно, что просили, то и получили. Сохранился только текст, который был заполнен на бланке — картинке:

Если мы в качестве конвертируемого файла возьмем простой pdf, в котором данные представлены в виде текста, то результат получится такой же. Текст в формате.txt, его можно скопировать, перенести в Word или Libre Office, но в любом случае, все фрматирование при этом утрачивается безвозвратно.

Пробуем следующий шаг. Все как и в первом случае, только вместо «Текст» выбираем «Word или Exel онлайн…». Звучит, по крайней мере оптимистично.

При клике на это поле открывается окно браузера с удивительно наивным предложением заплатить 966 рублей в месяц за платную версию. Хорошо, что при этом есть возможность бесплатной тестовой версии в течении 7 дней.

Ну что же, начинаем установку тестовой семидневки. Не буду описывать довольно стандартную и понятную процедуру. Скажу только, что времени ушло изрядно. Дважды потребовалось регистрироваться. Сначала на сайте, просто для того, чтобы скачать установочный файл. Повторно пришлось вводить свои данные уже после установки, или на финальной ее стадии, если быть точным. Установка программы тоже время заняла немало. Не засекал, так как занимался другой работой, но периодически с любопытством поглядывал на прогресс-бар в ожидании успеха.

PDF в Word в платном Adobe Acrobat DC

Итак, платная (7-и дневная тестовая) версия Adobe Acrobat DC установлена.

Пробуем. Открываем наш исходный файл «Сообщение о наличии объектов недвижимого имущества». Кликаем «Файл», затем «Экспорт в», далее, «Microsoft Word”. Отлично! Видим на выбор два варианта: «Документ Word» и «Документ Word 97-2003».

Начнем с первого.

Вот такой результат получился после попытки перевести pdf в Word:

Изображение из исходного документа так и осталось изображением. Видите, значёк «якорь» слева? Практически все данные, как были картинкой формата пдф, так и остались картинкой, которую мы не можем редактировать как текст, только теперь она вставлена в документ ворд. И только те данные, что были изначально в виде текста конвертированы как полноценный текст, который можно редактировать. Форматирование текстовых данных сохранилось.

Пробуем вариант с «Документ Word 97-2003».


Только текст. То же самое, что получилось после попытки конвертации в Adobe Reader.

Конвертация из PDF в Word в Google Drive

Нельзя не напомнить, что в сервисе Google Drive легко организована конвертация из pdf в Word. Правда, чтобы пользоваться этим сервисом необходимо иметь свой аккаунт в Google , создать который супер просто. У кого учетная запись уже есть, то сразу сюда: https://drive.google.com/

Для преобразования файла достаточно зайти в Google Drive, нажать кнопку «Загрузить», в открывающемся меню выбрать опцию «Загрузить файлы».

После загрузки файла с форматом pdf кликаете по нему правой кнопкой мыши, и из предложенных действий выбираете «Открыть с помощью», и «Google документы». Собственно, все, как только документ открылся, он преобразован.

Правда, наш тестовый сложный файл, после того как был загружен и открыт с помощью Google Документов перенес в документ только ту часть данных, которая изначально была текстом. Часть данных бывшая изображением не перенесена вообще. То есть получился все тот же вариант, что и в

Подводим итог:

Для самых сложных случаев, файлов, состоящих из комбинированных данных, можно пользоваться отличным онлайн сервисом docs.zone или Convertio , который чуть похуже, но тоже работает.

Не могу однозначно сказать, что Convertio совсем плох, возможно качество результата в том числе зависит и от исходного документа. В нашем примере на тестовом документе Convertio явно проиграл.

Для повседневного использования в онлайн режиме отлично подходит . Основные плюсы по сравнению с Adobe:

  • Не требуется установка дополнительных программ.
  • Бесплатно, без каких либо ограничений.
  • Подходит для большинства конвертируемых файлов.

А у Вас есть другие идеи по преобразованию PDF в Word?

Задачей этой небольшой статьи-руководства является ответ на поставленный ее заглавием вопрос.
Сразу поблагодарим компанию «Adobe» за этот замечательный формат - PDF . Еще большие благодарности тем, кто заталкивает в этот формат все, что только попадется под руку: и текст, и графику, а также считает дурным тоном прислать вам обычное письмо не конвертировав его в PDF …
Но, спокойно, без нервов! Что нужно переводчику от PDF? Верно - ТЕКСТ. Лучше даже неформатированный (Plain Text). Ну, а на картинки можно посмотреть и в «Adobe Reader» (ранее Acrobat Reader).
Итак, начнем.

ЗАПОМНИТЕ! Если заказчик хочет получить на выходе PDF да еще и с рисунками в растре, и чтобы форматирование сохранилось, смело шлите его к верстальщику с Adobe inDesign! Или осваивайте его сами и требуйте надбавку за верстку!

Сначала попробуйте получить у заказчика исходник PDF - может его как раз из вашего любимого Microsoft Word конвертером PDF и сделали… Если его нет, тогда разберемся, какого вида бывают файлы PDF и как из него выудить текст.

1. PDF содержит настоящий текст (ура!). Его можно извлечь простым выделением и копированием или в обычном «Adobe Reader» (бесплатная программа для чтения PDF) в меню «Файл» выбрать «Сохранить как текст» (или иногда даже «Сохранить как текст с форматированием», если это возможно и нужно). Есть и более сложные и небесплатные варианты, о которых мы подробнее поговорим чуть позже.

1.1. PDF содержит настоящий текст (рановато радуетесь!), но неведомые силы не позволяют нам его копировать - файл защищен паролем и копирование текста запрещено. Что же делать? Либо взять пароль у заказчика, либо воспользоваться утилитой PDF Password Remover.

1.2. PDF содержит настоящий текст (рано радуетесь!). Его можно вытащить простым копированием, но… кодировка какая-то у него не та. И кроме крокозябров и цифр ничего вытащить не удается. Без паники - читаем следующий пункт.

2. PDF собран из картинок или шрифты в нем в кривых или «кривой» кодировке. Вот это уже «тяжелый случай». Тут не обойтись без обожаемого «FineReader» (ABBYY PDF Transformer не дает таких же хороших результатов как конвертер PDF, поскольку не в состоянии правильно определить все блоки автоматически. Скажем так: PDF Transformer - это урезанная автоматическая версия FineReader). За преобразование в текст тоже неплохо бы получить дополнительное вознаграждение, ведь вы расходуете ваше драгоценное время на процесс распознавания, который проходит не всегда так гладко, как хотелось бы. Но ведь заказчику-то все равно, пользуетесь вы электрословарями и средствами автоматизации или нет. Так что это ваши проблемы. :(

3. PDF собран из картинок с неподдающимся распознаванию тексту. Сочувствую. Распечатываем, забываем о всяких «продвинутых прогах», вешаем бумажку на планшет и переводим, совершенствуя свои навыки чмакания по клавиатуре.

Теперь, как и обещал, поподробнее по первому пункту. Для примера возьмем довольно сложный файл нестандартного формата бумаги с руководством к велонавеске с сайта компании Shimano: SI-41R0F-PD-M970_540_520-EN.pdf (182 Кбайт) . В нем есть все: и таблицы, и рисунки в растре, и текст в разных шрифтах и размерах. Попробуем преобразовать его по очереди разными способами.

1. В файле разрешено копирование - PDF Password Remover не требуется.
2. Текст «живой». Пробуем бесплатный способ:

Adobe Reader 7.0 или 8.0

Теперь опробуем специализированные программы-конвертеры PDF (а не конверторы!). :

Adobe Acrobat 7.0 или 8.0

Adobe Acrobat 7.0 или 8.0 Файл - Сохранить как… - *.doc, *.rtf
Лучше их и не смотреть: это ужас какой-то. И это «родной инструмент» для работы с PDF?! Текстовый формат - то же, что и в Adobe Reader.
Посмотреть сконвертированный файл:
Save as *.txt ,
Save as *.doc ,
Save as *.rtf

Solid PDF Converter 80 USD; 15,6 Mb

PDF to Word 40 USD; 4 Mb

Был выбран автоматический режим обработки. Результат, надо заметить, не плох, но для перевода мало пригоден - те же лишние знаки абзаца, неудобный текст. Здесь также представлен файл, сохраненный в Word «Как простой текст»

BCL Jade 130 USD; 2 Mb

Штука, конечно, хорошая. Только для работы BCL Jade нужен еще и сам Adobe Acrobat (не Reader). Он в него встраивается как плагин. И привыкнуть к нему придётся - «зонировать» всё придется вручную. Зато он часто справляется с такими вещами, которые другим не под силу (правда, только при условии «живого» PDF). Обычно используется для «довытаскивания» того, что не вытащил или не так вытащил Solid.

BCL easyConverter

Прямо-таки верх аскетизма! Ничего лишнего. То есть, вообще ничего: «Failed to convert» - это единственное, что удалось добиться от BCL easyConverter:(

ScanSoft PDF Converter Professional 100 USD; 434 Mb

Качаем, качаем, качаем… Что ж... скачал! И хотел бы подивиться на распрекрасный файл формата *.doc . Но вот надежды обмануты: несмотря на всю внушительность, программа выдала файл с ОТСУТСТВУЮЩИМИ фрагментами текста! Забыть как страшный сон.

Infix PDF Editor 100 USD; 10 Mb

Уже почти отчаявшись, запускаю некий Infix PDF Editor. Открываю PDF-ку, выбираю сохранить «Как простой текст»… Смотрим… И, о чудо (!) : мы получили удобоваримый в переводческой кухне текст, лишние знаки абзаца отсутствуют как класс - класс, в общем и целом, и «одобрямс» (даже RTF у них приятен глазу - размер и цвет шрифта сохранен).

И на последок бесплатные он-лайн PDF конвертеры: ZamZar и Freepdfconvert. http://www.freepdfconvert.com Встречайте! Но не забудьте: файлы с секретными данными там конвертить не стоит;)

Online PDF конвертер ZamZar.com

Этот он-лайн сервсис предназначен для конвертации всего во все и скачивания фильмов в YouTube и подобных сервисов, но в том числе умеет и конвертировать файлы PDF в форматы DOC, RTF, ODT, TXT

Текстовый файл, вылезший из недр Замзара, ужасен, а вот *.doc приятно удивил - это ПЕРВЫЙ приличный макет документа. Картинки изуродованы изрядно, но текст везде на месте. Даже со спецсимволами. Однако он совсем непригоден для перевода: чересполосица какая-то да и только плюс знаки абзаца в конце КАЖДОЙ строки.

Online PDF конвертер FreePDFConvert

А вот этот преобразователь поработал на славу: все выглядит очень прилично! И картинки нормального качества и текст. Лишние знаки абзаца (которые можно убрать макросом) стоят там, где и в самом PDF. Если работать только в виде "Разметка страницы", то "твердое четыре".

Результат перевода сервисом Freepdfconvert.com тестового PDF файла в формат Microsoft Word -

Есть он-лайн сервис и от самих создателей PDF:

Вывод: Стоит начать с самых надежных и простых программ. Если же результат неудовлетворительный, остается пробовать остальные.

Уф. Так вот он какой, этот «пе-де-эф». Надеюсь, я вам хоть немного помог. Успехов!

Формат PDF один из самых популярных для распространения в режиме «Только для чтения». Чаще всего его создают из заранее отформатированных документов doc или docx с помощью встроенных инструментов Microsoft Word 2007-2016 . Однако, в случае, если подобный файл нужно отредактировать, то лучше это делать с помощью исходного документа. При попытке конвертировать PDF, вероятнее всего, пропадет верстка, разрывы или даже целые элементы. Однако, такая возможность все равно существует.

Для этого необходимо перейти во вкладку «Файл » нажать кнопку «Открыть », затем найти в файловой системе необходимый файл и выбрать его.

Программа предупредит о том, что готовый документ может не содержать определенные стили форматирования.

Если вместо этого у вас возникает ошибка, попробуйте закрыть окно программы, и запустить Microsoft Word снова, в этот раз с правами администратора.

Открывшийся документ теперь необходимо сохранить в формате.doc. Для этого нужно перейти во вкладку «Файл » - нажать «Сохранить как». Затем указать нужное имя файла и убедиться, что в поле ниже указан необходимый формат (doc или docx).

В некоторых случаях, если Word не будет в состоянии определить, что это за документ, из чего он состоит, то он попросит вручную выставить кодировку.

Лучший вариант – выбрать стандартную кодировку Windows . Для этого нужно установить флажок. Или же в списке справа выбрать Юникод (UTF -8), что является наиболее распространенной кодировкой. В поле образец вы сможете увидеть то, как будет выглядеть будущий документ.

Также, даже если вы получили совсем не то, что ожидали увидеть, вы можете не переживать за исходный PDF файл. Он остается неизменным. Word лишь вытягивает из него информацию.

Следует отметить, что лучше всего экспериментировать с конвертированием из PDF в Word на документах, которые почти полностью состоят из текста. Если будет обилие таблиц, изображений и сложного детального форматирования – можно быть уверенным, что doc не будет выглядеть так.

В некоторых случаях, для сохранения форматирования, Word может сохранить диаграммы или любые другие элементы в виде изображений. Они будут выглядеть в точности, как PDF, но их нельзя редактировать.

Сложности с подобным форматированием заключаются в том, что PDF файлы не сохраняют связи между отдельными элементами документа, иногда даже не распознавая, что это и есть разные фрагменты.

Для версий Microsoft Word 2003-2010 функция конвертирования из PDF в doc не работает. Для проведения этой операции, нужно устанавливать расширения (желательно от проверенных разработчиков) или пользоваться сторонним ПО или онлайн-ресурсами.

PDF (пдф) - это формат, через который можно легко и удобно читать книги на компьютере. Он позволяет сохранить хорошее качество не только текста, но и изображений, поэтому часто используется в печатной продукции.

Если это просто электронная книга, которую читаешь для души, то никаких неудобств данный формат не вызывает. Но когда с таким документом приходится работать, для многих это может оказаться проблемой. Не очень понятно, как перевести его в обычный текст и, вообще, возможно ли это сделать без потери форматирования.

Сейчас мы рассмотрим наиболее простые способы перевода в Word с сохранением первоначального вида.

С помощью Microsoft Word 2013-2016

В последних версиях Microsoft Office приложение Word имеет встроенный инструмент для конвертирования pdf. Нужно просто открыть файл в этой программе, а дальше система сделает все сама.

1 . Нажимаем на кнопку «ФАЙЛ» в левом верхнем углу окна.

2 . Идем по пути Открыть → Компьютер и выбираем папку, где находится наш файл.

3 . Выбираем документ и жмем кнопку «Открыть».

Появится окно с предупреждением, которое можно не читать и сразу жать кнопку «ОК».

Вот и всё! Теперь документ можно редактировать и сохранить в обычном формате doc или docx.

Правда, разрывы страниц расположены не в тех местах, что в исходном файле, но это как-нибудь можно пережить. Главное, все таблицы и списки доступны для редактирования.

Через Adobe Reader или Foxit Reader

Если у вас старая версия MS Word, но зато есть программа Adobe Acrobat Reader или Foxit Reader (в одной из них обычно и открываются все pdf файлы), тогда конвертировать можно с помощью нее.

1 . Открываем файл в Adobe Reader или Foxit Reader и копируем нужный фрагмент документа.

Обычно достаточно просто открыть файл и он сразу же запустится в одной из этих программ (вверху будет написано, в какой именно).

Для копирования всего текста в Adobe Reader нажимаем вверху на «Редактирование» и выбираем «Копировать файл в буфер обмена».

В Foxit Reader для переноса всего текста нужно нажать на «Главная» вверху, щелкнуть по иконке буфера обмена и выбрать «Выделить все». Затем опять щелкнуть по иконке и выбирать «Копировать».

2 . Создаем документ в Ворде. Для этого щелкаем на свободном любом месте Рабочего стола правой кнопкой мыши и выбираем пункт Создать → Документ Microsoft Office Word.

А можно просто открыть программу через Пуск → Все программы → Microsoft Office → Microsoft Office Word.

3 . Вставляем в документ тот фрагмент, который мы скопировали из pdf файла. Для этого щелкаем правой кнопкой мыши по листу и в контекстном меню выбираем пункт «Вставить».

В итоге получаем тот же текст, но с возможностью редактирования. Правда, часто он добавляется с немного измененным форматированием и без изображений.

Минусы

  • Если документ большой, вставка происходит очень медленно или Ворд просто намертво виснет. А, бывает, даже небольшой текст не вставляется. Выход: выделять/копировать/вставлять по частям.
  • Не копируются изображения. Выход: делать их скриншоты, нажав на клавишу клавиатуры Print Screen, после чего вставлять в Ворд (правая кнопка - Вставить). Но придется еще обрезать и менять размер полученной картинки.
  • Иногда форматирование страдает очень сильно: шрифты, размер букв, цвета и т. д. Выход: править текст вручную.

Резюме: с обычным текстом такой вариант вполне допустим, но если в документе есть еще и таблицы, списки, изображения, лучше конвертировать другими способами.

Онлайн-сервисы для конвертирования пдф в ворд

Программы для распознавания текста:

ABBYY FineReader (платная)

WinScan2PDF (бесплатная)

Пришло время рассказать, как произвести обратное действие.

Рассмотрим, как вытащить из PDF-документа текст, так чтобы можно было потом его редактировать в Word и подобных ему текстовых редакторах. То есть, попросту говоря, будем конвертировать PDF-файлы в Word.

Adobe Reader и аналоги

Самый простой, быстрый и бесплатный вариант:
Открываем нужный PDF-документ в Adobe Reader. Заходим в меню Редактировать, потом выбираем команду “Копировать файл в буфер обмена”



Все, можно спокойно редактировать полученный текст.

Обратите внимание, при использовании данного метода не сохраняется форматирование текста и нет возможности вытащить изображения!!!

Если вам, все таки, во что бы то ни стало нужно извлечь изображение из PDF-документа,чтобы не использовать какие-нибудь программы, сделайте скриншот с экрана на котором открыт PDF-файл, из которого вы скопировали текст, но не получилось скопировать картинку.


И полученное изображение вставьте в Word. Должно получиться вот так:


Понятно, что качество изображения будет оставлять желать лучшего, но как запасной вариант вполне подойдет.

В других просмотрщиках нужно будет сделать несколько иное действие.

Вот так в Foxit Reader (меню инструменты –> команда Выделить текст):


А вот так в PDF-XChange Viewer (меню Инструменты –> Основные –> Выделение):


Затем выделяем нужный текст и производим стандартные действия с буфером обмена, для тех кто не догадался: Копировать (Ctrl+C) и в Word — Вставить (Ctrl+V).

Система оптического распознавания текста (OCR)

При всей прелести этой методики у нее есть недостаток. Конвертировать PDF в Word не получиться, если PDF-документ создан сканированием с бумажного носителя или защищен от редактирования.

Поэтому будем использовать другой метод. А имено, с помощью специальной программы оптического распознавания текста.

Программа называется ABBYY FineReader и, к сожалению, является платной. Но зато функционал этой программы позволит перекрыть любые требования по созданию и конвертированию PDF-файлов.

Вот, например, имеем отсканированный текст в PDF формате


Запускаем ABBYY FineReader и в стартовом окне выбираем Файл в Microsoft Word


И все! Система сама распознает текст и отправляет его в Word



И опять же, ни один из онлайн-сервисов не работает с изображениями, и если текст у вас отсканирован и сохранен в формате PDF, то ничего не получится. Необходимо будет рассматривать вариант OCR.

Резюмируем

Как обычно, самым удобным оказался платный вариант, но остальные имеют право на существование, потому что не каждый день требуется преобразовывать файлы PDF. А на один раз можно или скачать демо-версию или воспользоваться онлайн-сервисом.

Если нельзя, но сильно надо, то способ всегда найдется.

Да, и еще, если Вы знаете еще какой-нибудь способ преобразования PDF-файлов, напишите мне в комментариях.

Спасибо за внимание!

P.S. Лирическое отступление :