7 бесплатных программ для работы c pdf

В этих программах можно читать и аннотировать PDF, редактировать текст, разбивать, сжимать, обрезать файлы, а также конвертировать PDF в другие форматы.

Sumatra PDF – бесплатный просмотрщик PDF

По заверениям автора программы, название программы не имеет ничего общего с названием индонезийского острова Суматра. Программа загружается с сайта разработчика программы — Кжиштофа Ковальчика.

Sumatra PDF скачать

С сайта разработчика можно загрузить обычную версию программы, или переносную (portable) версию программы.

Переносная (portable) версия программы состоит из одного «exe» файла, она не требует установки, не оставляет записей в реестре, и может запускаться с любого места, например, с переносного устройства — USB флеш накопителя.

Программа быстро работает и имеет простой понятный интерфейс. Преимуществом в использовании данной программы является более низкое потребление памяти и системных ресурсов, чем у других аналогичных программ, например, у Adobe Reader.

В переносной версии программы нужно просто запустить файл, а при установке обычной версии программы, после запуска установочного файла, открывается окно для установки программы.

В этом окне вы можете нажать на кнопку «Install SumatraPDF» для установки программы в настройках по умолчанию, или нажать на кнопку «Options».

Если вы нажали на кнопку «Options», то появится окно с параметрами установки программы. По умолчанию параметры установки не активированы.

Активировав соответствующие пункты можно использовать программу Sumatra PDF, как просмотрщик PDF по умолчанию, а также загрузить плагины для просмотра файлов PDF для основных браузеров (браузер Internet Explorer поддерживается).

Если раньше плагин для просмотра файлов формата PDF, был установлен в браузер другой подобной программой, то его следует удалить с браузера. Потом для этих целей нужно будет использовать плагин для программы Sumatra PDF, после его установки на компьютер. Как это сделать, подробно описано на сайте автора программы.

После нажатия на кнопку «Install SumatraPDF» происходит установка программы, и открывается окно, в котором нужно нажать на кнопку «Start SumatraPDF».

Программа запускается и на «Рабочем столе» открывается окно программы на русском языке. В верхней части окна программы находится панель меню. Во вкладках меню можно настроить программу по своему усмотрению и осуществлять оттуда управление программой.

Команды меню стандартные и наглядные, их предназначение понятно любому пользователю. Программой можно управлять также с помощью клавиатуры, список используемых для этого кнопок клавиатуры можно посмотреть на сайте разработчика.

Для изменения настроек программы необходимо войти в меню «Настройки» => «Параметры…».

После этого открывается окно «Параметры SumatraPDF». В этом окне можно изменить параметры программы.

Вам также может быть интересно:

  • STDU Viewer — просмотр и чтение электронных книг и документов
  • Как сохранить файл в PDF — 3 способа

Можно нажать на кнопку «Ассоциировать SumatraPDF с файлами PDF», если этого вы не сделали раньше. Файлы PDF можно не ассоциировать с программой Sumatra PDF, а просто вручную открывать этой программой. Потом, если это потребуется в дальнейшем, можно будет сменить ассоциацию файлов на другую программу.

Также, в этом окне, можно снять флажок напротив пункта «Запоминать открытые файлы», потому что таких файлов может быть огромное количество. Но, кому-то, наоборот, список открытых ранее файлов с помощью этой программы будет нужен.

Программа после ассоциации с файлами PDF, будет открывать такие файлы, после клика по соответствующему файлу PDF.

Для ассоциации программы Sumatra PDF с файлами других форматов, нужно щелкнуть по файлу правой кнопкой мыши, а после в контекстном меню выбрать пункт «Открыть с помощью…».

В окне «Выбор программы» нужно нажать на кнопку «Обзор…». В окне Проводника необходимо выбрать программу Sumatra PDF, а потом нажать на кнопку «Открыть».

В окне «Выбор программы» следует активировать пункт «Использовать выбранную программу для всех файлов такого типа», а потом нажать на кнопку «ОК».

Файлы можно открывать и из главного окна программы, нажав для этого на ссылку в окне программы «Открыть документ…», а также из меню «Файл» => «Открыть…». В окне Проводника необходимо выбрать нужный файл, а затем нажать на кнопку «Открыть».

На этом изображении в программе Sumatra PDF открыта книга в формате PDF.

На этом изображении открыта книга в формате DjVu.

А на этом изображении открыта книга в формате FB2.

Программа для работы с PDF-документами — PDF Shaper Professional 8.2 RePack (& Portable) by elchupakabra

Русская/английская зарегистрированная и портативная версии в одном инсталляторе! PDF Shaper – мощная программа для работы с PDF-документами, которая предоставляет коллекцию инструментов и утилит для модификации и оптимизации PDF-файлов и их содержимого. Благодаря этой программе вы сможете легко разделять и объединять PDF-документы, извлекать тексты и графику из PDF-файлов, шифровать/расшифровывать документ при помощи пароля, изменять права пользователя, конвертировать изображения в PDF и наоборот, преобразовывать DOC/DOCX в PDF.Системные требования:Windows 10, Windows 8, Windows 7, Windows Vista, Windows XP, Windows 2012, 2008, 2003Торрент Программа для работы с PDF-документами — PDF Shaper Professional 8.2 RePack (& Portable) by elchupakabra подробно:Основные возможности:·Разделение и объединение PDF документов·Преобразование PDF документов в изображения·Конвертирование изображений в PDF файлы·Извлечение страниц, текста и изображений из PDF файлов·Преобразование Word DOC в PDF и PDF в RTF·Добавление, изменение или удаление информации в PDF·Поворот, удаление, обрезка отдельных страниц·Шифрование / расшифровка PDF и установка разрешения пользователя·Добавление водяного знака или удаление изображений из PDFЧто нового в версии:New Features• New icon for PDF files.• Option to numerate pages in PDF document (Watermark tool).• Option to add multi-line text as watermark (including Unicode).• Ability to add image, text and page numbers as watermark on same page.• Support of system TrueType fonts, codepages and styles.• Option to select pages for PDF to Image conversion.Enhancements• Updated user interface and translations.• Improvements to text detection and extraction.• Improved program’s performance and stability.Bug Fixes• Fixed bug with merging PDF files from command line.• Fixed bug with rotating first page even if it was skipped in pages.• Fixed bug with displaying rotated and cropped PDF files in PDF Viewer.• Fixed bug with loading PNG image for Image to PDF conversion.• Resolved problem with processing protect PDF documents in some tools.• Minor bug fixes and improvements.Особенности перепаковки:1. Совмещённые в одном дистрибутиве установка программы или распаковка портативной версии (Portableapps)2. Не требует регистрации (патч RadiXX11)3. Язык интерфейса русский/английский (выбор при установке)4

Подхватывает файл настроек pdfshaper.ini, если таковой находится рядом с инсталлятором»Тихая» установка с ключами /SILENT или /VERYSILENT (или файлом «Тихая установка.cmd»)Для «Тихой» установки портативной версии дополнительный ключ /PORTABLE=1 (или файлом «Распаковка portable.cmd»)ВНИМАНИЕ!!! Возможно ЛОЖНОЕ срабатывание антивирусов на «лекарство» (файл SHFolder.dll).Примечание!!! Во время установки будет предложено посетить сайт автора репака. Снимаем галочку по желанию.
Скриншоты Программа для работы с PDF-документами — PDF Shaper Professional 8.2 RePack (& Portable) by elchupakabra торрент: Скачать Программа для работы с PDF-документами — PDF Shaper Professional 8.2 RePack (& Portable) by elchupakabra через торрент:

pdf-shaper-professional-8.2-repack-portable-by-elchupakabra.torrent (cкачиваний: 224)

Инструменты и библиотеки

Спектр доступных решений для связанных с Python инструментов, модулей и библиотек PDF немного сбивает с толку. Требуется время, чтобы понять, что к чему и какие проекты постоянно поддерживаются. Наше исследование позволило отобрать тех кандидатов, которые соответствуют современным требованиям:

  1.  — библиотека для извлечения информации и содержимого документов, постраничного разделения документов, объединения документов, обрезки страниц и добавления водяных знаков. PyPDF2 поддерживает как незашифрованные, так и зашифрованные документы.
  2.  — позиционируется как «быстрая и удобная библиотека чистого PDF» и реализована как оболочка для PDFMiner, и . Основная идея заключается в том, чтобы «надежно извлекать данные из наборов PDF‑файлов, используя как можно меньше кода».
  3.  — расширение библиотеки , которое позволяет анализировать и конвертировать PDF‑документы. Не следует его путать с с таким же именем.
  4.  — амбициозная промышленная библиотека, в основном ориентированная на оздание высококачественных PDF‑документов. Доступны как свободная версия с открытым исходным кодом, так и коммерческая, улучшенная, версия ReportLab PLUS.
  5.  — чистый анализатор PDF на основе Python для чтения и записи PDF. Он точно воспроизводит векторные форматы без растеризации. Вместе с ReportLab он помогает повторно использовать части существующих PDF‑файлов в новых PDF‑файлах, созданных с помощью ReportLab.

В своём исследовании мы учитывали мнения Github-сообщества, а именно:

  • Звёзды Github: общее количество звезд проекта, выставленных пользователям.
  • Релизы Github: количество релизов каждого проекта, что отражает активность работы над проектом и его зрелость.
  • Fork-и Github: количество, сделанных копий каждого проекта, что показывает популярность использования проекта в собственных работах.
Библиотека Использование  Github ReleasesGithub  Github
Чтение 2 972 10 751
Чтение 474 59 111
Чтение 20 4
Чтение 85 69
Чтение 971 23 200
Чтение 1 599 11 1 400
Чтение 477 1 70
Чтение, Запись/Создание 1 145 4 187
Запись/Создание 31 48 22
Запись/Создание 23 26 7
Запись/Создание 457 7 174

Читать это руководство, не прорабатывая приведённые в нём примеры, бессмысленно. Поэтому, вооружимся и воспользуемся менеджером пакетов или pip3 для установки PyPDF2 и PyMuPDF. Наберём в командной строке (Windows):

pip3 install pypdf2
pip3 install pymupdf

Для того, что бы не запутаться создадим папочку для своего проекта. Как видите местом для неё выбрана папка «Документы» стандартной установки Windows.Вот так это выглядит в Windows

Папки и будем использовать для записи результатов работы своих программ, а в папке храним исходные PDF‑файлы, сами скрипты будем хранить в корне. Кстати, все примеры этой серии статей о работе с PDF‑файлами есть на , откуда их можно забрать и использовать в качестве «кирпича» для своих упражнений

Найти все страницы, где есть заданный текст

Этот скрипт довольно практичен и работает аналогично . Используя PyMuPDF, скрипт возвращает все номера страниц, которые содержат заданную строку поиска. Страницы загружаются одна за другой и с помощью метода обнаруживаются все вхождения строки поиска. В случае совпадения соответствующее сообщение печатается на :

import fitz

filename = "source/Computer-Vision-Resources.pdf"

search_term = "COMPUTER VISION"  
pdf_document = fitz.open(filename)

for current_page in range(len(pdf_document)):  
    page = pdf_document.loadPage(current_page)
    if page.searchFor(search_term):
        print("%s найдено на странице %i" % (search_term, current_page+1))

Результаты поиска COMPUTER VISION

Методы, показанные здесь, довольно мощные. Сравнительно небольшое количество строк кода позволяет легко получить результат. Другие варианты применения рассматриваются во второй части, посвященной добавлению водяного знака и картинок в PDF.

Продолжение цикла статей-конспектов на сайте

Источники вдохновения:

Работа с PDF-файлами в Python (часть I): чтение и разбор, опубликовано К ВВ, лицензия — Creative Commons Attribution-NonCommercial 4.0 International.

Извлечение текста с помощью PyPDF2

Начнём с . Ниже приведен скрипт, который позволяет извлечь из PDF‑файла текст и вывести него в консоль.

Сначала импортируем , помня о том, что пакет уже установлен. Задаём имя файла из папки (можете загрузить туда свой файл и поменять в скрипте на имя загруженного файла), открывает документ и получаем информацию о документе, используя метод и общее количество страниц . Далее в цикле читаем каждую страницу, получаем содержимое и печатаем в .

Обратите внимание, что PyPDF2 начинает считать страницы с 0, и поэтому вызов при извлекает первую страницу документа

from PyPDF2 import PdfFileReader

pdf_document = "source/Computer-Vision-Resources.pdf"
with open(pdf_document, "rb") as filehandle:  
    pdf = PdfFileReader(filehandle)
   
    info = pdf.getDocumentInfo()
    pages = pdf.getNumPages()
    print("Количество страниц в документе: %i\n\n" % pages)
    print("Мета-описание: ", info)

    for i in range(pages):
        page = pdf.getPage(i)
        print("Стр.", i, " мета: ", page, "\n\nСодержание;\n")
        print(page.extractText())

Извлечение текста с помощью PyPDF2

Как видите, извлеченный текст печатается сплошным потоком. Здесь нет ни абзацев, ни разделений предложений. Как указано в документации по PyPDF2, все текстовые данные возвращаются в том порядке, в котором они представлены на странице. В основном, это зависит от внутренней структуры документа PDF и от того, как поток инструкций, создан во время его записи, поэтому их использование может привести к неожиданностям, надо дополнительно «парсить», не очень удобно.

Обзор возможностей Sumatra PDF

Основные возможности программы Sumatra PDF:

  • поддержка большого количества форматов;
  • быстрое открытие файлов;
  • поиск по открытому документу;
  • копирование в буфер обмена (при наличии текстового слоя);
  • поддержка печати.

После обновления программа Sumatra PDF стала поддерживать просмотр новых форматов: «ePUB», «MOBI» и «FB2». Это позволяет мне вам сказать, что теперь эту программу можно использовать как универсальный просмотрщик файлов электронных форматов документов. Конечно, за исключением документов различных офисных форматов.

Программа Sumatra PDF работает в операционной системе Windows и поддерживает форматы:

«PDF», «DjVu», «XPS», «CHM», «CBR», «CBZ», «ePUB», «FB2», «MOBI».

Согласитесь, что это весьма неплохой набор форматов для такой небольшой бесплатной программы. Программа Sumatra PDF может быть использована на вашем компьютере, как программа просмотрщик PDF, просмотрщик DjVu, просмотрщик FB2, а также как просмотрщик файлов некоторых других форматов.

В формате PDF сохраняются документы, книги, инструкции, журналы и т. д. Преимуществом этого формата является то, что документ, открытый в этом формате, будет одинаково отображаться на любом компьютере или устройстве.

В формате DjVu также в основном, сохраняется точно такая же литература, как и в формате PDF. Преимуществом этого формата перед  PDF является существенно меньший размер файла этого формата.

В программе Sumatra PDF можно открывать также файлы, сохраненные в других форматах — в форматах для сохранения комиксов Comic Book Archive (CBR и CBZ), в формате файла справки (CHM), в форматах для сохранения электронных книг (ePUB, MOBI и FB2), и еще в некоторых других форматах.

Основная часть художественной и значительная часть остальной литературы сейчас сохраняется в форматах ePUB в Европе, и в FB2 в странах бывшего СССР, где формат FB2 стал неофициальным стандартом для сохранения такой литературы.

Популярность этих форматов объясняется маленьким размером файла, по сравнению с другими форматами. Поэтому такие файлы легче открываются в устройствах для чтения электронных книг (букридерах, планшетах, смартфонах и т. д.), и занимают значительно меньший объем в месте своего хранения.

А теперь перейдем непосредственно к обзору программы Sumatra PDF.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделитесь с друзьями:
Технарь
Добавить комментарий

Нажимая на кнопку "Отправить комментарий", я даю согласие на обработку персональных данных и принимаю политику конфиденциальности.