NAPS2 – łatwe skanowanie do PDF, wielostronicowe i z OCR

czas czytania: 1,5 minuty
  • Do czego: skanowanie, rozpoznawanie tekstu (OCR), dzielenie, łączenie plików PDF, obróbka i zapisywanie skanów.
  • Dla kogo: pracownicy administracji, pracownicy dydaktyczni, osoby publikujące skany dokumentów, studenci
  • Licencja: bezpłatna
  • System: Windows, macOS, Linux

W skrócie: NAPS2 to bardzo lekki, bardzo prosty w obsłudze program do obróbki PDF i skanów. Bardzo dobrze rozpoznaje tekst (OCR) ze zdjęć, czy skanowanych PDF.

NAPS2 – Not Another PDF Scanner, mimo prostoty oferuje zestaw bardzo przydatnych narzędzi. Skorzystają z nich zarówno pracownicy akademiccy, czy administracyjni, jak i studenci.

Łatwe skanowanie i obróbka obrazów

Możemy za jego pomocą zeskanować lub otworzyć obraz zeskanowanego dokumentu. NAPS2 współpracuje bez problemu z każdym skanerem zainstalowanym w systemie. Pozwala utworzyć gotowe profile skanerów i dzięki temu bardzo szybko potem wybierzemy skanowanie w kolorze, odcieniach szarości, czy w wybranej rozdzielczości. W profilach można zapisać domyślne działanie, np. skanowanie i od razu zapisanie wielostronicowych plików PDF w wybranym folderze.

Ustawienia skanowania w programie NAPS2

Program importuje też pliki PDF i najpopularniejsze pliki obrazów. Możemy w prosty sposób poprawić jakość obrazu, obrócić go i zapisać jako dokument PDF lub wysłać mailem.

Poprawianie obrazów w programie NAPS2

NAPS2 zawiera też opcję skanowania seryjnego, w której ustawiamy czas pomiędzy kolejnymi przebiegami skanera i możemy w ten sposób szybko zeskanować np. książkę, czy komplet dokumentów.

Rozpoznawanie tekstu OCR

Podczas zapisu do PDF możemy wybrać opcję rozpoznawania tekstu (OCR). Wówczas dokument PDF będzie oprócz obrazka zawierał warstwę tekstową, którą można np. skopiować do edytora tekstu, otworzyć w  programie Balabolka. Takie dokumenty PDF będą również możliwe do odczytania przy pomocy technologii wspomagających. Rozpoznawanie działa bardzo dobrze i obsługuje ponad 100 języków. Silnik rozpoznawania to Tesseract OCR — wiodące rozwiązanie Open Source, opracowane przez firmę Hewlett Packard w latach 80′ ubiegłego wieku, a następnie od 2006 roku rozwijane przez Google. Jakość rozpoznawania jest porównywalna z najlepszymi komercyjnymi rozwiązaniami, a w przypadku niektórych języków nawet lepsza.

Funkcja rozpoznawania tekstu może być szczególnie przydatna osobom, które publikują na stronach internetowych treści zeskanowanych dokumentów. Rozpoznaną treść można skopiować np. w przeglądarce Edge czy w programie Adobe Acrobat i wkleić do dokumentu w programie Word lub wstawić bezpośrednio na stronę jako tekst. Studentom przyda się do prostej digitalizacji np. treści z podręczników.

Ważne. Nie publikujemy bezpośrednio takich PDF. Choć generowane skany PDF mogą być przeczytane przez czytniki ekranu (screen readery), to nie spełniają całkowicie wytycznych ustawy o dostępności cyfrowej! Do tego jest zawsze niezbędna obróbka przy użyciu prawdziwego edytora PDF, np. Adobe Acrobat. Zalecamy skopiowanie treści i jej publikację jako DOCX lub bezpośrednio na stronie internetowej.

Pomimo pewnych ograniczeń rozpoznane dokumenty pdf są dobrym krokiem w stronę cyfrowej dostępności i znajdą wiele zastosowań.

Operacje na dokumentach PDF

Bardzo przydatną funkcją jest możliwość otworzenia w programie dokumentu PDF i zapisania do nowego pliku wybranych stron, zamiana kolejności stron. Można też kolejno otwierać kilka dokumentów PDF i zapisać je jako jeden. Warto podkreślić, że PDFy złożone z kilku spełniających wymagania dostępności cyfrowej, również będą poprawne.

Opcje PDF programu NAPS2