Transkrypcja automatyczna: Różnice pomiędzy wersjami

Z Wiki BUWr
Przejdź do nawigacji Przejdź do wyszukiwania
(zamiana linków na wewnętrzne)
(uaktualnienie dla TransLab 2.0)
 
(Nie pokazano 1 pośredniej wersji utworzonej przez tego samego użytkownika)
Linia 1: Linia 1:
== Transkrypcja automatyczna całego dokumentu ==
== Transkrypcja automatyczna całego dokumentu ==
Po utworzeniu [[Tworzenie_nowej_transkrypcji|nowej transkrypcji]] oraz [[Tworzenie_nowej_transkrypcji#Dodawanie_plików_do_transkrypcji|dodaniu plików]], dokument można przetranskrybować [[Transkrypcja_manualna|manualnie]] lub automatycznie.<br>
Po utworzeniu [[Tworzenie_nowego_projektu|nowego projektu]] oraz [[Tworzenie_nowego_projektu#Dodawanie_plików_do_projektu|dodaniu plików]], dokument można przetranskrybować [[Transkrypcja_manualna|manualnie]] lub automatycznie.<br>
Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie" w widoku szczegółów transkrypcji.
Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie (OCR)" w widoku szczegółów projektu.
[[Plik:Transkrypcja automatyczna 01.jpg|1200px|centruj]]<br>
[[Plik:019_ocr_calosci.jpg|1200px|centruj]]<br>
Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij" nastąpi automatyczna transkrypcja.
Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij rozpoznawanie" nastąpi automatyczna transkrypcja.
[[Plik:Transkrypcja automatyczna 02.jpg|ramka|centruj]]
[[Plik:020_ocr_okno.jpg|600px|centruj]]
=== Warstwa tekstowa ===
Jeżeli w projekcie jest więcej niż jedna [[Warstwy tekstowe|warstwa tekstowa]], wybierz, która z nich ma zostać przetranskrybowana.
=== Zakres stron ===
=== Zakres stron ===
W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.<br>
W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.<br>
Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa.
Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa.
=== Zakres rozpoznania ===
=== Zakres rozpoznania ===
W ramach zakresu rozpoznania dostępne są trzy opcje: "nadpisz istniejącą transkrypcję", "uzupełnij istniejącą transkrypcję" oraz "tylko pliki bez transkrypcji".<br>
W ramach zakresu rozpoznania dostępne są trzy opcje: "zastąp istniejący tekst w warstwie tekstowej", "uzupełnij tylko puste obszary tekstowe" oraz "rozpoznaj tylko pliki z pustą warstwą tekstową".<br>


Wybranie funkcji "nadpisz istniejącą transkrypcję" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w WLT) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową lub całkowitą transkrypcją spowoduje nadpisanie wyników.<br>
Wybranie funkcji "zastąp istniejący tekst w warstwie tekstowej" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową lub całkowitą transkrypcją spowoduje wygenerowanie nowego rozpoznania i nadpisanie wyników.<br>


Aby skorzystać z opcji "uzupełnij istniejącą transkrypcję" należy najpierw dodać obszary transkrypcji do poszczególnych stron, według instrukcji do [[Transkrypcja_manualna|transkrypcji manualnej]]. Wtedy wybranie tej opcji spowoduje automatyczne rozpoznanie tekstu w ramach wybranych wcześniej, nieuzupełnionych obszarów. Jeżeli na poszczególnych stronach obiektu nie będzie pustych obszarów transkrypcji, funkcja uzupełnienia nie wprowadzi żadnych zmian.<br>
Aby skorzystać z opcji "uzupełnij tylko puste obszary tekstowe" należy najpierw dodać obszary transkrypcji do poszczególnych stron, według instrukcji do [[Transkrypcja_manualna|transkrypcji manualnej]]. Wtedy wybranie tej opcji spowoduje automatyczne rozpoznanie tekstu w ramach wybranych wcześniej, nieuzupełnionych obszarów. Jeżeli na poszczególnych stronach obiektu nie będzie pustych obszarów transkrypcji, funkcja uzupełnienia nie wprowadzi żadnych zmian.<br>
 
Wybranie opcji "rozpoznaj tylko pliki z pustą warstwą tekstową" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową transkrypcją spowoduje uruchomienie pełnego rozpoznania tekstu na stronach, które wcześniej nie były transkrybowane (to znaczy nie znajduje się na nich ani jeden obszar transkrypcji).<br>
Wybranie opcji "tylko strony bez transkrypcji" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w WLT) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową transkrypcją spowoduje uruchomienie pełnego rozpoznania tekstu na stronach, które wcześniej nie były transkrybowane (to znaczy nie znajduje się na nich ani jeden obszar transkrypcji).<br>
=== Język transkrypcji ===
<br>
W tym miejscu należy wybrać język, w którym napisany jest transkrybowany dokument. Jeżeli w tekście występuje kilka języków, za pomocą przycisku "+" można dodać kolejne. Kolejność języków powinna odzwierciedlać częstość występowania w tekście (począwszy od głównego).<br>
=== Profil rozpoznania ===
=== Układ kolumnowy ===
Profil rozpoznania określa język, w jakim jest napisany dokument przeznaczony do transkrypcji. Obecnie możliwa jest transkrypcja w języku polskim, angielskim, niemieckim, francuskim, łacińskim i rosyjskim.
Jeżeli transkrybowana publikacja została wydrukowana/napisana w kilku kolumnach, możesz wybrać opcję "Rozpoznaj układ kolumnowy (wolniejsze)". Dzięki temu przetranskrybowane wiersze będą rozdzielone i zachowają kolejność treści.
== Transkrypcja automatyczna pojedynczej strony ==
== Transkrypcja automatyczna pojedynczej strony ==
Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby:
Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby:
# Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu.
# Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu.
# W widoku transkrypcji strony kliknij przycisk [[Plik:Transkrypcja automatyczna strony.jpg]]. Pojawi się okno dialogowe, w którym można wybrać zakres oraz profil rozpoznania, analogicznie do transkrypcji automatycznej całego dokumentu.
# W widoku transkrypcji strony kliknij przycisk "Transkrybuj stronę automatycznie", znajdujący się w rozwijanym menu w lewym górnym rogu [[Transkrypcja_manualna#Panel transkrypcji strony|panelu transkrypcji]]. Pojawi się okno dialogowe, w którym można wybrać warstwę, zakres rozpoznania, język oraz układ kolumnowy, analogicznie do transkrypcji automatycznej całego dokumentu.
[[Plik:021_ocr_strony.jpg|centruj]]
== Transkrypcja automatyczna wiersza ==
== Transkrypcja automatyczna wiersza ==
Po utworzeniu [[Transkrypcja_manualna#Dodawanie_obszaru_transkrypcji|obszaru transkrypcji]] i zaznaczeniu go, kliknij ikonę [[Plik:Transkrypcja wiersza 01.jpg]]. Pojawi się okno dialogowe, w którym można wybrać profil rozpoznania, analogicznie do pozostałych transkrypcji.
Po utworzeniu [[Transkrypcja_manualna#Dodawanie_obszaru_transkrypcji|obszaru transkrypcji]] i zaznaczeniu go, kliknij ikonę transkrypcji wiersza na środkowej belce panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać język, analogicznie do pozostałych transkrypcji.
[[Plik:022_ocr_wiersza.jpg|1000px|centruj]]

Aktualna wersja na dzień 13:38, 10 mar 2025

Transkrypcja automatyczna całego dokumentu

Po utworzeniu nowego projektu oraz dodaniu plików, dokument można przetranskrybować manualnie lub automatycznie.
Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie (OCR)" w widoku szczegółów projektu.

019 ocr calosci.jpg


Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij rozpoznawanie" nastąpi automatyczna transkrypcja.

020 ocr okno.jpg

Warstwa tekstowa

Jeżeli w projekcie jest więcej niż jedna warstwa tekstowa, wybierz, która z nich ma zostać przetranskrybowana.

Zakres stron

W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.
Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa.

Zakres rozpoznania

W ramach zakresu rozpoznania dostępne są trzy opcje: "zastąp istniejący tekst w warstwie tekstowej", "uzupełnij tylko puste obszary tekstowe" oraz "rozpoznaj tylko pliki z pustą warstwą tekstową".

Wybranie funkcji "zastąp istniejący tekst w warstwie tekstowej" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową lub całkowitą transkrypcją spowoduje wygenerowanie nowego rozpoznania i nadpisanie wyników.

Aby skorzystać z opcji "uzupełnij tylko puste obszary tekstowe" należy najpierw dodać obszary transkrypcji do poszczególnych stron, według instrukcji do transkrypcji manualnej. Wtedy wybranie tej opcji spowoduje automatyczne rozpoznanie tekstu w ramach wybranych wcześniej, nieuzupełnionych obszarów. Jeżeli na poszczególnych stronach obiektu nie będzie pustych obszarów transkrypcji, funkcja uzupełnienia nie wprowadzi żadnych zmian.
Wybranie opcji "rozpoznaj tylko pliki z pustą warstwą tekstową" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową transkrypcją spowoduje uruchomienie pełnego rozpoznania tekstu na stronach, które wcześniej nie były transkrybowane (to znaczy nie znajduje się na nich ani jeden obszar transkrypcji).

Język transkrypcji

W tym miejscu należy wybrać język, w którym napisany jest transkrybowany dokument. Jeżeli w tekście występuje kilka języków, za pomocą przycisku "+" można dodać kolejne. Kolejność języków powinna odzwierciedlać częstość występowania w tekście (począwszy od głównego).

Układ kolumnowy

Jeżeli transkrybowana publikacja została wydrukowana/napisana w kilku kolumnach, możesz wybrać opcję "Rozpoznaj układ kolumnowy (wolniejsze)". Dzięki temu przetranskrybowane wiersze będą rozdzielone i zachowają kolejność treści.

Transkrypcja automatyczna pojedynczej strony

Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby:

  1. Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu.
  2. W widoku transkrypcji strony kliknij przycisk "Transkrybuj stronę automatycznie", znajdujący się w rozwijanym menu w lewym górnym rogu panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać warstwę, zakres rozpoznania, język oraz układ kolumnowy, analogicznie do transkrypcji automatycznej całego dokumentu.
021 ocr strony.jpg

Transkrypcja automatyczna wiersza

Po utworzeniu obszaru transkrypcji i zaznaczeniu go, kliknij ikonę transkrypcji wiersza na środkowej belce panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać język, analogicznie do pozostałych transkrypcji.

022 ocr wiersza.jpg