Transkrypcja automatyczna: Różnice pomiędzy wersjami
(uaktualnienie dla TransLab 2.0) |
|||
Linia 1: | Linia 1: | ||
== Transkrypcja automatyczna całego dokumentu == | == Transkrypcja automatyczna całego dokumentu == | ||
Po utworzeniu [[ | Po utworzeniu [[Tworzenie_nowego_projektu|nowego projektu]] oraz [[Tworzenie_nowego_projektu#Dodawanie_plików_do_projektu|dodaniu plików]], dokument można przetranskrybować [[Transkrypcja_manualna|manualnie]] lub automatycznie.<br> | ||
Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie" w widoku szczegółów | Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie (OCR)" w widoku szczegółów projektu. | ||
[[Plik: | [[Plik:019_ocr_calosci.jpg|1200px|centruj]]<br> | ||
Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij" nastąpi automatyczna transkrypcja. | Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij rozpoznawanie" nastąpi automatyczna transkrypcja. | ||
[[Plik: | [[Plik:020_ocr_okno.jpg|600px|centruj]] | ||
=== Warstwa tekstowa === | |||
Jeżeli w projekcie jest więcej niż jedna [[Warstwy tekstowe|warstwa tekstowa]], wybierz, która z nich ma zostać przetranskrybowana. | |||
=== Zakres stron === | === Zakres stron === | ||
W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.<br> | W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.<br> | ||
Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa. | Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa. | ||
=== Zakres rozpoznania === | === Zakres rozpoznania === | ||
W ramach zakresu rozpoznania dostępne są trzy opcje: " | W ramach zakresu rozpoznania dostępne są trzy opcje: "zastąp istniejący tekst w warstwie tekstowej", "uzupełnij tylko puste obszary tekstowe" oraz "rozpoznaj tylko pliki z pustą warstwą tekstową".<br> | ||
Wybranie funkcji " | Wybranie funkcji "zastąp istniejący tekst w warstwie tekstowej" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową lub całkowitą transkrypcją spowoduje wygenerowanie nowego rozpoznania i nadpisanie wyników.<br> | ||
Aby skorzystać z opcji "uzupełnij | Aby skorzystać z opcji "uzupełnij tylko puste obszary tekstowe" należy najpierw dodać obszary transkrypcji do poszczególnych stron, według instrukcji do [[Transkrypcja_manualna|transkrypcji manualnej]]. Wtedy wybranie tej opcji spowoduje automatyczne rozpoznanie tekstu w ramach wybranych wcześniej, nieuzupełnionych obszarów. Jeżeli na poszczególnych stronach obiektu nie będzie pustych obszarów transkrypcji, funkcja uzupełnienia nie wprowadzi żadnych zmian.<br> | ||
Wybranie opcji "rozpoznaj tylko pliki z pustą warstwą tekstową" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową transkrypcją spowoduje uruchomienie pełnego rozpoznania tekstu na stronach, które wcześniej nie były transkrybowane (to znaczy nie znajduje się na nich ani jeden obszar transkrypcji).<br> | |||
Wybranie opcji "tylko | === Język transkrypcji === | ||
<br> | W tym miejscu należy wybrać język, w którym napisany jest transkrybowany dokument. Jeżeli w tekście występuje kilka języków, za pomocą przycisku "+" można dodać kolejne. Kolejność języków powinna odzwierciedlać częstość występowania w tekście (począwszy od głównego).<br> | ||
=== | === Układ kolumnowy === | ||
Jeżeli transkrybowana publikacja została wydrukowana/napisana w kilku kolumnach, możesz wybrać opcję "Rozpoznaj układ kolumnowy (wolniejsze)". Dzięki temu przetranskrybowane wiersze będą rozdzielone i zachowają kolejność treści. | |||
== Transkrypcja automatyczna pojedynczej strony == | == Transkrypcja automatyczna pojedynczej strony == | ||
Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby: | Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby: | ||
# Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu. | # Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu. | ||
# W widoku transkrypcji strony kliknij przycisk [[ | # W widoku transkrypcji strony kliknij przycisk "Transkrybuj stronę automatycznie", znajdujący się w rozwijanym menu w lewym górnym rogu [[Transkrypcja_manualna#Panel transkrypcji strony|panelu transkrypcji]]. Pojawi się okno dialogowe, w którym można wybrać warstwę, zakres rozpoznania, język oraz układ kolumnowy, analogicznie do transkrypcji automatycznej całego dokumentu. | ||
[[Plik:021_ocr_strony.jpg|centruj]] | |||
== Transkrypcja automatyczna wiersza == | == Transkrypcja automatyczna wiersza == | ||
Po utworzeniu [[Transkrypcja_manualna#Dodawanie_obszaru_transkrypcji|obszaru transkrypcji]] i zaznaczeniu go, kliknij ikonę | Po utworzeniu [[Transkrypcja_manualna#Dodawanie_obszaru_transkrypcji|obszaru transkrypcji]] i zaznaczeniu go, kliknij ikonę transkrypcji wiersza na środkowej belce panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać język, analogicznie do pozostałych transkrypcji. | ||
[[Plik:022_ocr_wiersza.jpg|1000px|centruj]] |
Aktualna wersja na dzień 13:38, 10 mar 2025
Transkrypcja automatyczna całego dokumentu
Po utworzeniu nowego projektu oraz dodaniu plików, dokument można przetranskrybować manualnie lub automatycznie.
Aby skorzystać z funkcji transkrypcji automatycznej, kliknij przycisk "Transkrybuj strony automatycznie (OCR)" w widoku szczegółów projektu.
Pojawi się okno dialogowe, w którym należy określić parametry transkrypcji. Po wyborze ustawień i kliknięciu przycisku "Rozpocznij rozpoznawanie" nastąpi automatyczna transkrypcja.
Warstwa tekstowa
Jeżeli w projekcie jest więcej niż jedna warstwa tekstowa, wybierz, która z nich ma zostać przetranskrybowana.
Zakres stron
W zależności od potrzeb, możliwa jest transkrypcja wszystkich stron lub wybranego zakresu.
Ponieważ czas trwania transkrypcji zależy od liczby stron, warto rozważyć podzielenie jej na mniejsze etapy. Podczas transkrypcji fragmentu publikacji praca nad pozostałą jej częścią jest niemożliwa.
Zakres rozpoznania
W ramach zakresu rozpoznania dostępne są trzy opcje: "zastąp istniejący tekst w warstwie tekstowej", "uzupełnij tylko puste obszary tekstowe" oraz "rozpoznaj tylko pliki z pustą warstwą tekstową".
Wybranie funkcji "zastąp istniejący tekst w warstwie tekstowej" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową lub całkowitą transkrypcją spowoduje wygenerowanie nowego rozpoznania i nadpisanie wyników.
Aby skorzystać z opcji "uzupełnij tylko puste obszary tekstowe" należy najpierw dodać obszary transkrypcji do poszczególnych stron, według instrukcji do transkrypcji manualnej. Wtedy wybranie tej opcji spowoduje automatyczne rozpoznanie tekstu w ramach wybranych wcześniej, nieuzupełnionych obszarów. Jeżeli na poszczególnych stronach obiektu nie będzie pustych obszarów transkrypcji, funkcja uzupełnienia nie wprowadzi żadnych zmian.
Wybranie opcji "rozpoznaj tylko pliki z pustą warstwą tekstową" dla nowego obiektu (czyli takiego, nad którym nie były prowadzone prace w TransLab) spowoduje uruchomienie pełnego rozpoznania tekstu na plikach graficznych. Wybranie tej funkcji dla obiektu z częściową transkrypcją spowoduje uruchomienie pełnego rozpoznania tekstu na stronach, które wcześniej nie były transkrybowane (to znaczy nie znajduje się na nich ani jeden obszar transkrypcji).
Język transkrypcji
W tym miejscu należy wybrać język, w którym napisany jest transkrybowany dokument. Jeżeli w tekście występuje kilka języków, za pomocą przycisku "+" można dodać kolejne. Kolejność języków powinna odzwierciedlać częstość występowania w tekście (począwszy od głównego).
Układ kolumnowy
Jeżeli transkrybowana publikacja została wydrukowana/napisana w kilku kolumnach, możesz wybrać opcję "Rozpoznaj układ kolumnowy (wolniejsze)". Dzięki temu przetranskrybowane wiersze będą rozdzielone i zachowają kolejność treści.
Transkrypcja automatyczna pojedynczej strony
Automatyczna transkrypcja pojedynczej strony jest możliwa na dwa sposoby:
- Wybierz zakres jednej strony, korzystając z funkcji automatycznej transkrypcji całego dokumentu.
- W widoku transkrypcji strony kliknij przycisk "Transkrybuj stronę automatycznie", znajdujący się w rozwijanym menu w lewym górnym rogu panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać warstwę, zakres rozpoznania, język oraz układ kolumnowy, analogicznie do transkrypcji automatycznej całego dokumentu.
Transkrypcja automatyczna wiersza
Po utworzeniu obszaru transkrypcji i zaznaczeniu go, kliknij ikonę transkrypcji wiersza na środkowej belce panelu transkrypcji. Pojawi się okno dialogowe, w którym można wybrać język, analogicznie do pozostałych transkrypcji.