Child pages
  • Wprowadzenie do Wirtualnego Laboratorium Transkrypcji
Skip to end of metadata
Go to start of metadata
  1. Aby  założyć konto w Wirtualnym Laboratorium Transkrypcji (WLT, http://wlt.synat.pcss.pl) należy się zarejestrować na stronie http://wlt.synat.pcss.pl/wlt-web/register.xhtml.


    Po rejestracji na adres mailowy podany w formularzu zostanie wysłana wiadomość zawierająca link aktywacyjny. Należy w niego kliknąć lub skopiować go do paska adresowego przeglądarki. Link aktywacyjny jest ważny przez ograniczony okres czasu.

  2. Po rejestracji można się zalogować (http://wlt.synat.pcss.pl/wlt-web/login.xhtml):



  3. Aby rozpocząć pracę z WLT należy utworzyć nowy projekt (http://wlt.synat.pcss.pl/wlt-web/new-project.xhtml):


    Należy wpisać kolejno: Nazwę projektu, Autora, Tytuł, Język(i) tekstu, Typ tekstu (drukowany, rękopis, inny) a następnie zaakceptować regulamin.

  4. Po kliknięciu „Stwórz nowy projekt”, nowy projekt pojawia się w profilu użytkownika (http://wlt.synat.pcss.pl/wlt-web/user.xhtml). 



  5. Po kliknięciu w tytuł projektu wchodzimy na stronę projektu, na której możemy edytować metadane projektu, zarządzać uprawnieniami, dodać nowe pliki, transkrybować, poddać OCRowi lub dodać istniejącą transkrypcję.




    Co to wszystko oznacza? 

  6. Opcja „OCR” jest jednym z najważniejszych narzędzi dostępnych w WLT.  Skrót OCR pochodzi od angielskiego Optical Character Recognition czyli optycznego rozpoznawania znaków na skanie dokumentów; Można powiedzieć, że OCR wyciąga tekst z obrazu. Po kliknięciu w „OCR” wyświetla się strona dokumentu, na której można zaznaczyć obszar tekstu, który ma być poddany procesowi rozpoznawania znaków. 


    Z listy „profili rozpoznawania” należy wybierać język dokumentu, w tym przypadku „pol” czyli polski.  

  7. Wyniki rozpoznawania znaków otrzymujemy po chwili od kliknięcia w „Zacznij OCR”


    Wyniki te (tekst wraz z jego współrzędnymi) można zaimportować do projektu; można również importować tylko rozpoznane współrzędne linii, aby samemu wpisać tekst dokumentu. 

  8. Zaimportowane wyniki OCRa zostaną zaprezentowane w edytorze transkrypcji. Po lewej stronie ekranu widoczny jest podgląd całej transkrypcji (widok ten jest domyślnie ukryty).



  9. Klikając dwukrotnie na konkretną linię w edytorze, możemy otworzyć opcje edycji.
    Są to:

  1. Edycja konkretnej linii. Należy pamiętać, żeby po edytowaniu danej linii wcisnąć „enter”, tylko w taki sposób zatwierdza się poprawioną linię. 


2. Usuwanie konkretnej linii.
3. Uruchamia OCR konkretnej linii/obszarze skanu.
4. Przenosi linię o jedną pozycję w górę.
5. Przenosi linię o jedną pozycję w dół.

6. Przenosi linię na konkretną pozycję

10. Innymi opcjami ułatwiającymi pracę w edytorze transkrypcji są przyciski w prawym górnym rogu ekranu 


Można przy ich pomocy przerzucić stronę dokumentu, zaznaczyć nowy obszar tekstu do rozpoznania, poddać OCRowi, podejrzeć dokument, zweryfikować całą stronę, powiększyć lub pomniejszyć oraz powrócić do strony projektu. 

11. Inną opcją dostępną na stronie projektu jest „Pobranie pliku hOCR”, co oznacza po prostu pobranie wyników OCR w formie ciągłego tekstu na komputer.
  • No labels