Subtitle Workshop 2.51 magyar OCR hibajavítófájl

Elkészült a Subtitle Workshop 2.51 magyar OCR hibajavítófájl. A szövegfelismerő (OCR) technikával rippelt (illetve más nyelvű OCR hibajavítófájllal elrontott)  feliratokban előforduló karakterfelcserélési típushibákat próbálja kiszűrni.

Letölthető innen. A C:Program FilesURUSoftSubtitle WorkshopOCR Scripts mappába kell bemásolni.

Az SW indítása után az Eszközök/Információ és hibák/Beállítások… menüponttal vagy  Alt+I billentyűkombinációval lehet a Hibakeresés beállításai párbeszédablakot megnyitni.

http://pics.coldline.hu/pics/199536-20110323-SsgCZv.jpg

 

 

 

 

 

Az Általános fülön az OCR parancsfájl mezőben lehet kiválasztani a magyar nyelvűt (vagy a főablak bal paneljának legalsó mezőjében vagy az Eszközök/Információ és hibák/OCR parancsfájlok menüpontban). A Szerkesztés gombra kattintva a megnyíló fájl személyre is szabható. A bekapcsoláshoz a Keresés és a Javítás fülön az OCR hibáknál kell pipát tenni, végül az OK gombra kattintani.

http://pics.coldline.hu/pics/199537-20110323-j1Pe76.jpg http://pics.coldline.hu/pics/199538-20110323-UOqJF0.jpg

 

 

 

 

 

A megfelelő beállítások után a hibakereső párbeszédablaka az Eszközök/Információ és hibák/ Információ és hibák… menüpontban vagy a Ctrl+I billentyűkombinációval nyitható meg. A felugró hibakereső ablakban kilistázódnak a megtalált hibák. Itt a Hibák javítása gombra kattintva a program megpróbálja javítani az összes olyan hibát, ami a Beállítások/Javítás fülön be van pipálva. Részletes leírás a hibakeresőről itt olvasható.

A magyar OCR hibajavítófájl működésének alapjául az S to the G által rippelés során összegyűjtött szabályok szolgálnak.

Kijavítja az I és l felcserélődéseket:

  • lgen, ltt, lngyen –> Igen, Itt, Ingyen
  • Iedob –>ledob
  • EI –>El
  • haIIottam –> hallottam
  • felüI –>felül
  • errőI –>erről

A két alsó és a két felső vesszőt idézőjellé alakítja.

A .:  !.  ?.  :. karakterkombinációknál törli a felesleges pontokat.

%-jellé alakítja @/@  @%@  @%  %@ karakterkombinációkat.

http://pics.coldline.hu/pics/199546-20110323-ZS0Jkm.jpg http://pics.coldline.hu/pics/199540-20110323-x5Pr1Y.jpg

 

 

 

 

 

Ezek a rippeléssel kapcsolatos leggyakoribb hibák. Akinek vannak további ötletei gyakorlati tapasztalatok alapján, kérjük, írja meg!

OCR hibajavítófájlt akármennyit lehet csinálni, majd a programból kiválasztani. A listát mindenki bővítheti magának, mert nem nehéz átlátni, hogyan működik.

 

<ERROR Find="(mindíg)" ReplaceBy="mindig">

<ERROR Find="(előről|előröl|elöllről)" ReplaceBy="elölről"
ahol a ‘|’ jelenti a ‘vagy’ kapcsolatot

<ERROR Find="Szerintem(,)" ReplaceBy="">
Szerintem után nem kell vessző

<ERROR Find="[t|T]öbb(,) mint [0-9]" ReplaceBy="">
[0-9]: bármilyen szám

 

A zárójelbe rakott részeket van lehetőség cserélni, miközben definiálható a szövegkörnyezetet is.

7 Thoughts on “Subtitle Workshop 2.51 magyar OCR hibajavítófájl

  1. MorTuadh on 2011. 03. 23. at 20:21 said:

    Nagyon nagy köszönet érte, ez igazi hiánypótlás volt, már nagyon kellett.

  2. csa3a on 2011. 03. 25. at 10:06 said:

    Köszi! Kipróbálom, eddig kézzel csináltam.

  3. Sheni on 2011. 05. 16. at 06:39 said:

    Helló!
    Ha bemásolom a magyar OCR-t, akkor automatikusan fogja használni, vagy törölni kell az angol-spanyolt?

  4. Sheni on 2011. 05. 16. at 06:41 said:

    Oké, továbbolvastam…:))

  5. Szaki27 on 2011. 08. 07. at 10:33 said:

    Sziasztok!

    Nagyon jó ötlet ez a hibajavító.
    Most kezdtem el használni.
    Kellene egy-két dolgot belevenni még nekem, ha lehet.
    Az ékezetek nekem egy filmnél rosszul fordítódnak.
    pl:
    ű az ű
    á az á
    ö az ő
    Ă© az é
    ĂĽ az ü
    Ăł az ó
    Ă­ az í

    Lehet ezeket korrigálni?
    Előre is köszi!

  6. Archívum on 2011. 08. 07. at 10:44 said:

    Lehet, de nem ezzel. Egyszerűen csak unicode kódolású (SW nem támogatja). Át kell váltani ANSI-ra – ami amúgy elvárás a feliratokkal szemben a két nagy oldalon. Ezt megteheted Jegyzettömbben is, de így elveszhetnek részek. Ha tutira akarsz menni, telepítsd Subtitle Editet. Egy mp a váltás. Különben most tartok “oktatás”-t a hibakeresőről, ha érdekel, mailben küldj Skype- vagy MSN-címet!

  7. Szaki27 on 2011. 08. 07. at 18:41 said:

    Szia!

    Ált. sub.edittel szoktam lefordíttatni, és utána sw-ben dolgozni, mert abban vannak hosszú ékezetes betűk.
    Köszi.

Vélemény, hozzászólás?

Post Navigation