overkind Posted July 6, 2016 Report Share Posted July 6, 2016 Елем, да покушам да питам РУР програмере, ако може лаику уопште да се објасни. Шта је суштина пресловљавања са латинице на ћирилицу? Млатим се са неким екњигама и издањима на латиници које пребацујем у ћирилицу. Ово може да се ради у Ворду, тако и радим сада, али сам нашао неке скритпе у Пајтону које пресловљавају било који текст, односно текстулане фајлове. Радозналости ради, пробао сам да читам код да сконтам шта заиста ради, и да можда напишем неки свој код за то и избацим Ворд из процеса. Скрипте које имам су писане "за Линукс" и не раде под Вином без да се не знам шта промени. Може ли некоме ко не зна о програмирању да се објасни како се ради пресловљавање испод хаубе? Шта треба да прочитам да бих научио, ако се уопште исплати да се бакћем с тим? Quote ...Од рођења спремна стоји, мене чека моја рака, Да однесе све што имам у дубину у дубоку. Link to comment Share on other sites More sharing options...
voodoo_ Posted July 6, 2016 Report Share Posted July 6, 2016 Najgluplja verzija algoritma bi bila: Petlja: Za svako slovo u dokumentu Ako je slovo A: Zameni to slovo u ćirilično A (nije isti kôd u Unicode tabeli) Ako je slovo B: Zameni to slovo u ćirilično Б (nije isti kôd u Unicode tabeli) (i tako redom sva mala i velika latinična slova) Ako nije ništa od toga, ne diraj slovo Kraj petlje Quote Link to comment Share on other sites More sharing options...
Debeli Posted July 6, 2016 Report Share Posted July 6, 2016 имаш проблем код дифтонга, тојест изузетке, као код инЈекције, конЈуктуре, као и код д+ј=ђ, ако је неко тако писао на латиници (подјармити), а још је и ијекавица (дјеца,...). Quote MORTALIS HOMO AURA PER KHARONE SERVAStyle over subsistenceCrown of Light. Keeper of The Yoda Chamber. I&I, Righteous Army of One. Link to comment Share on other sites More sharing options...
voodoo_ Posted July 6, 2016 Report Share Posted July 6, 2016 U stvari propustio sam momenat gde bi hteo to da radiš u batch varijanti, bez Worda. Python skripte bi trebalo da rade na Windowsu bez izmena (osim ako su loše kodirane pa se oslanjaju na specifičnosti OS-a), probaj da instaliraš Python na Windowsu pa pusti. Isto i ovo što Debely kaže, ako nemaš bazu reči i izuzetaka pravila, onda će biti prevelika zezancija da pišeš od nule. Quote Link to comment Share on other sites More sharing options...
overkind Posted July 6, 2016 Author Report Share Posted July 6, 2016 Хвала, хвлала. Ајде, пробаћу да покренем па се јављам. На Ворду 2013 код мене ради ово: https://alberoart.com/translitgt-add-in/ Подразумевам да је тескт грамитички коректно написан. Улазни фајл је летинични скен кнјиге или екњига на латиници. Ако улаз није ОК онда морам да читам књигу у току обраде и пеглам све грешке - ово је мало много. Тешко да се исплати. Лик који је написао скрипту има и неку базу изузетака, типа римских бројева, али мислим да не поркива "лошу" ијекавицу, дифтонге и шта већ. Требало би да након пресловљавања тражи те изузетке и враћа их на латинуцу. Ако сам сконтао суштина је у тражењу и мењању Unicode вредности? Quote ...Од рођења спремна стоји, мене чека моја рака, Да однесе све што имам у дубину у дубоку. Link to comment Share on other sites More sharing options...
voodoo_ Posted July 6, 2016 Report Share Posted July 6, 2016 Jeste ako algoritam radi slovo po slovo, ali da bi spisak izuzetaka imao smisla, moraš da napraviš prepoznavanje reči, npr ako naiđeš na slovo a pre toga je bio razmak, tab, novi red ili interpunkcija, to je početak reči; u obrnutom slučaju je kraj; pa onda ne obrađuješ dokument slovo po slovo nego reč po reč, gde stalno proveravaš da li reč postoji u bazi i kako je u tom slučaju obrađuješ. Uzevši u obzir i uvek zanimljive rodove, padeže, priloške odredbe itd, tu se priča dodatno komplikuje (pored prepoznavanja reči, moraš da radiš i nekakav search-replace delova reči koji se ne menjaju, ili da čuvaš svaku reč u svim mogućim oblicima pa da radiš pretragu u bazi). TL;DR Možda prosto da radiš copy-paste teksta u preslovljavanje.com, mislim da je to najkompletniji "endžin" koji sam probao. Quote Link to comment Share on other sites More sharing options...
overkind Posted July 6, 2016 Author Report Share Posted July 6, 2016 (edited) Знам за сајт, али идеја ми је да пресловљавам целе књиге, и да не будем везан за Ворд, или неки сајт. Тешко да могу да бацим целу књигу тамо. Све ми се чини да пресловљавање није тривијална ствар :) https://github.com/strn/epub2cir Каже да је uniconv.py главна функција. Edited July 6, 2016 by overkind Quote ...Од рођења спремна стоји, мене чека моја рака, Да однесе све што имам у дубину у дубоку. Link to comment Share on other sites More sharing options...
Dick Warlock Posted July 6, 2016 Report Share Posted July 6, 2016 Presloviti tekst na srpskom napisan latinicom na cirilicu je zeznuto, obrnuto nije :) Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.