Ur yezh hepken n’eo ket a-walc’h / Nur unu lingvo ne sufiĉas
Below are the 10 most recent journal entries recorded in the "dominiko" journal:[<< Previous 10 entries]
02:34 pm
[Ligilo] |
Kromaĵo de Vim por gprof eo Hodiaŭ mi verkis kromaĵon de Vim por emfazi sintakson en eliro de gprof (GNU-profililo) kaj faciligi navigadon en la alvoka grafeo de funkcioj. Jen demonstraĵo pere de Ŝelr.tv (registrilo/reludilo de terminalo verkita de antono).
Tags: vim
|
10:12 pm
[Ligilo] |
LanguageTool-1.7
br
Deuet eo er-maez stumm 1.7 an difazier yezhadurel liesyezhek
frank LanguageTool. Kavout a ra muioc’h a fazioù. Labouret
em eus dreist-holl evit gwellaat reolennoù e brezhoneg.
Pellgargit LanguageTool evit LibreOffice.
Tu 'zo d'ober gant LanguageTool ivez hep pellgargañ netra er
bajenn-mañ.
eo
La nova versio 1.7 de la plurlingva gramatika kontrolilo
LanguageTool (Lingvoilo) nun haveblas. Mi precipe laboris por
aldoni regulojn por la bretona versio.
Elŝutu Lingvoilon por LibreOffice, aŭ uzu
ĝin sen instali ion ajn en
tiu paĝo.
|
11:40 am
[Ligilo] |
LanguageTool e brezhoneg / Lingvoilo en la bretona / LanguageTool en breton br
Deuet eo LanguageTool-1.5 er-maez, an difazier yezhadurel liesyezhek frank evit LibreOffice/OpenOffice.
Mont a ra mat en-dro evit Linux, Windows pe MacOs.
Ha petra nevez gantañ? Ur bern traoù nevez e galleg, esperanteg hag all. Met an dra a blij
din ar muiañ: LanguageTool a c’hall reizhañ testennoù e brezhoneg bremañ. Ya, ober a ran
evit LanguageTool e galleg, esperanteg ha brezhoneg ivez bremañ. Spi am eus
e vin gouest da wellaat LanguageTool dizale. Kalz a soñjadennoù am eus dija evit gwellaat anezhañ.
Ne vefe ket posupl al labour-mañ hep
geriadur brezhonek
Apertium.
Trugarekaat a ran neuze Francis Tyers ha Fulup Jakez evit o labour mat-kenañ gant ar geriadur-mañ
hag evit bezañ roet an aotre din d’ober gant o geriadur brezhonek dindan LanguageTool.
Trugarez vras ivez d’ar vreuriezh An Drouizig
evit treiñ LibreOffice penn-da-benn e yezh ar vro hag evit o geriadur brezhonek Hunspell.
Ur bern reolennoù yezhadurel nevez a zo bet ouzhpennet dija abaoe ar stumm ofisiel LanguageTool-1.5.
Gwelloc’h eo neuze pellgargañ LanguageTool nevezañ
hizivaet bemdez, eget pellgargañ
LanguageTool-1.5.
Gouzout a ran n’eo mat-mat ma brezhoneg siwazh. Kontant e vin neuze ma c’hall brezhonegerien all
e c’hall reiñ un dorn din evit reizhañ pe gwelaat an testennoù brezhonek e LanguageTool
hag all. Tu a zo da dreiñ e brezhoneg nebeud a kemmadennoù el
lec‘hienn-mañ.
Evit gouzout penaos staliañ LanguageTool, sellit ouzh ar
bajenn LanguageTool.
eo
Ĵus haveblis LanguageTool-1.5, la libera plurlingva gramatika korektilo por LibreOffice/OpenOffice.
Funkcias per Linukso, Vindozo aŭ Mak.
Kio novas?
Pluraj novaĵoj interalie en la esperanta kaj franca versioj. Sed tio, kio plej
ekscitas min: Lingvoilo nun povas korekti
tekstojn en la bretona lingvo. Jes, mi okupiĝas pri Lingvoilo en la franca, en Esperanto
kaj nun ankaŭ en la bretona.
Mi esperas, ke mi kapablos plibonigi ĝin baldaŭ. Mi jam havas multajn ideojn por plibonigi
ĝin. Tiu laboro tute ne eblis sen trovi
la bonegan
bretonan vortaron de la projekto
Apertium.
Mi do dankas Francis Tyers kaj Fulup Jakez pro
ilia vortaro de Apertium, kaj ankaŭ por lasi min uzi la bretonan vortaron en LanguageTool.
Ankaŭ dankon al la asocio An Drouizig pro
tute bretonigi LibreOffice kaj pro lia bretona vortaro Hunspell.
Mi jam aldonis multajn novajn gramatikajn regulojn ekde la oficiala versio LanguageTool-1.5.
Indas do elŝuti la plej novan version
ĝisdatigitan ĉiutage anstataŭ elŝuti
LanguageTool-1.5.
Mi scias, ke mia nivelo en la bretona ne estas ankoraŭ tiom bona bedaŭrinde. Mi do ĝojus, se aliaj
bretonistoj povus helpi por korekti erarojn en la tekstoj de Lingvoilo, ktp. Eblas bretonigi kelkajn
mesaĝojn en tiu retejo.
Por scii kiel instali Lingvoilon, vidu la
hejmpaĝon de Lingvoilo.
fr
LanguageTool-1.5, le correcteur grammatical multilingue libre pour LibreOffice/OpenOffice vient de sortir.
LanguageTool fonctionne avec Linux, Windows ou MacOs.
Quoi de neuf ?
Plusieurs nouveautés pour la version française et espéranto entre autres.
Mais ce qui m’excite le plus, c’est que LanguageTool commence à corriger les textes en breton.
Je m’occupe maintenant des versions de LanguageTool en français, espéranto et en breton.
J’espère bien améliorer LanguageTool en breton bientôt. J‘ai un tas d’idées pour l’améliorer.
Ce travail n’aurait pas été possible sans trouver le
dictionnaire breton
d’Apertium avec étiquettes
morphologiques. Je remercie donc Fancis Tyers et Fulup Jakez pour leur travail sur le dictionnaire
et pour m’autoriser à l’utiliser dans LanguageTool. Merci aussi à l’association
An Drouizig pour avoir entièrement traduit LibreOffice
en Breton et pour leur dictionnaire breton Hunspell.
Pas mal de règles grammaticales ont déjà été ajoutées depuis la version officielle LanguageTool-1.5.
Je conseille donc de télécharger la version snapshot
mise à jour quotidiennement, plutôt que
LanguageTool-1.5.
Je sais que mon niveau de breton n’est pas encore très bon. Je serai donc content si
des bretonnants peuvent donner un coup de main pour, entre autres, corriger ou améliorer
les textes en breton dans LanguageTool. Il est possible de traduire quelques messages
en breton sur ce site.
Pour en savoir plus, regardez la page de LanguageTool.
Tags: brezhoneg, lingvoilo
|
12:38 pm
[Ligilo] |
Kiel funkcias Lingvoilo?
En ĉi tiu enskribo, mi pli-malpli priskribas tiel, kiel interne funkcias
Lingvoilo,
la gramatika kontrolilo por Esperanto kaj por multaj aliaj lingvoj.
Mi esperas, ke tiuj klarigoj eble instigos aliulojn por kontribui
al la plibonigo de Lingvoilo en Esperanto, aŭ eble en aliaj lingvoj.
Lingvoilo estas verkita en la programlingvo Ĝavao (Java).
Gramatikaj reguloj estas priskribitaj en XML-dosieroj.
Kontrolado de enira teksto procedas en pluraj sinsekvaj fazoj.
1. Tranĉado de teksto en frazoj.
Unue, la enira teksto estas tranĉita en frazoj. Eblus simple
tranĉi tekston en frazoj kiam ajn la programo trovas punktosignon, krisignon,
demandosignon (ktp.). Tiuj signoj ja dislimas frazojn. Sed tiu simpla
metodo ofte mistranĉus frazojn, kiam ekzemple frazo enhavus mallongigon
kiel «t.e.» (tio estas). Kvankam tiu mallongigo enhavas punktojn, ĝi ne
devus tranĉi tekston en multaj frazoj! La fraztranĉilo de Lingvoilo
estas do pli inteligenta ol tio. Por bone tranĉi frazojn, Lingvoilo uzas
SRX.
SRX estas normo por precize tranĉi tekston. Oni povas agordi la fraztranĉilon
per reguloj en XML-dosiero (languagetool/src/resource/segment.srx)
kun ŝablonoj, kiu priskribas, kie tranĉi aŭ ne tranĉi frazojn. Ekzemple,
por netranĉi frazojn ĉe oftaj mallongigoj, kiuj uzas punkton, la dosiero
de SRX enhavas tian regulon:
<!-- Esperanto abbreviations (see http://eo.lernu.net/lernado/gramatiko/demandoj/mallongigoj.php) -->
<rule break="no">
<beforebreak>\b(div|[Ee]kz|h|[Ii]nkl|p|[Rr]ed|[Rr]im|ktp)\.\s</beforebreak>
<afterbreak>\p{Ll}</afterbreak>
</rule>
Kaj la ĉi-suba regulo indikas male, kie eblas tranĉi frazojn (tio estas nur
fragmento de la pli ampleksa SRX-dosiero):
<rule break="yes">
<beforebreak>[\.!?…]['|"|«|\)|\]|\}]?\s+</beforebreak>
<afterbreak></afterbreak>
</rule>
2. Tranĉado de frazoj en vortoj
Post tranĉado de enira tekston en frazoj, Lingvoilo devas tranĉi
frazojn en vortoj. Tio estas sufiĉe simpla afero: spacetoj kaj iuj interpunkciosignoj
dislimas vortojn en la frazoj. Estas speciala traktado por la
apostrofo, kiu povas fariĝi parto de vorto (l’, dank' al, …) en
Esperanto.
La Ĝavao-kodofonto por tranĉi frazojn en vortoj de la Esperanta
versio de Lingvoilo estas languagetool/src/java/org/languagetool/tokenizers/eo/EsperantoWordTokenizer.java
3. Aldono de gramatikaj etikedoj al vortoj
La programo poste aldonas etikedojn al ĉiuj vortoj de la frazoj.
Tiuj etikedoj priskribas gramatikajn ecojn de la vortoj. Mi elektis
kelkajn etikedojn taŭgajn por gramatika kontrolilo kaj listigis ilin
en la dokumento
languagetool/src/resources/eo/etikedoj.txt
(helpa dosiero). Etikedoj indikas ekzemple, ĉu vorto estas o-vorto (substantivo),
a-vorto (adjektivo) verbo, rolmontrilo (prepozicio), tabelvorto, nombro, ĉu vorto estas
ununombra aŭ multenombra (pluralo), ĉu vorto havas akuzativon aŭ ne, ktp.
Ekzemple, la frazo «La domo malbelegas.» enhavas 3 vortojn.
Eblas vidi la gramatikajn etikedojn, kiujn Lingvolilo donas al
ĉiu vorto pere de la komanda opcio -v:
$ echo "La domoj malbelegas." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> La[la/D] domoj[domo/O nak pl] malbelegas[malbelegi/V nt as].[</S>]<P/>
En la supra ekzemplo:
- la vorto «La» havas etikedon «D», ĉar la vorto estas difinilo.
- La vorto «domoj» havas etikedon «O nak pl», ĉar ĝi
estas O-vorto (substantivo), neakuzativa, kaj plurala.
- La vorto «malbelegas» havas la etikedon «V nt as», ĉar ĝi estas verbo,
netransitiva, kaj ĝi estas as-verbo (estanta tempo).
Rimarku ankaŭ, ke Lingvoilo ne nur donas gramatikajn etikedojn, sed
ankaŭ
normalan radikon de ĉiuj vortoj. T.e., la normala radiko de «domoj»
estas «domo», la normala radiko de «malbelegas» estas «melbelegi».
Ni vidu poste, kial utilas tion scii.
Por multaj lingvoj, kiel la angla, la franca (ktp.), oni bezonas vortaron
por trovi etikedon de vortoj. Sed en Esperanto pli facilas, ĉar eblas
doni etikedon al preskaŭ ĉiuj vortoj nur dank’ al la regula finaĵo de
vortoj. Nu, malgranda vortaro estas tamen bezonata por la kelketaj
vortoj kiuj havas neregulan finaĵon (ĉefe pronomoj, tabelvortoj, nombroj, ktp.).
La dosiero
languagetool/src/resource/eo/manual-tagger.txt
listigas la vortojn kun neregulaj finaĵoj kaj donas iliajn etikedojn.
La programo ankaŭ bezonas vortareton por scii, ĉu verbo estas transitiva
aŭ netransitiva. Eblas aŭtomate trovi transitivecon de verboj sen
helpa vortaro nur por la -iĝ kaj -ig vortoj. Sed eĉ
por tiuj -iĝ/-ig verboj, oni devas tamen atenti pri strangaĵo:
la verbo
memmortigi estas netransitiva, kvankam ĝi havas la finaĵon -ig.
Mi kreis liston de transitivaj kaj netransitivaj verboj. Tiuj verboj
estas listigitaj en la dosieroj
languagetool/src/rules/eo/verb-tr.txt
(transitivaj verboj) kaj
languagetool/src/rules/eo/verb-ntr.txt
(netransitivaj verboj). Kelkaj verboj povas esti ambaŭ transitivaj
kaj netransitivaj, kaj tiuj verboj tiam aperas en ambaŭ dosieroj.
Farinte tiun liston, mi konsciis, ke transitiveco estas iom nebula
afero en Esperanto, kaj diversaj vortaroj donas malsamajn
transitivecojn por kelkaj verboj. Por iuj verboj, vortaroj
eĉ ne indikas transitivecon.
Ĉar en Esperanto eblas aldoni plurajn prefiksojn kaj sufiksojn
al vortoj, ne vere eblas listigi ĉiujn validajn verbojn. La
programo scias, ke iuj afiksoj neniam ŝanĝas transitivecon
(mal-, mis-, ek-, re-, fi-, ne-, -ad, -aĉ, -eg, -et). Do se
la vortaro indikas, ke la verbo «beli» estas netransitiva, la
programo bone trovos, ke la verbo «malbelegas» (mal-bel-eg-as)
estas ankaŭ netransitiva, êc se tiu verbo ne estas listigita en
vortaro. Por nekonata verbo kiel «malbelegas»,
la programo trovas ĝian radikon «beli». Ĉar «beli» estas listigita
kiel netransitiva verbo, Lingvoilo ĝuste donas netransitivan etikedon
al la vorto «malbelegas». La programo devas serĉi en la vortaro
antaŭ ol forigi prefikson/sufikson, ĉar kelkaj verboj havas
falsajn afiksojn (ekz.: «respond/i» kaj ne «re-spond/i»).
Estas ankaŭ alia listo de vortoj por ne fuŝe doni etikedon de
participoj (-at, -ant, vortoj). Tiu vortlisto estas bezonata
por ne doni etikedon de participo al vortoj kiel elefant-o
(kaj ne elef-ant-to!). Tiu listo de vortoj, kiu aspektas kiel
participoj, sed ne estas participoj estas en la dosiero
languagetool/src/rules/eo/root-ant-at.txt
La dosiero
languagetool/src/java/org/languagetool/tagging/eo/EsperantoTagger.java
enhavas la Ĝavao-fontkodon por aldoni etikedojn al vortoj.
4. Kongruo kun gramatikaj reguloj
Por atentigi pri gramatikaj eraroj, Lingvoilo listigas ŝablonojn
de oftaj eraroj. Tiu ŝablonoj estas difinitaj en la XML-dosiero
languagetool/src/rules/eo/grammar.xml.
Tiu XML-dosiero estas vere la kerno de la programo.
Kiam ajn frazo kongruas kun erarŝablono, la programo atentigas
pri eraro en la frazo. Estas multaj erarŝablonoj en Lingvoilo,
kaj la nombro de erarŝablonoj kreskadas por trovi pliajn erarojn
en Esperanta teksto.
Mi ne priskribos ĉi tie ĉiujn eblaĵojn por skribado de gramatikaj
XML-dosieroj de Lingvoilo. Por pli amplaksaj informoj,
vidu la retejon de LanguageTool.
Ni unue rigardu tre simplan gramatikan ŝablonon en la dosiero
languagetool/src/rules/eo/grammar.xml:
<rule id="ANSTATAUX_OL" name="anstataŭ + ol (anstataŭ)">
<pattern>
<token>anstataŭ</token>
<token>ol</token>
</pattern>
<message>Uzu <suggestion>\1</suggestion> (sen «ol»).</message>
<example type="incorrect">Li rezignis <marker>anstataŭ ol</marker> lerni la lingvon.</example>
<example type="correct">Li rezignis anstataŭ lerni la lingvon.</example>
</rule>
Tiu regulo estas unu el la plej simplaj gramatikaj reguloj en Lingvoilo.
Kion faras tiu regulo? Kiam ajn la sinsekvaj vortoj «anstataŭ ol»
aperas en frazo, Lingvoilo atentigas pri eraro, klarigas kial estas
eraro, kaj donas sugeston por korekti la eraron.
La ŝablono de la eraro estas ene de <pattern> … </pattern>
La ekzemplojn en la regulo helpas la programiston por klarigi tion, kion faras
la regulo. Tiuj ekzemploj (<example … >) ne nur helpas komprenigi la
regulon, sed ili estas ankaŭ uzataj por aŭtomate testi la programon.
Alivorte, kiam oni lanĉas ant test en komanda linio, la programo
kontrolas, ke ĉiu ekzemplaj frazoj kun type="incorrect" ja
kaŭzas gramatikan eraron, kaj ĉiuj ekzemplaj frazoj kun type="correct"
ja ne kaŭzas gramatikan eraron. La aŭtomata testado estas tre grava,
ĉar facilas fuŝi dum kreado de XML-reguloj! Kaj la ekzemploj tiam
plej ofte trovas cimojn.
Jen kiel Lingvoilo atentigas, se oni lanĉas Lingvoilon en komanda linio
kun erara frazo, kiu kongruas kun la ĉi-supra regulo:
$ echo "Li ludis anstataŭ ol studi." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Li[li/R nak np] ludis[ludi/V tn is] anstataŭ[anstataŭ/P kak] ol[ol/_] studi[studi/V tr i].[</S>]<P/>
1.) Line 1, column 10, Rule ID: ANSTATAUX_OL[1]
Message: Uzu 'anstataŭ' (sen «ol»).
Suggestion: anstataŭ
Li ludis anstataŭ ol studi.
^^^^^^^^^^^
Time: 80ms for 1 sentences (12.5 sentences/sec)
Ni nun vidu alian (ankoraŭ simplan) regulon, kiu montras alian gravan eblon
en la XML-reguloj:
<rule id="MALGRAUX_V" name="malgraŭ + verbo">
<pattern>
<token>malgraŭ</token>
<token postag="V .*" postag_regexp="yes"/>
</pattern>
<message>Anstataŭ «\1 \2», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «\1 tio, ke + plenan subfrazon».</message>
<example type="incorrect"><marker>Malgraŭ fali</marker>, li batalis.</example>
<example type="correct">Malgraŭ tio, ke li falis, li batalis.</example>
<example type="correct">Kvankam li falfis, li batalis.</example>
</rule>
Ĉi tie, la dua ĵeteno en la ŝablono estas priskribita pere de
ĝia gramatika etikedo (postag) anstataŭ pere de vorto. Vorto,
por kiu ĝia gramatika etikedo kongruas kun "V .*" estas
verbo. Do tiu regulo atentigas pri eraro, kiam ajn estas verbo
post la vorto «malgraŭ». Rimarku, ke oni povas flekseble priskribi
tiun etikedon per regula esprimo.
Lingvoilo atentigas jene pri la eraro:
$ echo "Malgraŭ fali, li batalis." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Malgraŭ[malgraŭ/P sak] fali[fali/V nt i],[,] li[li/R nak np] batalis[batali/V nt is].[</S>]<P/>
1.) Line 1, column 1, Rule ID: MALGRAUX_V[1]
Message: Anstataŭ «Malgraŭ fali», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «Malgraŭ tio, ke + plenan subfrazon».
Malgraŭ fali, li batalis.
^^^^^^^^^^^^
Time: 65ms for 1 sentences (15.4 sentences/sec)
Ni nun vidu iom pli malsimplan regulon, kiu montras aliajn eblaĵojn:
<rule id="LITERO_LETERO" name="Litero (Letero)">
<pattern mark_from="1">
<token skip="2" inflected="yes" regexp="yes">.*(adres|send|redakt|leg|ricev)i</token>
<token inflected="yes">litero
<exception scope="previous" regexp="yes">((mal)?(grand|et)aj?n)|(ĉin|japan)aj?n?</exception></token>
</pattern>
<message>Ĉu vi intencis <suggestion><match no="2" regexp_match="(.).(.*)" regexp_replace="$1e$2"/></suggestion> anstataŭ «\2»?</message>
<example type="incorrect">Mi dissendis la <marker>literon</marker>.</example>
<example type="correct">Mi dissendis la <marker>leteron</marker>.</example>
<example type="correct">Mi ne povas legi etajn literojn.</example>
</rule>
Tiu regulo atentigas pri verŝajna konfuzo inter la vortoj
«litero» kaj «letero» laŭ la kunteksto.
Ĉar en tiu regulo tute ne gravas, ĉu la unua vorto estas «sendi»,
aŭ «sendis», «sendos» (ktp.), pro tio la regulo kongruas kun la norma
radiko de la vorto uzante inflected="yes" anstataŭ kun la vorto mem.
Rimarku ankaŭ aliajn aferojn en tiu regulo:
- Regula esprimo (.*(adres|send|redakt|leg|ricev)i)
povas esti ankaŭ uzata por la vorto (dank’ al regexp="yes").
- Inteligenta substituo en la mesaĝo eblas dank’ al <match …>.
Tio ebligas la programon por bone korekti ŝanĝante «litero» en «letero»,
«literoj» en «leteroj», ktp.
- Uzo de skip="2" signifas, ke povas esti inter 0 kaj 2 aliaj vortoj
inter la verbo «adresi/sendi/redakti/legi/ricevi» kaj la vorto litero/literoj/literojn
en la kontrolenda teksto.
- Uzo de escepto en ŝablono: la regulo atentigas pri misuzo de la
vorto «litero» apud la verbo sendi/skribi (ktp.) krom tiam, kiam la vorto ĝuste antaŭ
la vorto «litero» estas io kiel «eta/ĉina/japana» (ktp.)
Tiu escepto esta por eviti neverajn
erarojn en frazo kiel «Mi ne povas legi etajn literojn.», kie la vorto
«litero» sufiĉe verŝajnas sen esti erara. Kompreneble, estas heŭristiko ĉi tie.
Plej verŝajne ekzistas frazoj, kie la programo atentigos
pri ĝusta frazo. Tamen, estas sufiĉe neverŝajna, kaj oni povas aldoni pliajn
esceptojn laŭ bezone por eviti neverajn erarojn.
Jen, kiel Lingvoilo atentigas en komanda linio pri tiu regulo:
$ echo "Mi ne ricevis vian literon." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Mi[mi/R nak np] ne[ne/_] ricevis[ricevi/V tr is] vian[via/A akz np] literon[litero/O akz np].[</S>]<P/>
1.) Line 1, column 20, Rule ID: LITERO_LETERO[1]
Message: Ĉu vi intencis 'leteron' anstataŭ «literon»?
Suggestion: leteron
Mi ne ricevis vian literon.
^^^^^^^
Time: 72ms for 1 sentences (13.9 sentences/sec)
Eblas ankaŭ difini gramatikajn regulojn en Ĝavao anstataŭ XML,
sed ĝis nun, la Esperanta kontrolilo ne bezonis tiajn regulojn.
Vi nun scias preskaŭ ĉion pri Lingvoilo. La metodo de Lingvoilo certe
havas limojn, ĉar la programo ne vere analizas la gramatikan strukturon
de la frazoj. Tamen, kun sufiĉe da erarŝablonoj, la programo certe fariĝas
utila, sen troaj malveraj atentigoj.
Tags: esperanto, lingvoilo
|
09:24 pm
[Ligilo] |
Lingvoilo-1.4 eo Nova versio de la gramatika kontrolilo
Lingvoilo-1.4
nun haveblas. La listo de ŝanĝoj legeblas
tie.
fr Une nouvelle version du correcteur
grammatical LanguageTool-1.4
est maintenant disponible. La liste des
changements est disponible ici.
Tags: lingvoilo
|
02:00 pm
[Ligilo] |
Fukuŝima
Mi iam estis favora al la atoma energio, ĉar mi taksis ĝin plu pura por la tutmonda varmiĝo ol aliaj fontoj de energio, krom kompreneble la renovigeblaj energioj kiel vento. Sed la eventoj en Fukiŝima (Japanio) igis min ŝanĝi opinion. Atoma energio tro danĝeras por la homaro. Jes tutmonda varmiĝo malbonas, sed tutmonda atoma poluado eĉ pli malbonas. Kaj danĝeros por multaj jaroj post akcidento. Duonvivo de Cezio-137 estas 30 jaroj. Tio estas, la kvanto de Cezio-137 duoniĝas post 30 jaroj. La Cezio-137 de Ĉernobil ankoraŭ malsanigas homojn kaj bestojn en Eŭropo post 25 jaroj, kaj daŭre faros tion dum la venontaj jarcentoj. Duonjaro de plutonio-239 estas 24000 jaroj. Plie, plutonio estas ege danĝera substanco por la homo, kaj malfacilas detekti ĝin. Ordinara radioaktivdetektilo ne detektas ĝin. Ni ne rajtas riski poluadon de tutmonda planedo por miloj da anoj. Estas krimo kontraŭ la tutmonda homaro. Fakte, ne vere eblas kalkuli tiujn riskojn. Certe la tertremoj okazas pli ofte en Japanio ol en Eŭropo, kie mi loĝas, sed estas ĉiam aliaj riskoj, kiel ekzemple milito, terorista saboto, aŭ simple homa eraro. Ĉar estas nun multaj atomcentraloj en la mondo, mi timas, ke aliaj gravaj akcidentoj okazos. La historio montras, ke jam okazis tro ofte. Krom la riskoj, estas ankaŭ neniu taŭga solvo por la ĉiam kreskantaj forĵetaĵoj de atoma energio. Alia problemo de atoma energio, estas ke la landoj kiuj produktas ĝin, povas poste ankaŭ produkti militan plutonion por militaj kialoj. Tio ne estas akceptebla. Militistoj, kiu ŝoke uzis Uranion (depleted Uranium) en Irako kaj verŝajne denove uzas ĝin en Libio, poluante por miliardoj da jaroj, certe ne fidindas. Ĉu estas pli granda krimo? La atoma industrio ankaŭ ne sufiĉe fidindas. La atoma industrio ĉiam trompis la homojn en ĉiuj akcidentoj kiel Three Miles Island, Ĉernobil kaj nun en Fukuŝima. La atoma industrio parolas pri la avantaĝoj de atoma energio (kaj verdire estas ja teorie avantaĝoj) sed forlasas la malavantaĝojn aŭ malgravigas ilin. La ĵurnalistoj ankaŭ ial misinformas, aŭ ne informas pri la realo de tiuj akcidentoj. Fakte, nuntempe, la ĵurnaloj preskaŭ ne plu parolas pri Fukuŝima malgraŭ la graveco de tiu evento. Mirigas min, ke piedpilko okupas pli da spaco ol Fukuŝima almenaŭ en la francaj ĵurnaloj. Bonŝance, eblas trovi informojn per Interreto por tiuj, kiuj serĉas. Mi rekomendas aŭskulti (angllingve) tion, kion diras spertuloj kiel Arnie Gunderson, Helen Caldicott kaj Conrad Miller. Ili havas plurajn interesajn videaĵojn. Franculo en Tokio ankaŭ faris multajn videaĵojn pri la situacio en Japanio. Li porolas kun forta ridetiganta franca akĉento, sed preterlasu tion: li bone diras tion, kio okazas en Japanio, kaj tion, kion li pensas. Por tiuj, kiuj scipovas la francan, mi rekomendas la intervjuon de Alain de Halleux.
Mi demandas min, kio estas la estonteco de Japanio nun kun 3 fundoj de reaktoroj. Kio estas la solvo por tio? Entombigo de la reaktoroj ne vere estas solvo, ĉar la poluadoj eniros la grundon, atingos la akvon en la grundo, migros for aliloke en lando, eniros la nutroĉenon, ktp. TEPCO anoncis, ke reaktoroj 1, 2 kaj 3 fondis. Reaktoro 3 enhavas MOX, tio estas ĝi enhavas grandan kvanton de plutonio, kiu estas tre danĝera. Estas eble la plej danĝera substanco, kiu ekzistas. Do estas tre grava evento, mi timas. Fakte, la aliaj reaktoroj ankaŭ enhavas plutonion (produktita en reaktoro), sed malpli ol reaktoro 3.
Ni devas lerni pro tio. La homaro devas uzi malpli da energio, sed malfacilos. Kiel konvinki ĉiujn? Jen utopio eĉ pli granda ol la fina venko. Ĝenas min ekzemple vidi butikojn kun lumoj en iliaj montrofenestroj eĉ vespere, kiam la butikoj estas jam delonge fermitaj. Eblus fari leĝon por igi tion kontraŭleĝa. Ĝenas min vidi restoraciojn kun eksteraj varmiloj por la klientoj kiuj decidas manĝi ekstere eĉ kiam la vetero malvarmas. En Francio, mi memoras legi ke oni varmigas gazonon de stadio de piedpilko, por ke ĝi ne glaciiĝu dum la vintro. Ĝenas min vidi reklamojn kun elektra afiŝilo. Ĉu ne eblas igi tion kontraŭleĝa? Ĝenas min vidi kiel multaj aĉetas novan poŝtelefonilon je pli malpli ĉiuj 2 jaroj, sen pensi, ke tiu freneza konsumado damaĝas la planedon, produktinte, uzante kaj finfine ĵetonte la efemeran produktaĵon. Ni ne vere bezonas novan poŝtelefonilon, nur pro tio, ke ĝi havas pli belan interfacon. La energio bezonas esti iel pli multekosta, por ke ni ekŝparu ĝin.
|
08:27 am
[Ligilo] |
Provi Lingvoilon sen instali ĝin Eblas provi Lingvoilon (Esperantan gramatikan kontrolilon) rete,
sen instali ĝin en via komputilo. Vi povas tajpi Esperantan tekston
en la tekstkampo ĉe la suba parto de
tiu paĝo.
Tio faciligas uzi Lingvoilon por tiuj, kiuj timas aŭ tro pigras
instali la programon.
Vi povas ekzemple provi ĝin tajpante erarajn frazojn de la listo
de oftaj eraroj ĉe Lernu!. Bonvolu atentigi min se
vi trovas erarajn frazojn, kiujn la programo ankoraŭ ne trovas.
Tags: lingvoilo
|
11:54 am
[Ligilo] |
Lingvoilo-1.3.1
Ĉi-semajne haveblebliĝis
versio-1.3.1 de la libera plurlingva gramatika kontrolilo
Lingvoilo (LanguageTool) por
OpenOffice/LibreOffice. Mi jam
skribis
pri Lingvoilo. Lingvoilo-1.3.1 alvenas kun novaj reguloj por rekono de pliaj
eraroj kaj multaj riparoj de falsaj eraroj.
Mi verdire pasigis pli da tempo por plibonigi la francan version
de Lingvoilo ol la Esperantan version. La Esperanta Lingvoilo
havas do malpli da plibonigoj ol la franca.
La franca kontrolilo nun uzas pli
freŝan vortaron de gramatikaj etikedoj (dicollecte-4.0.1).
La etikedoj de vortoj ebligas Lingvoilon scii, ĉu franca vorto
estas nomo, verbo, adjektivo (ktp) kaj ankaŭ ĉu vorto estas
multnombra/ununombra, ina/malina vorto ktp.
Dicollecte
estas interesa projekto, kiu celas plibonigi liberan francan vortaron, ne nur por
literumiloj sed ankaŭ por gramatikaj kontroliloj (dank' al la etikedoj
de vortoj). La retejo de dicollecte estas tre bone kaj bele farita
por ebligi iun ajn facile kontribui per aldonoj de novaj vortoj aŭ korektoj
de etikedoj. Ĉiuj ŝanĝproponoj al la vortaro estas atenteme
kontrolitaj fare de aliaj spertaj uzantoj kaj pridiskutitaj laŭbezone antaŭ ol
eniri la vortaron. Uzante Lingvoilon en la franca, mi povis iom
kontribui al dicollecte ĉefe kun korektoj de neĝustaj vort-etikedoj.
Malkiel en la franca, en Esperanto eblas pli facile etikedi vortojn
dank' al la regulaj vortfinaĵoj. Ĉu tiom facile? Nu estas kelkaj enfaliloj.
Ĉiuj verboj kun la finaĵo -igi estas kompreneble
transitivaj, ĉu ne? Nu, rigardu vi mem la transitivecon de
verboj kiel intrigi, memmortigi
aŭ navigi.
Etikedo de verboj bezonas vortaron de transitivaj kaj netransitivaj verboj.
La vortaroj (ReVo, PIV) ofte eĉ ne konsentas pri transitiveco de verboj.
Estas iom ironie, sed laborante pri la Esperanta kaj franca Lingvoilo, mi
konsciis, ke pli facilas krei kontrolilon por malfacila lingvo kiel la franca
ol por facila lingvo kiel Esperanto, almenaŭ per la metodo de Lingvoilo.
La fleksebla vortordo en Esperanto ekzemple malfaciligas la taskon por kontrolilo.
Testante la Esperantan Lingvoilon, mi ja vidas iujn korektindajn falsajn
erarojn. Mi ne tuj korektas ilin, ĉar ne ĉiam facilas. Ne tiom indas atentigi
min pri falsaj eraroj ĉar mi vidas ilin. Sed mi esperas, ke la nuna nombro de
falsaj eraroj ne troas. Pli indas sciigi min pri oftaj eraroj ankoraŭ ne trovataj
per Lingvoilo.
Por tiuj, kiuj volas uzi la plej freŝan version el la deponejo (subversion),
jen kiel fari tion per Ubuntu-o: $ sudo apt-get install sun-java6-jdk ant subversion
$ svn co https://languagetool.svn.sourceforge.net/svnroot/languagetool/trunk/JLanguageTool languagetool
$ cd languagetool
$ ant Post tio, Lingvoilo troviĝos en la dosierujo languagetool/dist.
Mi iom scivolas, pri kiom da uzantoj uzas Lingvoilon en Esperanto, kaj ĉu ili
konsideras ĝin utila. Se vi uzas aŭ nur provis ĝin, ne hezitu komenti pri via
sperto.
Tags: lingvoilo
|
09:31 am
[Ligilo] |
Lingvoilo kaj Tatoeba Mi daŭre plibonigas la liberan gramatikan
kontrolilon Lingvoilo,
ne nur en Esperanto, sed ankaŭ en la franca. Lingvoilo-1.2 ankoraŭ
tro ofte atentigis pri neveraj eraroj. Iuj el la falsaj atentigoj
facile korekteblas, sed aliaj atentigoj ne tiom facile
korekteblas. Por testi la Esperantan version de Lingvoilo,
mi uzas:
Mi malkovris, ke eblas elŝuti la tutan frazaron de la projekto
Tatoeba. Utilas ne nur por testi Lingvoilon, sed ankaŭ por
korekti la frazojn ĉe Tatoeba pere de Lingvoilo.
Jen kiel elŝuti kaj filtri frazojn por konservi nur la Esperantajn
frazojn (tiujn kun la lingvokodo ISO 639-3 epo):
$ wget http://tatoeba.org/files/downloads/sentences.csv
$ perl -F'\t' -ane 'print "@F[2 .. $#F]" if ($F[1] eq "epo")' sentences.csv > sentences-epo.csv
Tiu frazaro enhavas pli ol 70.000 Esperantajn frazojn.
Esperanto estas fakte la 3-a lingvo ĉe Tatoeba. Estas
sufiĉe bona atingo por lingvo iom malpli parolata ol la angla.
Tags: esperanto, lingvoilo
|
02:02 am
[Ligilo] |
Lingvoilo-1.2 nun haveblas Nova versio (1.2) de Lingvoilo (LanguageTool)
alvenis antaŭ kelkaj tagoj (2010-01-02). LingvoIlo
estas libera (LGPL) plurlingva gramatika kontrolilo, kiu funkcias per OpenOffice
(LibreOffice) sed ankaŭ per komanda linio aŭ
per la tekstoredektilo Vim. La freŝa versio LingvoIlo-1.2 estas la
unua oficiala versio, kiu subtenas Esperanton.
Mi scias, ke la Esperanta kontrolilo ne estas perfekta. Nu, ĝi ne estas
perfekta ankaŭ en la aliaj lingvoj. Tamen espereble helpas por trovi
erarojn. Mi jam trovis kaj korektis erarojn ĉe Vikipedio
kaj Lernu uzante la programon.
Gravas kompreni, ke LingvoIlo atentigas nur pri gramatikaj eraroj sed
ne pri literumaj eraroj. Sed eblas instali LingvoIlon kune
kun literuma kontrolilo por OpenOffice (aŭ por Vim) por atentigi
pri ambaŭ tipoj de eraroj.
Por uzi ĝin, oni devas:
- Instali OpenOffice (vi verŝajne jam havas ĝin, ĉu ne?)
- Elŝuti la kromaĵon LanguageTool-1.2 kaj instali ĝin. Por la uzantoj de Vindozo, la kromaĵo aŭtomate instaliĝos post elŝuto. Por la uzantoj de Linukso, instaleblas elektante « Iloj → Aldonaĵa mastrumilo… » el la ĉefa menuo de OpenOffice, poste alklaku la butonon « Aldoni… » kaj elektu la ĵus elŝutitan dosieron « LanguageTool-1.2.oxt ».
- Por literumaj eraroj, necesas ankaŭ elŝuti Esperantan vortaron el la deponejo de vortaroj de OpenOffice. Eblas elŝuti kaj instali pli ol unu vortaron se vi volas kontroli tekstojn en pluraj lingvoj.
- Endas tiam eliri el OpenOffice kaj restartigi ĝin.
Post instalado, vi preskaŭ pretas por kontroli tekston en OpenOffice. Gravas unue
elekti la lingvon de la teksto per « Iloj → Lingvo » el la ĉefa menu de OpenOffice.
Eblas elekti malsamajn lingvojn por diversaj partoj de la dokumento.
La lingvo de la teksto aperas je la suba parto de
la fenestro de OpenOffice (vidu ekranfoton). La lingvo de la teksto povas
kompreneble esti malsama ol la lingvo de la interfaco de OpenOffice.
Vi finfine povos kontroli Esperantan tekston per « Iloj → LingvoIlo → Kontroli tekston ».
OpenOffice substrekas blue gramatikajn erarojn kaj ruĝe literumajn erarojn
kiel ilustrite en la suba ekranfoto. Alklakante maldekstre sur blua substreko,
LingvoIlo klarigos la eraron kaj sugestos (kiam eblas) korekton. En la ekzemplo
de la ekranfoto, LingvoIlo indikus: Ĉu vi forgesis akuzativon post transitiva
verbo «lernas»?
Ĝuu kaj ne plu forgesu la akuzativo.
Tags: esperanto, lingvoilo
|
[<< Previous 10 entries] |
|