You are viewing dominiko

Ur yezh hepken n’eo ket a-walc’h / Nur unu lingvo ne sufiĉas Below are the 10 most recent journal entries recorded in the "dominiko" journal:

[<< Previous 10 entries]

aprilo 1-a, 2013
05:19 pm

[Ligilo]

LanguageTool-2.1 / Lingvoilo-2.1
br Deuet eo er-maez nevez zo LanguageTool-2.1. Ouzhpennet eo bet reolennoù evit kavout muioc’h a fazioù e testennoù brezhonek. Ha gwellaet eo bet ivez reolennoù all. Roll ar cheñchamantoù a zo amañ. Dizoloit ha pellgargit an difazier liesyezhek frank war pajenn vrezhonek LanguageTool. Laouen e vezan atav o resev ho remerkoù evit gwellaat LanguageTool.

eo Lingvoilo-2.1 ĵus aperis. Novaj Esperantaj reguloj aŭ ĝisdatigitaj estis aldonitaj. Listo de ŝanĝoj haveblas tie. Malkovru kaj elŝutu la plurlingvan liberan kontrolilon ĉe la Esperanta paĝo de Lingvoilo. Mi ĉiam ĝojas ricevi atentigojn por daŭre plibonigi Lingvoilon.

Tags: ,

(Afiŝu novan komenton)

aŭgusto 12-a, 2012
03:45 am

[Ligilo]

Olimpiaj ludoj 2012
Dum la Olimpiaj ludoj de 2012, ok ludistinoj de badmintono el la teamoj de Ĉinio, Sud-Koreio, kaj Indonezio estis eliminitaj pro tio, ke ili volonte perdis maĉon. Ili decidis perdi maĉon kiel taktiko, por poste havi pliajn facilajn maĉojn.

Mi opinias, ke ili ne faris ion ajn malbonan. Male, ili logike uzis la regulojn, se tio ja pligrandigis ŝancojn por gajni medalojn. La sinteno de la ludistinoj ne estas hontinda. La ludistinoj eĉ ne provis kaŝi la taktikon. Ili ludis evidente malbone, videble de ĉiuj. Se ili ludis nur iom pli bone por igi la taktikon iom malpli evidenta, sed sufiĉe malbone por perdi la maĉon, ili verŝajne ne estis eliminitaj.

Tio, kio estas hontinda ĉi tie ne estas la sinteno de la ludistinoj, sed la reguloj, kiuj donas avantaĝon al perdinto de maĉo. Estas ankaŭ hontinde kondamni ludistinojn, kiuj senkaŝe uzis la plej logikan strategion por gajni medalojn. La solvo estis dume facila: pli facilajn maĉojn oni ne devis absurde doni al tiuj, kiuj perdis, sed al tiuj, kiuj venkis antaŭajn maĉojn. Kun logikaj reguloj, neniu volonte perdus maĉon.

Kompreneble, perdi maĉon pro aliaj kialoj, kiel ekzemple mona korupto, estus tute neakceptebla. Sed ĉi-kaze, ne temis pri tio. Oni kondamnis la ludistinojn nejuste pro tio, ke ili inteligente kaj honeste uzis la aktualajn regulojn.

(2 komentoj | Afiŝu novan komenton)

julio 3-a, 2012
02:37 am

[Ligilo]

LanguageTool-1.8
Lingvoilo br Erru eo LanguageTool-1.8, stumm nevez an difazier LanguageTool evit ar brezhoneg ha yezhoù all. Ha petra nevez gantañ evit ar brezhoneg? Muioc’h a reolennoù evit kavout muioc’h a fazioù yezharurel e testennoù. Fazioù skrivadurel a gav bremañ ivez, evel evit ar yezhoù all. Lennit ar restr CHANGES.txt evit gouzout muioc’h. Kudenn ho peus kavet? Mennozhioù evit diskoachañ muioc’h a fazioù hoc’h eus marteze? Lavar din mar plij, evit gwellaat bemdez an difazier brezhoneg frank.

eo LanguageTool-1.8 (Lingvoilo-1.8) alvenis. La nova versio alportas novaĵojn por la Esperanta versio de la plurlingva gramatika kontrolilo. Krom kelketaj plibonigoj al la Esperantaj gramatikaj reguloj, ĉefe por atentigi pri malpli falsaj eraroj, LanguageTool nun donas ligilojn al PMEG aŭ la lernu.net por pliaj informoj pri multaj eraroj. Ekzemple, se oni tajpas «Bonvolu fermu la fenestron», la kontrolilo ne nur atentigas pri la eraro (la verbo «fermu» devus havi i-finaĵon) sed ankaŭ donas tiun ligilon por pliaj klarigoj. Espereble tio helpos lernantojn. Same kiel por aliaj lingvoj, Lingvoilo ankaŭ nun atentigas ne nur pri gramatikaj eraroj, sed ankaŭ pri literumaj eraroj. Legu pli pri la ŝanĝlisto en la dosiero CHANGES.txt. Ĉu vi trovis cimon, ĉu vi havas ideojn por trovi pliajn gramatikajn erarojn? Bonvolu diri al mi por daŭre plibonigi la Esperantan version de LanguageTool.

Tags:

(Afiŝu novan komenton)

junio 17-a, 2012
08:04 am

[Ligilo]

Pennad-kaoz a-zivout LanguageTool brezhonek / Intervjuo pri la bretona LanguageTool
Pennad-kaoz a-zivout LanguageTool br War lec'hienn radiobreizh e c’haller klevout ur pennad-kaoz berr a-zivout an difazier yezhadurel frank LanguageTool evit ar brezhoneg e-barzh OpenOffice/LibreOffice. Plijus eo da selaou. Ne gleven ket an anv LanguageTool avat.

eo Ĉe la retejo radiobreizh (radio-bretonio) oni povas aŭskulti mallongan intervjuon pri la gramatika korektilo LanguageTool (Lingvoilo) por la bretona lingvo per OpenOffice/LibreOffice. Agrablas aŭskulti. Tamen, mi ne aŭdis la nomon LanguageTool.

Tags: ,

(Afiŝu novan komenton)

majo 20-a, 2012
02:34 pm

[Ligilo]

Kromaĵo de Vim por gprof
eo Hodiaŭ mi verkis kromaĵon de Vim por emfazi sintakson en eliro de gprof (GNU-profililo) kaj faciligi navigadon en la alvoka grafeo de funkcioj. Jen demonstraĵo pere de Ŝelr.tv (registrilo/reludilo de terminalo verkita de antono).

Tags:

(Afiŝu novan komenton)

marto 25-a, 2012
10:12 pm

[Ligilo]

LanguageTool-1.7
Lingvoilo br Deuet eo er-maez stumm 1.7 an difazier yezhadurel liesyezhek frank LanguageTool. Kavout a ra muioc’h a fazioù. Labouret em eus dreist-holl evit gwellaat reolennoù e brezhoneg. Pellgargit LanguageTool evit LibreOffice. Tu 'zo d'ober gant LanguageTool ivez hep pellgargañ netra er bajenn-mañ.

eo La nova versio 1.7 de la plurlingva gramatika kontrolilo LanguageTool (Lingvoilo) nun haveblas. Mi precipe laboris por aldoni regulojn por la bretona versio. Elŝutu Lingvoilon por LibreOffice, aŭ uzu ĝin sen instali ion ajn en tiu paĝo.

Tags:

(Afiŝu novan komenton)

oktobro 1-a, 2011
11:40 am

[Ligilo]

LanguageTool e brezhoneg / Lingvoilo en la bretona / LanguageTool en breton
br Deuet eo LanguageTool-1.5 er-maez, an difazier yezhadurel liesyezhek frank evit LibreOffice/OpenOffice. Mont a ra mat en-dro evit Linux, Windows pe MacOs. Ha petra nevez gantañ? Ur bern traoù nevez e galleg, esperanteg hag all. Met an dra a blij din ar muiañ: LanguageTool a c’hall reizhañ testennoù e brezhoneg bremañ. Ya, ober a ran evit LanguageTool e galleg, esperanteg ha brezhoneg ivez bremañ. Spi am eus e vin gouest da wellaat LanguageTool dizale. Kalz a soñjadennoù am eus dija evit gwellaat anezhañ. Ne vefe ket posupl al labour-mañ hep geriadur brezhonek Apertium. Trugarekaat a ran neuze Francis Tyers ha Fulup Jakez evit o labour mat-kenañ gant ar geriadur-mañ hag evit bezañ roet an aotre din d’ober gant o geriadur brezhonek dindan LanguageTool. Trugarez vras ivez d’ar vreuriezh An Drouizig evit treiñ LibreOffice penn-da-benn e yezh ar vro hag evit o geriadur brezhonek Hunspell.

Ur bern reolennoù yezhadurel nevez a zo bet ouzhpennet dija abaoe ar stumm ofisiel LanguageTool-1.5. Gwelloc’h eo neuze pellgargañ LanguageTool nevesañ hizivaet bemdez, eget pellgargañ LanguageTool-1.5.

Gouzout a ran n’eo mat-mat ma brezhoneg siwazh. Kontant e vin neuze ma c’hall brezhonegerien all e c’hall reiñ un dorn din evit reizhañ pe gwelaat an testennoù brezhonek e LanguageTool hag all. Tu a zo da dreiñ e brezhoneg nebeud a kemmadennoù el lec‘hienn-mañ.

Evit gouzout penaos staliañ LanguageTool, sellit ouzh ar bajenn LanguageTool.

eo Ĵus haveblis LanguageTool-1.5, la libera plurlingva gramatika korektilo por LibreOffice/OpenOffice. Funkcias per Linukso, Vindozo aŭ Mak. Kio novas? Pluraj novaĵoj interalie en la esperanta kaj franca versioj. Sed tio, kio plej ekscitas min: Lingvoilo nun povas korekti tekstojn en la bretona lingvo. Jes, mi okupiĝas pri Lingvoilo en la franca, en Esperanto kaj nun ankaŭ en la bretona. Mi esperas, ke mi kapablos plibonigi ĝin baldaŭ. Mi jam havas multajn ideojn por plibonigi ĝin. Tiu laboro tute ne eblis sen trovi la bonegan bretonan vortaron de la projekto Apertium. Mi do dankas Francis Tyers kaj Fulup Jakez pro ilia vortaro de Apertium, kaj ankaŭ por lasi min uzi la bretonan vortaron en LanguageTool. Ankaŭ dankon al la asocio An Drouizig pro tute bretonigi LibreOffice kaj pro lia bretona vortaro Hunspell.

Mi jam aldonis multajn novajn gramatikajn regulojn ekde la oficiala versio LanguageTool-1.5. Indas do elŝuti la plej novan version ĝisdatigitan ĉiutage anstataŭ elŝuti LanguageTool-1.5.

Mi scias, ke mia nivelo en la bretona ne estas ankoraŭ tiom bona bedaŭrinde. Mi do ĝojus, se aliaj bretonistoj povus helpi por korekti erarojn en la tekstoj de Lingvoilo, ktp. Eblas bretonigi kelkajn mesaĝojn en tiu retejo.

Por scii kiel instali Lingvoilon, vidu la hejmpaĝon de Lingvoilo.

fr LanguageTool-1.5, le correcteur grammatical multilingue libre pour LibreOffice/OpenOffice vient de sortir. LanguageTool fonctionne avec Linux, Windows ou MacOs. Quoi de neuf ? Plusieurs nouveautés pour la version française et espéranto entre autres. Mais ce qui m’excite le plus, c’est que LanguageTool commence à corriger les textes en breton. Je m’occupe maintenant des versions de LanguageTool en français, espéranto et en breton. J’espère bien améliorer LanguageTool en breton bientôt. J‘ai un tas d’idées pour l’améliorer. Ce travail n’aurait pas été possible sans trouver le dictionnaire breton d’Apertium avec étiquettes morphologiques. Je remercie donc Fancis Tyers et Fulup Jakez pour leur travail sur le dictionnaire et pour m’autoriser à l’utiliser dans LanguageTool. Merci aussi à l’association An Drouizig pour avoir entièrement traduit LibreOffice en Breton et pour leur dictionnaire breton Hunspell.

Pas mal de règles grammaticales ont déjà été ajoutées depuis la version officielle LanguageTool-1.5. Je conseille donc de télécharger la version snapshot mise à jour quotidiennement, plutôt que LanguageTool-1.5.

Je sais que mon niveau de breton n’est pas encore très bon. Je serai donc content si des bretonnants peuvent donner un coup de main pour, entre autres, corriger ou améliorer les textes en breton dans LanguageTool. Il est possible de traduire quelques messages en breton sur ce site.

Pour en savoir plus, regardez la page de LanguageTool.

Tags: ,

(Afiŝu novan komenton)

septembro 3-a, 2011
12:38 pm

[Ligilo]

Kiel funkcias Lingvoilo?
Lingvoilo En ĉi tiu enskribo, mi pli-malpli priskribas tiel, kiel interne funkcias Lingvoilo, la gramatika kontrolilo por Esperanto kaj por multaj aliaj lingvoj. Mi esperas, ke tiuj klarigoj eble instigos aliulojn por kontribui al la plibonigo de Lingvoilo en Esperanto, aŭ eble en aliaj lingvoj.

Lingvoilo estas verkita en la programlingvo Ĝavao (Java). Gramatikaj reguloj estas priskribitaj en XML-dosieroj.

Kontrolado de enira teksto procedas en pluraj sinsekvaj fazoj.

1. Tranĉado de teksto en frazoj.

Unue, la enira teksto estas tranĉita en frazoj. Eblus simple tranĉi tekston en frazoj kiam ajn la programo trovas punktosignon, krisignon, demandosignon (ktp.). Tiuj signoj ja dislimas frazojn. Sed tiu simpla metodo ofte mistranĉus frazojn, kiam ekzemple frazo enhavus mallongigon kiel «t.e.» (tio estas). Kvankam tiu mallongigo enhavas punktojn, ĝi ne devus tranĉi tekston en multaj frazoj! La fraztranĉilo de Lingvoilo estas do pli inteligenta ol tio. Por bone tranĉi frazojn, Lingvoilo uzas SRX. SRX estas normo por precize tranĉi tekston. Oni povas agordi la fraztranĉilon per reguloj en XML-dosiero (languagetool/src/resource/segment.srx) kun ŝablonoj, kiu priskribas, kie tranĉi aŭ ne tranĉi frazojn. Ekzemple, por netranĉi frazojn ĉe oftaj mallongigoj, kiuj uzas punkton, la dosiero de SRX enhavas tian regulon:

<!-- Esperanto abbreviations (see http://eo.lernu.net/lernado/gramatiko/demandoj/mallongigoj.php) -->
<rule break="no">
<beforebreak>\b(div|[Ee]kz|h|[Ii]nkl|p|[Rr]ed|[Rr]im|ktp)\.\s</beforebreak>
<afterbreak>\p{Ll}</afterbreak>
</rule>
Kaj la ĉi-suba regulo indikas male, kie eblas tranĉi frazojn (tio estas nur fragmento de la pli ampleksa SRX-dosiero):
<rule break="yes">
<beforebreak>[\.!?…]['|"|«|\)|\]|\}]?\s+</beforebreak>
<afterbreak></afterbreak>
</rule>

2. Tranĉado de frazoj en vortoj

Post tranĉado de enira tekston en frazoj, Lingvoilo devas tranĉi frazojn en vortoj. Tio estas sufiĉe simpla afero: spacetoj kaj iuj interpunkciosignoj dislimas vortojn en la frazoj. Estas speciala traktado por la apostrofo, kiu povas fariĝi parto de vorto (l’, dank' al, …) en Esperanto.

La Ĝavao-kodofonto por tranĉi frazojn en vortoj de la Esperanta versio de Lingvoilo estas languagetool/src/java/org/languagetool/tokenizers/eo/EsperantoWordTokenizer.java

3. Aldono de gramatikaj etikedoj al vortoj

La programo poste aldonas etikedojn al ĉiuj vortoj de la frazoj. Tiuj etikedoj priskribas gramatikajn ecojn de la vortoj. Mi elektis kelkajn etikedojn taŭgajn por gramatika kontrolilo kaj listigis ilin en la dokumento languagetool/src/resources/eo/etikedoj.txt (helpa dosiero). Etikedoj indikas ekzemple, ĉu vorto estas o-vorto (substantivo), a-vorto (adjektivo) verbo, rolmontrilo (prepozicio), tabelvorto, nombro, ĉu vorto estas ununombra aŭ multenombra (pluralo), ĉu vorto havas akuzativon aŭ ne, ktp.

Ekzemple, la frazo «La domo malbelegas.» enhavas 3 vortojn. Eblas vidi la gramatikajn etikedojn, kiujn Lingvolilo donas al ĉiu vorto pere de la komanda opcio -v:

$ echo "La domoj malbelegas." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> La[la/D]  domoj[domo/O nak pl]  malbelegas[malbelegi/V nt as].[</S>]<P/>
En la supra ekzemplo:
  • la vorto «La» havas etikedon «D», ĉar la vorto estas difinilo.
  • La vorto «domoj» havas etikedon «O nak pl», ĉar ĝi estas O-vorto (substantivo), neakuzativa, kaj plurala.
  • La vorto «malbelegas» havas la etikedon «V nt as», ĉar ĝi estas verbo, netransitiva, kaj ĝi estas as-verbo (estanta tempo).

Rimarku ankaŭ, ke Lingvoilo ne nur donas gramatikajn etikedojn, sed ankaŭ normalan radikon de ĉiuj vortoj. T.e., la normala radiko de «domoj» estas «domo», la normala radiko de «malbelegas» estas «melbelegi». Ni vidu poste, kial utilas tion scii.

Por multaj lingvoj, kiel la angla, la franca (ktp.), oni bezonas vortaron por trovi etikedon de vortoj. Sed en Esperanto pli facilas, ĉar eblas doni etikedon al preskaŭ ĉiuj vortoj nur dank’ al la regula finaĵo de vortoj. Nu, malgranda vortaro estas tamen bezonata por la kelketaj vortoj kiuj havas neregulan finaĵon (ĉefe pronomoj, tabelvortoj, nombroj, ktp.). La dosiero languagetool/src/resource/eo/manual-tagger.txt listigas la vortojn kun neregulaj finaĵoj kaj donas iliajn etikedojn.

La programo ankaŭ bezonas vortareton por scii, ĉu verbo estas transitiva aŭ netransitiva. Eblas aŭtomate trovi transitivecon de verboj sen helpa vortaro nur por la -iĝ kaj -ig vortoj. Sed eĉ por tiuj -iĝ/-ig verboj, oni devas tamen atenti pri strangaĵo: la verbo memmortigi estas netransitiva, kvankam ĝi havas la finaĵon -ig. Mi kreis liston de transitivaj kaj netransitivaj verboj. Tiuj verboj estas listigitaj en la dosieroj languagetool/src/rules/eo/verb-tr.txt (transitivaj verboj) kaj languagetool/src/rules/eo/verb-ntr.txt (netransitivaj verboj). Kelkaj verboj povas esti ambaŭ transitivaj kaj netransitivaj, kaj tiuj verboj tiam aperas en ambaŭ dosieroj. Farinte tiun liston, mi konsciis, ke transitiveco estas iom nebula afero en Esperanto, kaj diversaj vortaroj donas malsamajn transitivecojn por kelkaj verboj. Por iuj verboj, vortaroj eĉ ne indikas transitivecon.

Ĉar en Esperanto eblas aldoni plurajn prefiksojn kaj sufiksojn al vortoj, ne vere eblas listigi ĉiujn validajn verbojn. La programo scias, ke iuj afiksoj neniam ŝanĝas transitivecon (mal-, mis-, ek-, re-, fi-, ne-, -ad, -aĉ, -eg, -et). Do se la vortaro indikas, ke la verbo «beli» estas netransitiva, la programo bone trovos, ke la verbo «malbelegas» (mal-bel-eg-as) estas ankaŭ netransitiva, êc se tiu verbo ne estas listigita en vortaro. Por nekonata verbo kiel «malbelegas», la programo trovas ĝian radikon «beli». Ĉar «beli» estas listigita kiel netransitiva verbo, Lingvoilo ĝuste donas netransitivan etikedon al la vorto «malbelegas». La programo devas serĉi en la vortaro antaŭ ol forigi prefikson/sufikson, ĉar kelkaj verboj havas falsajn afiksojn (ekz.: «respond/i» kaj ne «re-spond/i»).

Estas ankaŭ alia listo de vortoj por ne fuŝe doni etikedon de participoj (-at, -ant, vortoj). Tiu vortlisto estas bezonata por ne doni etikedon de participo al vortoj kiel elefant-o (kaj ne elef-ant-to!). Tiu listo de vortoj, kiu aspektas kiel participoj, sed ne estas participoj estas en la dosiero languagetool/src/rules/eo/root-ant-at.txt

La dosiero languagetool/src/java/org/languagetool/tagging/eo/EsperantoTagger.java enhavas la Ĝavao-fontkodon por aldoni etikedojn al vortoj.

4. Kongruo kun gramatikaj reguloj

Por atentigi pri gramatikaj eraroj, Lingvoilo listigas ŝablonojn de oftaj eraroj. Tiu ŝablonoj estas difinitaj en la XML-dosiero languagetool/src/rules/eo/grammar.xml. Tiu XML-dosiero estas vere la kerno de la programo. Kiam ajn frazo kongruas kun erarŝablono, la programo atentigas pri eraro en la frazo. Estas multaj erarŝablonoj en Lingvoilo, kaj la nombro de erarŝablonoj kreskadas por trovi pliajn erarojn en Esperanta teksto.

Mi ne priskribos ĉi tie ĉiujn eblaĵojn por skribado de gramatikaj XML-dosieroj de Lingvoilo. Por pli amplaksaj informoj, vidu la retejon de LanguageTool.

Ni unue rigardu tre simplan gramatikan ŝablonon en la dosiero languagetool/src/rules/eo/grammar.xml:

<rule id="ANSTATAUX_OL" name="anstataŭ + ol (anstataŭ)">
  <pattern>
    <token>anstataŭ</token>
    <token>ol</token>
  </pattern>
  <message>Uzu <suggestion>\1</suggestion> (sen «ol»).</message>
  <example type="incorrect">Li rezignis <marker>anstataŭ ol</marker> lerni la lingvon.</example>
  <example type="correct">Li rezignis anstataŭ lerni la lingvon.</example>
</rule>
Tiu regulo estas unu el la plej simplaj gramatikaj reguloj en Lingvoilo. Kion faras tiu regulo? Kiam ajn la sinsekvaj vortoj «anstataŭ ol» aperas en frazo, Lingvoilo atentigas pri eraro, klarigas kial estas eraro, kaj donas sugeston por korekti la eraron.

La ŝablono de la eraro estas ene de <pattern> … </pattern>

La ekzemplojn en la regulo helpas la programiston por klarigi tion, kion faras la regulo. Tiuj ekzemploj (<example … >) ne nur helpas komprenigi la regulon, sed ili estas ankaŭ uzataj por aŭtomate testi la programon. Alivorte, kiam oni lanĉas ant test en komanda linio, la programo kontrolas, ke ĉiu ekzemplaj frazoj kun type="incorrect" ja kaŭzas gramatikan eraron, kaj ĉiuj ekzemplaj frazoj kun type="correct" ja ne kaŭzas gramatikan eraron. La aŭtomata testado estas tre grava, ĉar facilas fuŝi dum kreado de XML-reguloj! Kaj la ekzemploj tiam plej ofte trovas cimojn.

Jen kiel Lingvoilo atentigas, se oni lanĉas Lingvoilon en komanda linio kun erara frazo, kiu kongruas kun la ĉi-supra regulo:

$ echo "Li ludis anstataŭ ol studi." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v 
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Li[li/R nak np]  ludis[ludi/V tn is]  anstataŭ[anstataŭ/P kak]  ol[ol/_]  studi[studi/V tr i].[</S>]<P/> 
1.) Line 1, column 10, Rule ID: ANSTATAUX_OL[1]
Message: Uzu 'anstataŭ' (sen «ol»).
Suggestion: anstataŭ
Li ludis anstataŭ ol studi. 
         ^^^^^^^^^^^        
Time: 80ms for 1 sentences (12.5 sentences/sec)
Ni nun vidu alian (ankoraŭ simplan) regulon, kiu montras alian gravan eblon en la XML-reguloj:
<rule id="MALGRAUX_V" name="malgraŭ + verbo">
  <pattern>
    <token>malgraŭ</token>
    <token postag="V .*" postag_regexp="yes"/>
  </pattern>
  <message>Anstataŭ «\1 \2», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «\1 tio, ke + plenan subfrazon».</message>
  <example type="incorrect"><marker>Malgraŭ fali</marker>, li batalis.</example>
  <example type="correct">Malgraŭ tio, ke li falis, li batalis.</example>
  <example type="correct">Kvankam li falfis, li batalis.</example>
</rule>
Ĉi tie, la dua ĵeteno en la ŝablono estas priskribita pere de ĝia gramatika etikedo (postag) anstataŭ pere de vorto. Vorto, por kiu ĝia gramatika etikedo kongruas kun "V .*" estas verbo. Do tiu regulo atentigas pri eraro, kiam ajn estas verbo post la vorto «malgraŭ». Rimarku, ke oni povas flekseble priskribi tiun etikedon per regula esprimo.

Lingvoilo atentigas jene pri la eraro:

$ echo "Malgraŭ fali, li batalis." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v 
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Malgraŭ[malgraŭ/P sak]  fali[fali/V nt i],[,]  li[li/R nak np]  batalis[batali/V nt is].[</S>]<P/> 
1.) Line 1, column 1, Rule ID: MALGRAUX_V[1]
Message: Anstataŭ «Malgraŭ fali», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «Malgraŭ tio, ke + plenan subfrazon».
Malgraŭ fali, li batalis. 
^^^^^^^^^^^^              
Time: 65ms for 1 sentences (15.4 sentences/sec)

Ni nun vidu iom pli malsimplan regulon, kiu montras aliajn eblaĵojn:

<rule id="LITERO_LETERO" name="Litero (Letero)">
  <pattern mark_from="1">
    <token skip="2" inflected="yes" regexp="yes">.*(adres|send|redakt|leg|ricev)i</token>
    <token inflected="yes">litero
      <exception scope="previous" regexp="yes">((mal)?(grand|et)aj?n)|(ĉin|japan)aj?n?</exception></token>
  </pattern>
  <message>Ĉu vi intencis <suggestion><match no="2" regexp_match="(.).(.*)" regexp_replace="$1e$2"/></suggestion> anstataŭ «\2»?</message>
  <example type="incorrect">Mi dissendis la <marker>literon</marker>.</example>
  <example type="correct">Mi dissendis la <marker>leteron</marker>.</example>
  <example type="correct">Mi ne povas legi etajn literojn.</example>
</rule>
Tiu regulo atentigas pri verŝajna konfuzo inter la vortoj «litero» kaj «letero» laŭ la kunteksto.

Ĉar en tiu regulo tute ne gravas, ĉu la unua vorto estas «sendi», aŭ «sendis», «sendos» (ktp.), pro tio la regulo kongruas kun la norma radiko de la vorto uzante inflected="yes" anstataŭ kun la vorto mem. Rimarku ankaŭ aliajn aferojn en tiu regulo:

  • Regula esprimo (.*(adres|send|redakt|leg|ricev)i) povas esti ankaŭ uzata por la vorto (dank’ al regexp="yes").
  • Inteligenta substituo en la mesaĝo eblas dank’ al <match …>. Tio ebligas la programon por bone korekti ŝanĝante «litero» en «letero», «literoj» en «leteroj», ktp.
  • Uzo de skip="2" signifas, ke povas esti inter 0 kaj 2 aliaj vortoj inter la verbo «adresi/sendi/redakti/legi/ricevi» kaj la vorto litero/literoj/literojn en la kontrolenda teksto.
  • Uzo de escepto en ŝablono: la regulo atentigas pri misuzo de la vorto «litero» apud la verbo sendi/skribi (ktp.) krom tiam, kiam la vorto ĝuste antaŭ la vorto «litero» estas io kiel «eta/ĉina/japana» (ktp.) Tiu escepto esta por eviti neverajn erarojn en frazo kiel «Mi ne povas legi etajn literojn.», kie la vorto «litero» sufiĉe verŝajnas sen esti erara. Kompreneble, estas heŭristiko ĉi tie. Plej verŝajne ekzistas frazoj, kie la programo atentigos pri ĝusta frazo. Tamen, estas sufiĉe neverŝajna, kaj oni povas aldoni pliajn esceptojn laŭ bezone por eviti neverajn erarojn.
Jen, kiel Lingvoilo atentigas en komanda linio pri tiu regulo:
$ echo "Mi ne ricevis vian literon." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Mi[mi/R nak np]  ne[ne/_]  ricevis[ricevi/V tr is]  vian[via/A akz np]  literon[litero/O akz np].[</S>]<P/> 
1.) Line 1, column 20, Rule ID: LITERO_LETERO[1]
Message: Ĉu vi intencis 'leteron' anstataŭ «literon»?
Suggestion: leteron
Mi ne ricevis vian literon. 
                   ^^^^^^^  
Time: 72ms for 1 sentences (13.9 sentences/sec)
Eblas ankaŭ difini gramatikajn regulojn en Ĝavao anstataŭ XML, sed ĝis nun, la Esperanta kontrolilo ne bezonis tiajn regulojn.

Vi nun scias preskaŭ ĉion pri Lingvoilo. La metodo de Lingvoilo certe havas limojn, ĉar la programo ne vere analizas la gramatikan strukturon de la frazoj. Tamen, kun sufiĉe da erarŝablonoj, la programo certe fariĝas utila, sen troaj malveraj atentigoj.

Tags: ,

(4 komentoj | Afiŝu novan komenton)

junio 26-a, 2011
09:24 pm

[Ligilo]

Lingvoilo-1.4
eo Nova versio de la gramatika kontrolilo Lingvoilo-1.4 nun haveblas. La listo de ŝanĝoj legeblas tie.

fr Une nouvelle version du correcteur grammatical LanguageTool-1.4 est maintenant disponible. La liste des changements est disponible ici.

Tags:

(Afiŝu novan komenton)

junio 5-a, 2011
02:00 pm

[Ligilo]

Fukuŝima
Atoma energio, ne dankonMi iam estis favora al la atoma energio, ĉar mi taksis ĝin plu pura por la tutmonda varmiĝo ol aliaj fontoj de energio, krom kompreneble la renovigeblaj energioj kiel vento. Sed la eventoj en Fukiŝima (Japanio) igis min ŝanĝi opinion. Atoma energio tro danĝeras por la homaro. Jes tutmonda varmiĝo malbonas, sed tutmonda atoma poluado eĉ pli malbonas. Kaj danĝeros por multaj jaroj post akcidento. Duonvivo de Cezio-137 estas 30 jaroj. Tio estas, la kvanto de Cezio-137 duoniĝas post 30 jaroj. La Cezio-137 de Ĉernobil ankoraŭ malsanigas homojn kaj bestojn en Eŭropo post 25 jaroj, kaj daŭre faros tion dum la venontaj jarcentoj. Duonjaro de plutonio-239 estas 24000 jaroj. Plie, plutonio estas ege danĝera substanco por la homo, kaj malfacilas detekti ĝin. Ordinara radioaktivdetektilo ne detektas ĝin. Ni ne rajtas riski poluadon de tutmonda planedo por miloj da anoj. Estas krimo kontraŭ la tutmonda homaro. Fakte, ne vere eblas kalkuli tiujn riskojn. Certe la tertremoj okazas pli ofte en Japanio ol en Eŭropo, kie mi loĝas, sed estas ĉiam aliaj riskoj, kiel ekzemple milito, terorista saboto, aŭ simple homa eraro. Ĉar estas nun multaj atomcentraloj en la mondo, mi timas, ke aliaj gravaj akcidentoj okazos. La historio montras, ke jam okazis tro ofte. Krom la riskoj, estas ankaŭ neniu taŭga solvo por la ĉiam kreskantaj forĵetaĵoj de atoma energio. Alia problemo de atoma energio, estas ke la landoj kiuj produktas ĝin, povas poste ankaŭ produkti militan plutonion por militaj kialoj. Tio ne estas akceptebla. Militistoj, kiu ŝoke uzis Uranion (depleted Uranium) en Irako kaj verŝajne denove uzas ĝin en Libio, poluante por miliardoj da jaroj, certe ne fidindas. Ĉu estas pli granda krimo? La atoma industrio ankaŭ ne sufiĉe fidindas. La atoma industrio ĉiam trompis la homojn en ĉiuj akcidentoj kiel Three Miles Island, Ĉernobil kaj nun en Fukuŝima. La atoma industrio parolas pri la avantaĝoj de atoma energio (kaj verdire estas ja teorie avantaĝoj) sed forlasas la malavantaĝojn aŭ malgravigas ilin. La ĵurnalistoj ankaŭ ial misinformas, aŭ ne informas pri la realo de tiuj akcidentoj. Fakte, nuntempe, la ĵurnaloj preskaŭ ne plu parolas pri Fukuŝima malgraŭ la graveco de tiu evento. Mirigas min, ke piedpilko okupas pli da spaco ol Fukuŝima almenaŭ en la francaj ĵurnaloj. Bonŝance, eblas trovi informojn per Interreto por tiuj, kiuj serĉas. Mi rekomendas aŭskulti (angllingve) tion, kion diras spertuloj kiel Arnie Gunderson, Helen Caldicott kaj Conrad Miller. Ili havas plurajn interesajn videaĵojn. Franculo en Tokio ankaŭ faris multajn videaĵojn pri la situacio en Japanio. Li porolas kun forta ridetiganta franca akĉento, sed preterlasu tion: li bone diras tion, kio okazas en Japanio, kaj tion, kion li pensas. Por tiuj, kiuj scipovas la francan, mi rekomendas la intervjuon de Alain de Halleux.

Mi demandas min, kio estas la estonteco de Japanio nun kun 3 fundoj de reaktoroj. Kio estas la solvo por tio? Entombigo de la reaktoroj ne vere estas solvo, ĉar la poluadoj eniros la grundon, atingos la akvon en la grundo, migros for aliloke en lando, eniros la nutroĉenon, ktp. TEPCO anoncis, ke reaktoroj 1, 2 kaj 3 fondis. Reaktoro 3 enhavas MOX, tio estas ĝi enhavas grandan kvanton de plutonio, kiu estas tre danĝera. Estas eble la plej danĝera substanco, kiu ekzistas. Do estas tre grava evento, mi timas. Fakte, la aliaj reaktoroj ankaŭ enhavas plutonion (produktita en reaktoro), sed malpli ol reaktoro 3.

Ni devas lerni pro tio. La homaro devas uzi malpli da energio, sed malfacilos. Kiel konvinki ĉiujn? Jen utopio eĉ pli granda ol la fina venko. Ĝenas min ekzemple vidi butikojn kun lumoj en iliaj montrofenestroj eĉ vespere, kiam la butikoj estas jam delonge fermitaj. Eblus fari leĝon por igi tion kontraŭleĝa. Ĝenas min vidi restoraciojn kun eksteraj varmiloj por la klientoj kiuj decidas manĝi ekstere eĉ kiam la vetero malvarmas. En Francio, mi memoras legi ke oni varmigas gazonon de stadio de piedpilko, por ke ĝi ne glaciiĝu dum la vintro. Ĝenas min vidi reklamojn kun elektra afiŝilo. Ĉu ne eblas igi tion kontraŭleĝa? Ĝenas min vidi kiel multaj aĉetas novan poŝtelefonilon je pli malpli ĉiuj 2 jaroj, sen pensi, ke tiu freneza konsumado damaĝas la planedon, produktinte, uzante kaj finfine ĵetonte la efemeran produktaĵon. Ni ne vere bezonas novan poŝtelefonilon, nur pro tio, ke ĝi havas pli belan interfacon. La energio bezonas esti iel pli multekosta, por ke ni ekŝparu ĝin.

(Afiŝu novan komenton)

[<< Previous 10 entries]

Mia TTT-ejo Funkciigita de LiveJournal.com