You are viewing [info]dominiko's journal

Ur yezh hepken n’eo ket a-walc’h / Nur unu lingvo ne sufiĉas Below are the 10 most recent journal entries recorded in the "dominiko" journal:

[<< Previous 10 entries]

majo 20-a, 2012
02:34 pm

[Ligilo]

Kromaĵo de Vim por gprof
eo Hodiaŭ mi verkis kromaĵon de Vim por emfazi sintakson en eliro de gprof (GNU-profililo) kaj faciligi navigadon en la alvoka grafeo de funkcioj. Jen demonstraĵo pere de Ŝelr.tv (registrilo/reludilo de terminalo verkita de [info]antono).

Tags:

(Afiŝu novan komenton)

marto 25-a, 2012
10:12 pm

[Ligilo]

LanguageTool-1.7
Lingvoilo br Deuet eo er-maez stumm 1.7 an difazier yezhadurel liesyezhek frank LanguageTool. Kavout a ra muioc’h a fazioù. Labouret em eus dreist-holl evit gwellaat reolennoù e brezhoneg. Pellgargit LanguageTool evit LibreOffice. Tu 'zo d'ober gant LanguageTool ivez hep pellgargañ netra er bajenn-mañ.

eo La nova versio 1.7 de la plurlingva gramatika kontrolilo LanguageTool (Lingvoilo) nun haveblas. Mi precipe laboris por aldoni regulojn por la bretona versio. Elŝutu Lingvoilon por LibreOffice, aŭ uzu ĝin sen instali ion ajn en tiu paĝo.

Tags:

(Afiŝu novan komenton)

oktobro 1-a, 2011
11:40 am

[Ligilo]

LanguageTool e brezhoneg / Lingvoilo en la bretona / LanguageTool en breton
br Deuet eo LanguageTool-1.5 er-maez, an difazier yezhadurel liesyezhek frank evit LibreOffice/OpenOffice. Mont a ra mat en-dro evit Linux, Windows pe MacOs. Ha petra nevez gantañ? Ur bern traoù nevez e galleg, esperanteg hag all. Met an dra a blij din ar muiañ: LanguageTool a c’hall reizhañ testennoù e brezhoneg bremañ. Ya, ober a ran evit LanguageTool e galleg, esperanteg ha brezhoneg ivez bremañ. Spi am eus e vin gouest da wellaat LanguageTool dizale. Kalz a soñjadennoù am eus dija evit gwellaat anezhañ. Ne vefe ket posupl al labour-mañ hep geriadur brezhonek Apertium. Trugarekaat a ran neuze Francis Tyers ha Fulup Jakez evit o labour mat-kenañ gant ar geriadur-mañ hag evit bezañ roet an aotre din d’ober gant o geriadur brezhonek dindan LanguageTool. Trugarez vras ivez d’ar vreuriezh An Drouizig evit treiñ LibreOffice penn-da-benn e yezh ar vro hag evit o geriadur brezhonek Hunspell.

Ur bern reolennoù yezhadurel nevez a zo bet ouzhpennet dija abaoe ar stumm ofisiel LanguageTool-1.5. Gwelloc’h eo neuze pellgargañ LanguageTool nevezañ hizivaet bemdez, eget pellgargañ LanguageTool-1.5.

Gouzout a ran n’eo mat-mat ma brezhoneg siwazh. Kontant e vin neuze ma c’hall brezhonegerien all e c’hall reiñ un dorn din evit reizhañ pe gwelaat an testennoù brezhonek e LanguageTool hag all. Tu a zo da dreiñ e brezhoneg nebeud a kemmadennoù el lec‘hienn-mañ.

Evit gouzout penaos staliañ LanguageTool, sellit ouzh ar bajenn LanguageTool.

eo Ĵus haveblis LanguageTool-1.5, la libera plurlingva gramatika korektilo por LibreOffice/OpenOffice. Funkcias per Linukso, Vindozo aŭ Mak. Kio novas? Pluraj novaĵoj interalie en la esperanta kaj franca versioj. Sed tio, kio plej ekscitas min: Lingvoilo nun povas korekti tekstojn en la bretona lingvo. Jes, mi okupiĝas pri Lingvoilo en la franca, en Esperanto kaj nun ankaŭ en la bretona. Mi esperas, ke mi kapablos plibonigi ĝin baldaŭ. Mi jam havas multajn ideojn por plibonigi ĝin. Tiu laboro tute ne eblis sen trovi la bonegan bretonan vortaron de la projekto Apertium. Mi do dankas Francis Tyers kaj Fulup Jakez pro ilia vortaro de Apertium, kaj ankaŭ por lasi min uzi la bretonan vortaron en LanguageTool. Ankaŭ dankon al la asocio An Drouizig pro tute bretonigi LibreOffice kaj pro lia bretona vortaro Hunspell.

Mi jam aldonis multajn novajn gramatikajn regulojn ekde la oficiala versio LanguageTool-1.5. Indas do elŝuti la plej novan version ĝisdatigitan ĉiutage anstataŭ elŝuti LanguageTool-1.5.

Mi scias, ke mia nivelo en la bretona ne estas ankoraŭ tiom bona bedaŭrinde. Mi do ĝojus, se aliaj bretonistoj povus helpi por korekti erarojn en la tekstoj de Lingvoilo, ktp. Eblas bretonigi kelkajn mesaĝojn en tiu retejo.

Por scii kiel instali Lingvoilon, vidu la hejmpaĝon de Lingvoilo.

fr LanguageTool-1.5, le correcteur grammatical multilingue libre pour LibreOffice/OpenOffice vient de sortir. LanguageTool fonctionne avec Linux, Windows ou MacOs. Quoi de neuf ? Plusieurs nouveautés pour la version française et espéranto entre autres. Mais ce qui m’excite le plus, c’est que LanguageTool commence à corriger les textes en breton. Je m’occupe maintenant des versions de LanguageTool en français, espéranto et en breton. J’espère bien améliorer LanguageTool en breton bientôt. J‘ai un tas d’idées pour l’améliorer. Ce travail n’aurait pas été possible sans trouver le dictionnaire breton d’Apertium avec étiquettes morphologiques. Je remercie donc Fancis Tyers et Fulup Jakez pour leur travail sur le dictionnaire et pour m’autoriser à l’utiliser dans LanguageTool. Merci aussi à l’association An Drouizig pour avoir entièrement traduit LibreOffice en Breton et pour leur dictionnaire breton Hunspell.

Pas mal de règles grammaticales ont déjà été ajoutées depuis la version officielle LanguageTool-1.5. Je conseille donc de télécharger la version snapshot mise à jour quotidiennement, plutôt que LanguageTool-1.5.

Je sais que mon niveau de breton n’est pas encore très bon. Je serai donc content si des bretonnants peuvent donner un coup de main pour, entre autres, corriger ou améliorer les textes en breton dans LanguageTool. Il est possible de traduire quelques messages en breton sur ce site.

Pour en savoir plus, regardez la page de LanguageTool.

Tags: ,

(Afiŝu novan komenton)

septembro 3-a, 2011
12:38 pm

[Ligilo]

Kiel funkcias Lingvoilo?
Lingvoilo En ĉi tiu enskribo, mi pli-malpli priskribas tiel, kiel interne funkcias Lingvoilo, la gramatika kontrolilo por Esperanto kaj por multaj aliaj lingvoj. Mi esperas, ke tiuj klarigoj eble instigos aliulojn por kontribui al la plibonigo de Lingvoilo en Esperanto, aŭ eble en aliaj lingvoj.

Lingvoilo estas verkita en la programlingvo Ĝavao (Java). Gramatikaj reguloj estas priskribitaj en XML-dosieroj.

Kontrolado de enira teksto procedas en pluraj sinsekvaj fazoj.

1. Tranĉado de teksto en frazoj.

Unue, la enira teksto estas tranĉita en frazoj. Eblus simple tranĉi tekston en frazoj kiam ajn la programo trovas punktosignon, krisignon, demandosignon (ktp.). Tiuj signoj ja dislimas frazojn. Sed tiu simpla metodo ofte mistranĉus frazojn, kiam ekzemple frazo enhavus mallongigon kiel «t.e.» (tio estas). Kvankam tiu mallongigo enhavas punktojn, ĝi ne devus tranĉi tekston en multaj frazoj! La fraztranĉilo de Lingvoilo estas do pli inteligenta ol tio. Por bone tranĉi frazojn, Lingvoilo uzas SRX. SRX estas normo por precize tranĉi tekston. Oni povas agordi la fraztranĉilon per reguloj en XML-dosiero (languagetool/src/resource/segment.srx) kun ŝablonoj, kiu priskribas, kie tranĉi aŭ ne tranĉi frazojn. Ekzemple, por netranĉi frazojn ĉe oftaj mallongigoj, kiuj uzas punkton, la dosiero de SRX enhavas tian regulon:

<!-- Esperanto abbreviations (see http://eo.lernu.net/lernado/gramatiko/demandoj/mallongigoj.php) -->
<rule break="no">
<beforebreak>\b(div|[Ee]kz|h|[Ii]nkl|p|[Rr]ed|[Rr]im|ktp)\.\s</beforebreak>
<afterbreak>\p{Ll}</afterbreak>
</rule>
Kaj la ĉi-suba regulo indikas male, kie eblas tranĉi frazojn (tio estas nur fragmento de la pli ampleksa SRX-dosiero):
<rule break="yes">
<beforebreak>[\.!?…]['|"|«|\)|\]|\}]?\s+</beforebreak>
<afterbreak></afterbreak>
</rule>

2. Tranĉado de frazoj en vortoj

Post tranĉado de enira tekston en frazoj, Lingvoilo devas tranĉi frazojn en vortoj. Tio estas sufiĉe simpla afero: spacetoj kaj iuj interpunkciosignoj dislimas vortojn en la frazoj. Estas speciala traktado por la apostrofo, kiu povas fariĝi parto de vorto (l’, dank' al, …) en Esperanto.

La Ĝavao-kodofonto por tranĉi frazojn en vortoj de la Esperanta versio de Lingvoilo estas languagetool/src/java/org/languagetool/tokenizers/eo/EsperantoWordTokenizer.java

3. Aldono de gramatikaj etikedoj al vortoj

La programo poste aldonas etikedojn al ĉiuj vortoj de la frazoj. Tiuj etikedoj priskribas gramatikajn ecojn de la vortoj. Mi elektis kelkajn etikedojn taŭgajn por gramatika kontrolilo kaj listigis ilin en la dokumento languagetool/src/resources/eo/etikedoj.txt (helpa dosiero). Etikedoj indikas ekzemple, ĉu vorto estas o-vorto (substantivo), a-vorto (adjektivo) verbo, rolmontrilo (prepozicio), tabelvorto, nombro, ĉu vorto estas ununombra aŭ multenombra (pluralo), ĉu vorto havas akuzativon aŭ ne, ktp.

Ekzemple, la frazo «La domo malbelegas.» enhavas 3 vortojn. Eblas vidi la gramatikajn etikedojn, kiujn Lingvolilo donas al ĉiu vorto pere de la komanda opcio -v:

$ echo "La domoj malbelegas." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> La[la/D]  domoj[domo/O nak pl]  malbelegas[malbelegi/V nt as].[</S>]<P/>
En la supra ekzemplo:
  • la vorto «La» havas etikedon «D», ĉar la vorto estas difinilo.
  • La vorto «domoj» havas etikedon «O nak pl», ĉar ĝi estas O-vorto (substantivo), neakuzativa, kaj plurala.
  • La vorto «malbelegas» havas la etikedon «V nt as», ĉar ĝi estas verbo, netransitiva, kaj ĝi estas as-verbo (estanta tempo).

Rimarku ankaŭ, ke Lingvoilo ne nur donas gramatikajn etikedojn, sed ankaŭ normalan radikon de ĉiuj vortoj. T.e., la normala radiko de «domoj» estas «domo», la normala radiko de «malbelegas» estas «melbelegi». Ni vidu poste, kial utilas tion scii.

Por multaj lingvoj, kiel la angla, la franca (ktp.), oni bezonas vortaron por trovi etikedon de vortoj. Sed en Esperanto pli facilas, ĉar eblas doni etikedon al preskaŭ ĉiuj vortoj nur dank’ al la regula finaĵo de vortoj. Nu, malgranda vortaro estas tamen bezonata por la kelketaj vortoj kiuj havas neregulan finaĵon (ĉefe pronomoj, tabelvortoj, nombroj, ktp.). La dosiero languagetool/src/resource/eo/manual-tagger.txt listigas la vortojn kun neregulaj finaĵoj kaj donas iliajn etikedojn.

La programo ankaŭ bezonas vortareton por scii, ĉu verbo estas transitiva aŭ netransitiva. Eblas aŭtomate trovi transitivecon de verboj sen helpa vortaro nur por la -iĝ kaj -ig vortoj. Sed eĉ por tiuj -iĝ/-ig verboj, oni devas tamen atenti pri strangaĵo: la verbo memmortigi estas netransitiva, kvankam ĝi havas la finaĵon -ig. Mi kreis liston de transitivaj kaj netransitivaj verboj. Tiuj verboj estas listigitaj en la dosieroj languagetool/src/rules/eo/verb-tr.txt (transitivaj verboj) kaj languagetool/src/rules/eo/verb-ntr.txt (netransitivaj verboj). Kelkaj verboj povas esti ambaŭ transitivaj kaj netransitivaj, kaj tiuj verboj tiam aperas en ambaŭ dosieroj. Farinte tiun liston, mi konsciis, ke transitiveco estas iom nebula afero en Esperanto, kaj diversaj vortaroj donas malsamajn transitivecojn por kelkaj verboj. Por iuj verboj, vortaroj eĉ ne indikas transitivecon.

Ĉar en Esperanto eblas aldoni plurajn prefiksojn kaj sufiksojn al vortoj, ne vere eblas listigi ĉiujn validajn verbojn. La programo scias, ke iuj afiksoj neniam ŝanĝas transitivecon (mal-, mis-, ek-, re-, fi-, ne-, -ad, -aĉ, -eg, -et). Do se la vortaro indikas, ke la verbo «beli» estas netransitiva, la programo bone trovos, ke la verbo «malbelegas» (mal-bel-eg-as) estas ankaŭ netransitiva, êc se tiu verbo ne estas listigita en vortaro. Por nekonata verbo kiel «malbelegas», la programo trovas ĝian radikon «beli». Ĉar «beli» estas listigita kiel netransitiva verbo, Lingvoilo ĝuste donas netransitivan etikedon al la vorto «malbelegas». La programo devas serĉi en la vortaro antaŭ ol forigi prefikson/sufikson, ĉar kelkaj verboj havas falsajn afiksojn (ekz.: «respond/i» kaj ne «re-spond/i»).

Estas ankaŭ alia listo de vortoj por ne fuŝe doni etikedon de participoj (-at, -ant, vortoj). Tiu vortlisto estas bezonata por ne doni etikedon de participo al vortoj kiel elefant-o (kaj ne elef-ant-to!). Tiu listo de vortoj, kiu aspektas kiel participoj, sed ne estas participoj estas en la dosiero languagetool/src/rules/eo/root-ant-at.txt

La dosiero languagetool/src/java/org/languagetool/tagging/eo/EsperantoTagger.java enhavas la Ĝavao-fontkodon por aldoni etikedojn al vortoj.

4. Kongruo kun gramatikaj reguloj

Por atentigi pri gramatikaj eraroj, Lingvoilo listigas ŝablonojn de oftaj eraroj. Tiu ŝablonoj estas difinitaj en la XML-dosiero languagetool/src/rules/eo/grammar.xml. Tiu XML-dosiero estas vere la kerno de la programo. Kiam ajn frazo kongruas kun erarŝablono, la programo atentigas pri eraro en la frazo. Estas multaj erarŝablonoj en Lingvoilo, kaj la nombro de erarŝablonoj kreskadas por trovi pliajn erarojn en Esperanta teksto.

Mi ne priskribos ĉi tie ĉiujn eblaĵojn por skribado de gramatikaj XML-dosieroj de Lingvoilo. Por pli amplaksaj informoj, vidu la retejon de LanguageTool.

Ni unue rigardu tre simplan gramatikan ŝablonon en la dosiero languagetool/src/rules/eo/grammar.xml:

<rule id="ANSTATAUX_OL" name="anstataŭ + ol (anstataŭ)">
  <pattern>
    <token>anstataŭ</token>
    <token>ol</token>
  </pattern>
  <message>Uzu <suggestion>\1</suggestion> (sen «ol»).</message>
  <example type="incorrect">Li rezignis <marker>anstataŭ ol</marker> lerni la lingvon.</example>
  <example type="correct">Li rezignis anstataŭ lerni la lingvon.</example>
</rule>
Tiu regulo estas unu el la plej simplaj gramatikaj reguloj en Lingvoilo. Kion faras tiu regulo? Kiam ajn la sinsekvaj vortoj «anstataŭ ol» aperas en frazo, Lingvoilo atentigas pri eraro, klarigas kial estas eraro, kaj donas sugeston por korekti la eraron.

La ŝablono de la eraro estas ene de <pattern> … </pattern>

La ekzemplojn en la regulo helpas la programiston por klarigi tion, kion faras la regulo. Tiuj ekzemploj (<example … >) ne nur helpas komprenigi la regulon, sed ili estas ankaŭ uzataj por aŭtomate testi la programon. Alivorte, kiam oni lanĉas ant test en komanda linio, la programo kontrolas, ke ĉiu ekzemplaj frazoj kun type="incorrect" ja kaŭzas gramatikan eraron, kaj ĉiuj ekzemplaj frazoj kun type="correct" ja ne kaŭzas gramatikan eraron. La aŭtomata testado estas tre grava, ĉar facilas fuŝi dum kreado de XML-reguloj! Kaj la ekzemploj tiam plej ofte trovas cimojn.

Jen kiel Lingvoilo atentigas, se oni lanĉas Lingvoilon en komanda linio kun erara frazo, kiu kongruas kun la ĉi-supra regulo:

$ echo "Li ludis anstataŭ ol studi." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v 
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Li[li/R nak np]  ludis[ludi/V tn is]  anstataŭ[anstataŭ/P kak]  ol[ol/_]  studi[studi/V tr i].[</S>]<P/> 
1.) Line 1, column 10, Rule ID: ANSTATAUX_OL[1]
Message: Uzu 'anstataŭ' (sen «ol»).
Suggestion: anstataŭ
Li ludis anstataŭ ol studi. 
         ^^^^^^^^^^^        
Time: 80ms for 1 sentences (12.5 sentences/sec)
Ni nun vidu alian (ankoraŭ simplan) regulon, kiu montras alian gravan eblon en la XML-reguloj:
<rule id="MALGRAUX_V" name="malgraŭ + verbo">
  <pattern>
    <token>malgraŭ</token>
    <token postag="V .*" postag_regexp="yes"/>
  </pattern>
  <message>Anstataŭ «\1 \2», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «\1 tio, ke + plenan subfrazon».</message>
  <example type="incorrect"><marker>Malgraŭ fali</marker>, li batalis.</example>
  <example type="correct">Malgraŭ tio, ke li falis, li batalis.</example>
  <example type="correct">Kvankam li falfis, li batalis.</example>
</rule>
Ĉi tie, la dua ĵeteno en la ŝablono estas priskribita pere de ĝia gramatika etikedo (postag) anstataŭ pere de vorto. Vorto, por kiu ĝia gramatika etikedo kongruas kun "V .*" estas verbo. Do tiu regulo atentigas pri eraro, kiam ajn estas verbo post la vorto «malgraŭ». Rimarku, ke oni povas flekseble priskribi tiun etikedon per regula esprimo.

Lingvoilo atentigas jene pri la eraro:

$ echo "Malgraŭ fali, li batalis." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v 
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Malgraŭ[malgraŭ/P sak]  fali[fali/V nt i],[,]  li[li/R nak np]  batalis[batali/V nt is].[</S>]<P/> 
1.) Line 1, column 1, Rule ID: MALGRAUX_V[1]
Message: Anstataŭ «Malgraŭ fali», oni uzas participon kun e-finaĵo, aŭ «kvankam», aŭ «Malgraŭ tio, ke + plenan subfrazon».
Malgraŭ fali, li batalis. 
^^^^^^^^^^^^              
Time: 65ms for 1 sentences (15.4 sentences/sec)

Ni nun vidu iom pli malsimplan regulon, kiu montras aliajn eblaĵojn:

<rule id="LITERO_LETERO" name="Litero (Letero)">
  <pattern mark_from="1">
    <token skip="2" inflected="yes" regexp="yes">.*(adres|send|redakt|leg|ricev)i</token>
    <token inflected="yes">litero
      <exception scope="previous" regexp="yes">((mal)?(grand|et)aj?n)|(ĉin|japan)aj?n?</exception></token>
  </pattern>
  <message>Ĉu vi intencis <suggestion><match no="2" regexp_match="(.).(.*)" regexp_replace="$1e$2"/></suggestion> anstataŭ «\2»?</message>
  <example type="incorrect">Mi dissendis la <marker>literon</marker>.</example>
  <example type="correct">Mi dissendis la <marker>leteron</marker>.</example>
  <example type="correct">Mi ne povas legi etajn literojn.</example>
</rule>
Tiu regulo atentigas pri verŝajna konfuzo inter la vortoj «litero» kaj «letero» laŭ la kunteksto.

Ĉar en tiu regulo tute ne gravas, ĉu la unua vorto estas «sendi», aŭ «sendis», «sendos» (ktp.), pro tio la regulo kongruas kun la norma radiko de la vorto uzante inflected="yes" anstataŭ kun la vorto mem. Rimarku ankaŭ aliajn aferojn en tiu regulo:

  • Regula esprimo (.*(adres|send|redakt|leg|ricev)i) povas esti ankaŭ uzata por la vorto (dank’ al regexp="yes").
  • Inteligenta substituo en la mesaĝo eblas dank’ al <match …>. Tio ebligas la programon por bone korekti ŝanĝante «litero» en «letero», «literoj» en «leteroj», ktp.
  • Uzo de skip="2" signifas, ke povas esti inter 0 kaj 2 aliaj vortoj inter la verbo «adresi/sendi/redakti/legi/ricevi» kaj la vorto litero/literoj/literojn en la kontrolenda teksto.
  • Uzo de escepto en ŝablono: la regulo atentigas pri misuzo de la vorto «litero» apud la verbo sendi/skribi (ktp.) krom tiam, kiam la vorto ĝuste antaŭ la vorto «litero» estas io kiel «eta/ĉina/japana» (ktp.) Tiu escepto esta por eviti neverajn erarojn en frazo kiel «Mi ne povas legi etajn literojn.», kie la vorto «litero» sufiĉe verŝajnas sen esti erara. Kompreneble, estas heŭristiko ĉi tie. Plej verŝajne ekzistas frazoj, kie la programo atentigos pri ĝusta frazo. Tamen, estas sufiĉe neverŝajna, kaj oni povas aldoni pliajn esceptojn laŭ bezone por eviti neverajn erarojn.
Jen, kiel Lingvoilo atentigas en komanda linio pri tiu regulo:
$ echo "Mi ne ricevis vian literon." | java -jar languagetool/dist/LanguageTool.jar -c utf-8 -l eo -v
Expected text language: Esperanto
Working on STDIN...
259 rules activated for language Esperanto
<S> Mi[mi/R nak np]  ne[ne/_]  ricevis[ricevi/V tr is]  vian[via/A akz np]  literon[litero/O akz np].[</S>]<P/> 
1.) Line 1, column 20, Rule ID: LITERO_LETERO[1]
Message: Ĉu vi intencis 'leteron' anstataŭ «literon»?
Suggestion: leteron
Mi ne ricevis vian literon. 
                   ^^^^^^^  
Time: 72ms for 1 sentences (13.9 sentences/sec)
Eblas ankaŭ difini gramatikajn regulojn en Ĝavao anstataŭ XML, sed ĝis nun, la Esperanta kontrolilo ne bezonis tiajn regulojn.

Vi nun scias preskaŭ ĉion pri Lingvoilo. La metodo de Lingvoilo certe havas limojn, ĉar la programo ne vere analizas la gramatikan strukturon de la frazoj. Tamen, kun sufiĉe da erarŝablonoj, la programo certe fariĝas utila, sen troaj malveraj atentigoj.

Tags: ,

(3 komentoj | Afiŝu novan komenton)

junio 26-a, 2011
09:24 pm

[Ligilo]

Lingvoilo-1.4
eo Nova versio de la gramatika kontrolilo Lingvoilo-1.4 nun haveblas. La listo de ŝanĝoj legeblas tie.

fr Une nouvelle version du correcteur grammatical LanguageTool-1.4 est maintenant disponible. La liste des changements est disponible ici.

Tags:

(Afiŝu novan komenton)

junio 5-a, 2011
02:00 pm

[Ligilo]

Fukuŝima
Atoma energio, ne dankonMi iam estis favora al la atoma energio, ĉar mi taksis ĝin plu pura por la tutmonda varmiĝo ol aliaj fontoj de energio, krom kompreneble la renovigeblaj energioj kiel vento. Sed la eventoj en Fukiŝima (Japanio) igis min ŝanĝi opinion. Atoma energio tro danĝeras por la homaro. Jes tutmonda varmiĝo malbonas, sed tutmonda atoma poluado eĉ pli malbonas. Kaj danĝeros por multaj jaroj post akcidento. Duonvivo de Cezio-137 estas 30 jaroj. Tio estas, la kvanto de Cezio-137 duoniĝas post 30 jaroj. La Cezio-137 de Ĉernobil ankoraŭ malsanigas homojn kaj bestojn en Eŭropo post 25 jaroj, kaj daŭre faros tion dum la venontaj jarcentoj. Duonjaro de plutonio-239 estas 24000 jaroj. Plie, plutonio estas ege danĝera substanco por la homo, kaj malfacilas detekti ĝin. Ordinara radioaktivdetektilo ne detektas ĝin. Ni ne rajtas riski poluadon de tutmonda planedo por miloj da anoj. Estas krimo kontraŭ la tutmonda homaro. Fakte, ne vere eblas kalkuli tiujn riskojn. Certe la tertremoj okazas pli ofte en Japanio ol en Eŭropo, kie mi loĝas, sed estas ĉiam aliaj riskoj, kiel ekzemple milito, terorista saboto, aŭ simple homa eraro. Ĉar estas nun multaj atomcentraloj en la mondo, mi timas, ke aliaj gravaj akcidentoj okazos. La historio montras, ke jam okazis tro ofte. Krom la riskoj, estas ankaŭ neniu taŭga solvo por la ĉiam kreskantaj forĵetaĵoj de atoma energio. Alia problemo de atoma energio, estas ke la landoj kiuj produktas ĝin, povas poste ankaŭ produkti militan plutonion por militaj kialoj. Tio ne estas akceptebla. Militistoj, kiu ŝoke uzis Uranion (depleted Uranium) en Irako kaj verŝajne denove uzas ĝin en Libio, poluante por miliardoj da jaroj, certe ne fidindas. Ĉu estas pli granda krimo? La atoma industrio ankaŭ ne sufiĉe fidindas. La atoma industrio ĉiam trompis la homojn en ĉiuj akcidentoj kiel Three Miles Island, Ĉernobil kaj nun en Fukuŝima. La atoma industrio parolas pri la avantaĝoj de atoma energio (kaj verdire estas ja teorie avantaĝoj) sed forlasas la malavantaĝojn aŭ malgravigas ilin. La ĵurnalistoj ankaŭ ial misinformas, aŭ ne informas pri la realo de tiuj akcidentoj. Fakte, nuntempe, la ĵurnaloj preskaŭ ne plu parolas pri Fukuŝima malgraŭ la graveco de tiu evento. Mirigas min, ke piedpilko okupas pli da spaco ol Fukuŝima almenaŭ en la francaj ĵurnaloj. Bonŝance, eblas trovi informojn per Interreto por tiuj, kiuj serĉas. Mi rekomendas aŭskulti (angllingve) tion, kion diras spertuloj kiel Arnie Gunderson, Helen Caldicott kaj Conrad Miller. Ili havas plurajn interesajn videaĵojn. Franculo en Tokio ankaŭ faris multajn videaĵojn pri la situacio en Japanio. Li porolas kun forta ridetiganta franca akĉento, sed preterlasu tion: li bone diras tion, kio okazas en Japanio, kaj tion, kion li pensas. Por tiuj, kiuj scipovas la francan, mi rekomendas la intervjuon de Alain de Halleux.

Mi demandas min, kio estas la estonteco de Japanio nun kun 3 fundoj de reaktoroj. Kio estas la solvo por tio? Entombigo de la reaktoroj ne vere estas solvo, ĉar la poluadoj eniros la grundon, atingos la akvon en la grundo, migros for aliloke en lando, eniros la nutroĉenon, ktp. TEPCO anoncis, ke reaktoroj 1, 2 kaj 3 fondis. Reaktoro 3 enhavas MOX, tio estas ĝi enhavas grandan kvanton de plutonio, kiu estas tre danĝera. Estas eble la plej danĝera substanco, kiu ekzistas. Do estas tre grava evento, mi timas. Fakte, la aliaj reaktoroj ankaŭ enhavas plutonion (produktita en reaktoro), sed malpli ol reaktoro 3.

Ni devas lerni pro tio. La homaro devas uzi malpli da energio, sed malfacilos. Kiel konvinki ĉiujn? Jen utopio eĉ pli granda ol la fina venko. Ĝenas min ekzemple vidi butikojn kun lumoj en iliaj montrofenestroj eĉ vespere, kiam la butikoj estas jam delonge fermitaj. Eblus fari leĝon por igi tion kontraŭleĝa. Ĝenas min vidi restoraciojn kun eksteraj varmiloj por la klientoj kiuj decidas manĝi ekstere eĉ kiam la vetero malvarmas. En Francio, mi memoras legi ke oni varmigas gazonon de stadio de piedpilko, por ke ĝi ne glaciiĝu dum la vintro. Ĝenas min vidi reklamojn kun elektra afiŝilo. Ĉu ne eblas igi tion kontraŭleĝa? Ĝenas min vidi kiel multaj aĉetas novan poŝtelefonilon je pli malpli ĉiuj 2 jaroj, sen pensi, ke tiu freneza konsumado damaĝas la planedon, produktinte, uzante kaj finfine ĵetonte la efemeran produktaĵon. Ni ne vere bezonas novan poŝtelefonilon, nur pro tio, ke ĝi havas pli belan interfacon. La energio bezonas esti iel pli multekosta, por ke ni ekŝparu ĝin.

(Afiŝu novan komenton)

aprilo 17-a, 2011
08:27 am

[Ligilo]

Provi Lingvoilon sen instali ĝin
Eblas provi Lingvoilon (Esperantan gramatikan kontrolilon) rete, sen instali ĝin en via komputilo. Vi povas tajpi Esperantan tekston en la tekstkampo ĉe la suba parto de tiu paĝo. Tio faciligas uzi Lingvoilon por tiuj, kiuj timas aŭ tro pigras instali la programon.

Vi povas ekzemple provi ĝin tajpante erarajn frazojn de la listo de oftaj eraroj ĉe Lernu!. Bonvolu atentigi min se vi trovas erarajn frazojn, kiujn la programo ankoraŭ ne trovas.

Tags:

(Afiŝu novan komenton)

aprilo 2-a, 2011
11:54 am

[Ligilo]

Lingvoilo-1.3.1
Lingvoilo Ĉi-semajne haveblebliĝis versio-1.3.1 de la libera plurlingva gramatika kontrolilo Lingvoilo (LanguageTool) por OpenOffice/LibreOffice. Mi jam skribis pri Lingvoilo. Lingvoilo-1.3.1 alvenas kun novaj reguloj por rekono de pliaj eraroj kaj multaj riparoj de falsaj eraroj. Mi verdire pasigis pli da tempo por plibonigi la francan version de Lingvoilo ol la Esperantan version. La Esperanta Lingvoilo havas do malpli da plibonigoj ol la franca. La franca kontrolilo nun uzas pli freŝan vortaron de gramatikaj etikedoj (dicollecte-4.0.1). La etikedoj de vortoj ebligas Lingvoilon scii, ĉu franca vorto estas nomo, verbo, adjektivo (ktp) kaj ankaŭ ĉu vorto estas multnombra/ununombra, ina/malina vorto ktp. Dicollecte estas interesa projekto, kiu celas plibonigi liberan francan vortaron, ne nur por literumiloj sed ankaŭ por gramatikaj kontroliloj (dank' al la etikedoj de vortoj). La retejo de dicollecte estas tre bone kaj bele farita por ebligi iun ajn facile kontribui per aldonoj de novaj vortoj aŭ korektoj de etikedoj. Ĉiuj ŝanĝproponoj al la vortaro estas atenteme kontrolitaj fare de aliaj spertaj uzantoj kaj pridiskutitaj laŭbezone antaŭ ol eniri la vortaron. Uzante Lingvoilon en la franca, mi povis iom kontribui al dicollecte ĉefe kun korektoj de neĝustaj vort-etikedoj. Malkiel en la franca, en Esperanto eblas pli facile etikedi vortojn dank' al la regulaj vortfinaĵoj. Ĉu tiom facile? Nu estas kelkaj enfaliloj. Ĉiuj verboj kun la finaĵo -igi estas kompreneble transitivaj, ĉu ne? Nu, rigardu vi mem la transitivecon de verboj kiel intrigi, memmortiginavigi. Etikedo de verboj bezonas vortaron de transitivaj kaj netransitivaj verboj. La vortaroj (ReVo, PIV) ofte eĉ ne konsentas pri transitiveco de verboj.

Estas iom ironie, sed laborante pri la Esperanta kaj franca Lingvoilo, mi konsciis, ke pli facilas krei kontrolilon por malfacila lingvo kiel la franca ol por facila lingvo kiel Esperanto, almenaŭ per la metodo de Lingvoilo. La fleksebla vortordo en Esperanto ekzemple malfaciligas la taskon por kontrolilo.

Testante la Esperantan Lingvoilon, mi ja vidas iujn korektindajn falsajn erarojn. Mi ne tuj korektas ilin, ĉar ne ĉiam facilas. Ne tiom indas atentigi min pri falsaj eraroj ĉar mi vidas ilin. Sed mi esperas, ke la nuna nombro de falsaj eraroj ne troas. Pli indas sciigi min pri oftaj eraroj ankoraŭ ne trovataj per Lingvoilo.

Por tiuj, kiuj volas uzi la plej freŝan version el la deponejo (subversion), jen kiel fari tion per Ubuntu-o:

$ sudo apt-get install sun-java6-jdk ant subversion
$ svn co https://languagetool.svn.sourceforge.net/svnroot/languagetool/trunk/JLanguageTool languagetool
$ cd languagetool
$ ant
Post tio, Lingvoilo troviĝos en la dosierujo languagetool/dist.

Mi iom scivolas, pri kiom da uzantoj uzas Lingvoilon en Esperanto, kaj ĉu ili konsideras ĝin utila. Se vi uzas aŭ nur provis ĝin, ne hezitu komenti pri via sperto.

Tags:

(Afiŝu novan komenton)

januaro 30-a, 2011
09:31 am

[Ligilo]

Lingvoilo kaj Tatoeba
Mi daŭre plibonigas la liberan gramatikan kontrolilon Lingvoilo, ne nur en Esperanto, sed ankaŭ en la franca. Lingvoilo-1.2 ankoraŭ tro ofte atentigis pri neveraj eraroj. Iuj el la falsaj atentigoj facile korekteblas, sed aliaj atentigoj ne tiom facile korekteblas. Por testi la Esperantan version de Lingvoilo, mi uzas: Mi malkovris, ke eblas elŝuti la tutan frazaron de la projekto Tatoeba. Utilas ne nur por testi Lingvoilon, sed ankaŭ por korekti la frazojn ĉe Tatoeba pere de Lingvoilo. Jen kiel elŝuti kaj filtri frazojn por konservi nur la Esperantajn frazojn (tiujn kun la lingvokodo ISO 639-3 epo):
$ wget http://tatoeba.org/files/downloads/sentences.csv
$ perl -F'\t' -ane 'print "@F[2 .. $#F]" if ($F[1] eq "epo")' sentences.csv > sentences-epo.csv
Tiu frazaro enhavas pli ol 70.000 Esperantajn frazojn. Esperanto estas fakte la 3-a lingvo ĉe Tatoeba. Estas sufiĉe bona atingo por lingvo iom malpli parolata ol la angla.

Tags: ,

(Afiŝu novan komenton)

januaro 9-a, 2011
02:02 am

[Ligilo]

Lingvoilo-1.2 nun haveblas
Nova versio (1.2) de Lingvoilo (LanguageTool) alvenis antaŭ kelkaj tagoj (2010-01-02). LingvoIlo estas libera (LGPL) plurlingva gramatika kontrolilo, kiu funkcias per OpenOffice (LibreOffice) sed ankaŭ per komanda linio aŭ per la tekstoredektilo Vim. La freŝa versio LingvoIlo-1.2 estas la unua oficiala versio, kiu subtenas Esperanton. Mi scias, ke la Esperanta kontrolilo ne estas perfekta. Nu, ĝi ne estas perfekta ankaŭ en la aliaj lingvoj. Tamen espereble helpas por trovi erarojn. Mi jam trovis kaj korektis erarojn ĉe Vikipedio kaj Lernu uzante la programon. Gravas kompreni, ke LingvoIlo atentigas nur pri gramatikaj eraroj sed ne pri literumaj eraroj. Sed eblas instali LingvoIlon kune kun literuma kontrolilo por OpenOffice (aŭ por Vim) por atentigi pri ambaŭ tipoj de eraroj. Por uzi ĝin, oni devas:
  • Instali OpenOffice (vi verŝajne jam havas ĝin, ĉu ne?)
  • Elŝuti la kromaĵon LanguageTool-1.2 kaj instali ĝin. Por la uzantoj de Vindozo, la kromaĵo aŭtomate instaliĝos post elŝuto. Por la uzantoj de Linukso, instaleblas elektante « Iloj → Aldonaĵa mastrumilo… » el la ĉefa menuo de OpenOffice, poste alklaku la butonon « Aldoni… » kaj elektu la ĵus elŝutitan dosieron « LanguageTool-1.2.oxt ».
  • Por literumaj eraroj, necesas ankaŭ elŝuti Esperantan vortaron el la deponejo de vortaroj de OpenOffice. Eblas elŝuti kaj instali pli ol unu vortaron se vi volas kontroli tekstojn en pluraj lingvoj.
  • Endas tiam eliri el OpenOffice kaj restartigi ĝin.
Post instalado, vi preskaŭ pretas por kontroli tekston en OpenOffice. Gravas unue elekti la lingvon de la teksto per « Iloj → Lingvo » el la ĉefa menu de OpenOffice. Eblas elekti malsamajn lingvojn por diversaj partoj de la dokumento. La lingvo de la teksto aperas je la suba parto de la fenestro de OpenOffice (vidu ekranfoton). La lingvo de la teksto povas kompreneble esti malsama ol la lingvo de la interfaco de OpenOffice.

Vi finfine povos kontroli Esperantan tekston per « Iloj → LingvoIlo → Kontroli tekston ».

OpenOffice substrekas blue gramatikajn erarojn kaj ruĝe literumajn erarojn kiel ilustrite en la suba ekranfoto. Alklakante maldekstre sur blua substreko, LingvoIlo klarigos la eraron kaj sugestos (kiam eblas) korekton. En la ekzemplo de la ekranfoto, LingvoIlo indikus: Ĉu vi forgesis akuzativon post transitiva verbo «lernas»?

Ĝuu kaj ne plu forgesu la akuzativo.

Tags: ,

(1 komento | Afiŝu novan komenton)

[<< Previous 10 entries]

Mia TTT-ejo Funkciigita de LiveJournal.com