miércoles, 27 de julio de 2022

Acerca de los correctores de ortografía

 


Acerca de los correctores de ortografía


Todo empezó con la primera base de datos de palabras. A nadie le interesó que alguien almacenara las palabras más comunes de un idioma. La justificación de esa investigación fue averiguar la frecuencia con que aparecen en los textos. La inversión fue poca y alguien obtuvo su doctorado. El doctor publicó el código fuente como documentación de su tesis y alguien con iniciativa comercial pagó el desarrollo del primer diccionario digital.

El idioma fue el inglés. Decenas de proyectos paralelos acudieron al patriotismo de sus gobiernos y obtuvieron financiamiento para el desarrollo de diccionarios de los idiomas y dialectos locales. Cientos de expertos en computación ahora fungían como lingüistas sin el menor conocimiento, ni respeto, por mi área de conocimiento que es la etimología.

Hay mucha gente que ignora que de la misma manera que la genética puede definir biológicamente a alguien (sus orígenes y sus causas mas probables de muerte natural) la etimología de las palabras que usa la puede definir socialmente. Es decir que si dices “pan” en vez de “bread” ya sé un montón de cosas acerca de ti, y sé por donde han fluido los ríos de tu sangre. Mejor no te aburro con la larga historia de la palabra “pan”, que no tiene nada de divertido.

No quedó en el planeta una sola tribu que no tuviera las palabras que usaba más frecuentemente en una base de datos, que ahora incluía en el registro su significado.

El problema de que la demanda de diccionarios electrónicos de idiomas con menos de cien mil usuarios fuese casi nula no le importó mucho a los gerentes de producto de las diferentes empresas productoras de diccionarios digitales ya que la mercadeaban como “cobertura” y según ellos, era una ventaja competitiva.

Los procesos de especialización, y consolidación de la industria son conocidos, y en menos de cinco años solo había en el mercado tres diccionarios electrónicos y los tres alardeaban de tener cobertura global, es decir que tenían almacenados ya todas las palabras de todos los idiomas (vivos, moribundos, y muertos) y su significado.

Seguramente a alguien que tenía visión comercial se le ocurrió hacer que el procesador de palabras (así se llamaban los productos para hacer documentos) chequeara el contenido contra la base de datos del diccionario y resaltara las palabras que no había podido encontrar, ese es el origen del corrector de ortografía.

Es decir que si escribo algo que no está en el diccionario es muy probable que sea una palabra mal escrita, de todos modos es casi un estándar en la industria que también se dé la opción de añadir esta palabra al diccionario en el caso de que uno esté seguro que el error es del diccionario.

¿Qué pasa si quiero saber algo acerca de las palabras que empiezan con “ag” como cuáles y cuántas son, y con que frecuencia se usan? ¿O las que terminen en “ol” o las que incluyen “ci”? Este campo fue trabajado antes de las bases de datos y el término “expresiones regulares” se aplica a casi la totalidad de las técnicas que dan respuestas a esas preguntas, sin embargo es mucho más lento y complicado dar respuestas a esas preguntas una vez que las palabras estén almacenadas en una base de datos, a no ser que esta sea semántica.

Si un diccionario da ese tipo de respuestas y otro no, eso es una “ventaja competitiva o comparativa” que cualquier vendedor puede usar en contra de sus competidores.

He estado en presentaciones de vendedores de productos que no pueden responder este tipo de preguntas, y la que más me impresionó fue la que evadió responder y preguntó que si eso les parecía más importante que el precio, o que su producto incluyera ejemplos de casi todos los documentos legales y comerciales. Desafortunadamente perdió la licitación porque el comprador, que era encargado de sistemas de un bufete de abogados, escribe poesía en sus ratos libres.

De igual manera si un diccionario incluye los antónimos y sinónimos de las palabras, pobre del competidor que le toque tratar de convencer a sus clientes potenciales de que eso no es importante.

Entonces llegamos a la situación actual.

Estoy escribiendo un poema, y necesito algo que rime con corazón, y que preferiblemente sea impactante, pero no desgarrador. Entonces un corrector de ortografía común y corriente que ha analizado TODO el contenido de la web (poemas y libros de medicina incluidos) cree que es muy probable que yo quiera escribir “riñón”, así que me lo sugiere. Basta que escriba una letra que no sea “r” para que deje de sugerírmela, y si escribo la letra “a” muy probablemente me sugiera “amor”.

Ahora bien, si el corrector es muy bueno (como el que yo vendo, ver enlaces al final) ya me conoce y sabe que yo escribo poesía frecuentemente, y que hay un montón de letras de canciones en las que la palabra “traidor” sigue a la palabra “corazón” y sin perder tiempo la escribe y avanza un renglón hacia la próxima línea confiado en que como tiene también siete letras no me descuadró el texto.

Evidentemente no lo tomo como algo personal, porque sé un poco como funcionan los correctores, con quienes tengo problemas mas serios es con los bots, que además de el texto de las palabras almacenan su pronunciación. Ya no tienen la monótona entonación de antes y pueden hacer énfasis, cuando preguntan algo lo hacen como si de verdad tuvieran curiosidad.

Cuando una bot dentista, configurada según mis preferencias afectivas y sexuales.

(Que con su sonda me puede monitorear desde el nivel de glucosa en la sangre, hasta la temperatura corporal y el conteo de leucocitos, mientras espero que me atienda con mi traje con protección antivirus y manejo de desechos puesto en la recepción de su consultorio en la realidad virtual sintética mejorada)

Me pregunta con curiosidad ¿Cómo estás? No sé si está fingiendo o es cortesía real, y si consideramos que conoce mejor que yo mi situación financiera, legal, social, y hasta emocional, no me queda más remedio que responderle: Dime tú mi amor. Y si me llega a sugerir algo, lo acato como una orden.

Volviendo al tema de los correctores, abajo comparto la traducción automática, sin retoques, de un falso texto taoísta de la dinastía Tang con el que me estafaron hace tiempo, debo tenerle algo de cariño porque de vez en cuando lo releo.


Madre del tiempo

Madre de los mil seres

Madre del agua


Eres lo que es

Madre de las estrellas

El sol tu hijo


Eres los ríos

El huracán y la paz

Agua de la mar


Li Tao Po

VABM 25/Jul/2022

https://riistas.wordpress.com/2022/07/27/acerca-de-los-correctores-de-ortografia/

https://riistas.files.wordpress.com/2022/07/acercadeloscorrectoresdeortografc3ada.pdf


La Lástima de los Bots

https://www.amazon.com/dp/B0B9HH58R4


Este texto continúa la saga del:

Tratado de las buenas costumbres y virtudes de los marcianos

Tienda en Amazon

https://www.amazon.com/~/e/B00EZC7SRM/

Libro en Amazon

Español

https://www.amazon.com/dp/B09Z6M9Y6L

Borrador para l@s panas

https://riistas.files.wordpress.com/2022/04/tratadodelabuenascostumbresyvirtudesdelosmarcianos-24.pdf

Spanglish

https://www.amazon.com/dp/B09ZGZFMZM

Draft for the friends

https://riistas.files.wordpress.com/2022/05/draftforthefriendstreatyofthegoodcustomsandvirtuesofthemartians.pdf

En Google

https://books.google.com/books/about/Tratado_de_las_buenas_costumbres_y_virtu.html?id=G29tEAAAQBAJ#v=onepage&q&f=false


No hay comentarios:

Publicar un comentario