[R-es] procesamiento de textos con R

javier.ruben.marcuzzi en gmail.com javier.ruben.marcuzzi en gmail.com
Mar Jul 7 18:55:56 CEST 2015


Estimados


Yo no se mucho sobre procesamiento de textos, intenté algunas cosas con R, textmining y algunas cosas por el estilo, mi prioridad es el tratado de patologías (por mi profesión). Lo que opté, y hace años que estoy trabajando en eso, aunque es muy pero muy duro, es escribir yo mismo un patrón, este tiene posibilidades, y luego “comparar” lo escrito a mi patrón. Pero no lo pienso en Español, mi razonamiento es en base de datos, donde escribo en varios lenguajes, por ejemplo, latín cor, corazón español, por lo que una patología cardíaca tendría una de estas palabras, pero si en nuestro idioma tenemos tantas palabras y formas para la mismo, el latín tampoco nos salva, el inglés podría ser más específico pero también tiene actualización de términos.


Yo pienso que la interpretación del lenguaje depende mucho del algoritmo, pero cualquier algoritmo sin una base de datos donde pueda consultar patrones de palabras, es trabajo que no da frutos, en cambio una buena cantidad de excepciones y definiciones, posiblemente se aproxima a como trabaja nuestro celebro, no quiero decir que las redes neuronales son el mejor algoritmo, porque hay alternativas, pero sin dudas un aprendizaje estadístico es necesario (no se si estadísticamente uso bien el lenguaje, como aprendizaje pensé en por ejemplo cadenas de Monte Carlos, Gibbs, esas técnicas donde es mejor colocar unos puntos para comenzar). 






Javier Rubén Marcuzzi
Técnico en Industrias Lácteas
Veterinario





De: Carlos J. Gil Bellosta
Enviado el: ‎martes‎, ‎07‎ de ‎julio‎ de ‎2015 ‎11‎:‎22‎ ‎a.m.
Para: MªLuz Morales
CC: R-help-es en r-project.org





Hola, ¿qué tal?

Lo del "grupo de interés temático" de procesamiento del lenguaje
natural en español fue una iniciativa de la Comunidad R Hispano para
tratar de juntar a los interesados en el asunto para que se conociesen
y pudiesen trabajar juntos. Jamás despegó.

La idea era que, igual que existen grupos locales (gente que trabaja
en R en distintos temas y que se juntan periodicamente) podía haber
grupos temáticos (gente que trabaja en un mismo tema pero que no están
físicamente próximos). Hay dos temas interesantes para la comunidad de
usuarios de R en España:

1) Herramientas para el lenguaje. Para el inglés ya hay muchas cosas
hechas. El español es una lengua distinta y gran parte de lo existente
para el inglés no es, en absoluto, trasladable.
2) Mapas.

Insisto: ambas iniciativas están paradas desde hace años.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com




El día 7 de julio de 2015, 12:47, MªLuz Morales <mlzmrls en gmail.com> escribió:
> Hola,
> en relación al procesamiento de textos he visto que hay  en r hispano un
> Grupo de interés temático en procesamiento del lenguaje natural con R
> (GITPLN), que está enfocado al procesamiento de textos en español. Es
> bastante interesante, me gustaría saber si se está utilizando actualmente.
>
> Gracias
> Un saludo
>
> El 7 de julio de 2015, 11:14, MªLuz Morales <mlzmrls en gmail.com> escribió:
>
>> Buenos días,
>>
>> quisiera saber si existe algún paquete en R para procesamiento de texto,
>> búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he
>> encontrado nada al respecto.
>>
>> Gracias
>> Un saludo
>>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es