[R-es] duda de tm para español

Jorge Luis Ojeda Cabrera jojeda en unizar.es
Mie Nov 17 17:39:15 CET 2010


Cuidado, ISO 639-2 es un código para determinar nombres de lenguajes.
Mira a ver en qué código tienes los ficheros de los documentos que 
quieres analizar (usa el comando file en un unix o linux). Posiblemente 
no sea el que admite tm por defecto. Hay comandos tm que permite fijar 
la codificación (encoding).

Saludos, Jorge.




El 17/11/10 11:45, Juan Antonio Gil Pascual escribió:
> Hola Manuel el juego de caracteres que indica el manual es un ISO 639-2
> pero no encuentro la forma de pasar el texto a este juego de caracteres.
> Además ignoro si con esto solucionaré el problema.
>
> Un saludo,
>
> Juan
>
> El 17/11/2010 10:36, r-uca escribió:
>> El mié, 17-11-2010 a las 10:31 +0100, Juan Antonio Gil Pascual escribió:
>>> Estimados compañeros estoy haciendo análisis de contenido y quería saber
>>> si alguno de vosotros habeís trabajado con el módulo tm y con textos en
>>> español porque a mi aunque en el corpus ponga spanish no coge ni acentos
>>> ni ñ y luego no puedo sacar los términos y su frecuencia.
>>>
>> Puede tener que ver con el juego de caracteres que estés usando para
>> entrar los textos. Mira la documentación del paquete al respecto.
>>
>> Saludos.
>>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es