0zw8er6jsobr66ldc.jpeg

Deja de perder el tiempo importando manualmente varios archivos

Foto por ThisisEngineering RAEng en desempaquetar

En mi trabajo de científico de datos, regularmente tengo que importar varios archivos diferentes que contienen el mismo tipo de información debido a restricciones de exportación en diferentes software. Si se encuentra en una situación similar, a continuación encontrará una manera clara y sencilla de poder importar automáticamente sus archivos como marcos de datos individuales o combinarlos en un solo marco de datos.

Antes de comenzar con nuestro código, primero debemos preparar nuestros archivos. Necesitamos tener una forma de elegir mediante programación los archivos que queremos importar a R. Si bien puede elegir cualquier forma de distinguir estos archivos, estas son dos de las más sencillas:

  1. Cree un prefijo único en todos los archivos que desee importar a la vez.
  2. Cree una carpeta separada en su directorio de trabajo e incluya solo esos archivos en esa carpeta.

Por ejemplo, si tuviera un conjunto de archivos de Excel llamado «SA#.xlsx». Si no tenía otros archivos similares que comenzaran con SA, entonces ya tengo mi prefijo. Si hay otros archivos en mi carpeta que comienzan con SA, como “SAT.xlsx”, puedo crear fácilmente una carpeta y le llamaré “SA”. Luego, solo incluiré los archivos que quiero importar como SA en esa carpeta.

Una vez que tengamos una forma programática de identificar nuestros archivos, necesitamos crear una lista de todos los nombres de los archivos. Podemos usar la función R list.files() para lograr esto.

Lista de archivos con prefijo

Si elige agregar un prefijo a los nombres de sus archivos, usaremos el parámetro de patrón de list.files() para seleccionar los archivos específicos que queremos.

# Formula
filelist <- list.files(pattern = "^<prefix>")

#Example
filelist <- list.files(pattern = "^SA")

El patrón adopta una expresión regular. Por lo tanto, podemos usar el símbolo “^” para representar el comienzo de la cadena. Esto garantiza que cualquier otro nombre de archivo que incluya «SA» dentro del nombre pero no al principio no se incluirá en este conjunto de nombres. Nota: Esto solo extraerá archivos de su directorio de trabajo. Puedes cambiar el