Las listas de direcciones se suelen administrar con Excel. Y las listas de direcciones a menudo contienen direcciones duplicadas:
Para eliminar estas direcciones duplicadas en Excel cómodamente y sin mucho esfuerzo, lo mejor que puede hacer es:
- Si previamente no lo ha hecho, descargue DedupeWizard gratuitamente desde aquí. Instale el programa y solicite una activación de prueba. Ahora podrá trabajar con el programa durante una semana sin restricciones.
- Inicie DedupeWizard y ejecute la función «Deduplicación en una tabla»:
- Seleccione «Dirección postal» como criterio para la búsqueda de duplicados y luego haga clic en «Siguiente»:
- En el siguiente paso, seleccione el archivo de Excel que se procesará:
- A continuación, se le reenvía a un cuadro de diálogo con el que se especifica al programa en qué columnas de la tabla Excel se encuentra qué información. El programa ya habrá realizado esta tarea para nosotros en la medida de lo posible utilizando los títulos de las columnas. Por ejemplo, la columna «Street» en nuestra tabla contiene la calle:
- En el siguiente diálogo podemos especificar al programa qué componentes de la dirección se deben comparar, generalmente todos. Y podemos especificar cómo de grande debe ser el factor de coincidencia calculado entre dos direcciones para que aparezcan en el resultado. En nuestro ejemplo, el factor de coincidencia usa un umbral del «70 %»:
- Después de otro clic en «Siguiente», los datos se procesarán. Tras un momento, el programa presenta un resumen del resultado:
- Posteriormente, se nos dirige a una vista del resultado de deduplicación en forma de tabla. Ahí aún podemos realizar cambios en el resultado eliminando la cruz roja de la columna «eliminar» o transfiriéndola a otra dirección en el grupo:
- Una vez que estemos satisfechos con el resultado, podemos emitir o procesar el resultado en el último paso de acuerdo con nuestras necesidades. Además de un protocolo de datos borrados (que se puede imprimir), las direcciones duplicadas se pueden eliminar directamente en la tabla fuente o guardar los datos eliminados en un nuevo archivo:
DataQualityTools proporciona más posibilidades para procesar el resultado que DedupeWizard. Entre otras cosas, los aciertos se pueden marcar ahí. O, según el resultado de la comparación, los datos se pueden transferir de un registro del grupo duplicado al otro para completarlo. Puede encontrar una descripción completa aquí.