Cervantes ciencias vol. 116 p. 2

      No hay comentarios en Cervantes ciencias vol. 116 p. 2
image.png





image.png

La minería de datos es el estudio de la recopilación, la limpieza, el procesamiento, el análisis y la obtención de información útil a partir de los datos. Existe una amplia variación en cuanto a los dominios de los problemas, las aplicaciones, las formulaciones y las representaciones de los datos que se encuentran en las aplicaciones reales. Por lo tanto, minería de datos es un término general que se utiliza para describir estos diferentes aspectos del procesamiento de datos.



image.png

El número de documentos en la Web indexada es ahora del orden de miles de millones, y la Web invisible es mucho mayor. Los accesos de los usuarios a estos documentos crean registros de acceso a la Web en los servidores y perfiles de comportamiento de los clientes en los sitios comerciales. Además, la estructura enlazada de la Web se denomina gráfico de la Web, que es en sí mismo un tipo de datos. Estos diferentes tipos de datos son útiles en diversas aplicaciones. Por ejemplo, los registros de acceso de los usuarios pueden ser minados para determinar patrones frecuentes de accesos o patrones inusuales de comportamiento posiblemente injustificado.


image.png

Las transacciones más comunes de la vida cotidiana, como el uso de una tarjeta de cajero automático (ATM) o de una tarjeta de crédito, pueden crear datos de forma automatizada. Dichas transacciones pueden extraerse en busca de muchos datos útiles, como fraudes u otras actividades inusuales.


image.png

Muchas formas de interacción de los usuarios crean grandes volúmenes de datos. Por ejemplo, el uso de un teléfono suele crear un registro en la compañía de telecomunicaciones con detalles sobre la duración y el destino de la llamada. Muchas compañías telefónicas analizan habitualmente estos datos para determinar patrones de comportamiento relevantes que pueden utilizarse para tomar decisiones sobre la capacidad de la red, las promociones, los precios o la orientación de los clientes.


image.png

Una tendencia reciente es el desarrollo de sensores portátiles de bajo costo, teléfonos inteligentes y otros dispositivos inteligentes que pueden comunicarse entre sí. Según una estimación, el número de estos dispositivos superó el número de personas en el planeta en el 2008. Las implicaciones de esta recogida masiva de datos son importantes para los algoritmos de minería.


image.png

Aquí es donde entra la tarea de la minería de datos. Los datos en bruto pueden ser arbitrarios, no estar estructurados o incluso tener un formato que no sea inmediatamente adecuado para el procesamiento automatizado. Por ejemplo, los datos recogidos manualmente pueden provenir de fuentes heterogéneas en diferentes formatos y, sin embargo, necesitan ser procesados de algún modo por un programa informático automatizado para obtener información.


Para resolver este problema, los analistas de minería de datos utilizan una cadena de procesamiento, en la que los datos brutos se recogen, se limpian y se transforman en un formato estandarizado. Los datos pueden almacenarse en un sistema de base de datos comercial y, por último, se procesan para obtener información con el uso de métodos analíticos.

La próxima semana continuaremos con esta información. Para Cervantes Ciencias escribe @abdulmath.



Nuestra cuenta @cervanteshive está bastante activa en la red social de este pajarito. Te invitamos a mantenerte informado sobre nuestra colmena Hive y el mundo de las criptos. ¡Únete y participa!


Pie de página Cervantes.png

Deja una respuesta

Tu dirección de correo electrónico no será publicada.