Curso de Analítica Predictiva y Minería de Textos con RapidMiner y CRIPS-DM

El objetivo del curso es transmitir a los interesados las bases conceptuales y practicas (complementadas con casos de uso) de los procesos de Analitica Predictiva y Mineria de Textos utilizando la plataforma de Mineria de Datos RapidMiner y la metodologia CRISP-DM sobre datos estructurados y no estructurados.

El Análisis Predictivo o Minería de Datos, es el proceso de seleccionar, explorar, y modelar grandes volúmenes de datos que develen información previamente desconocida para beneficio del negocio. Dicho en otras palabras, es descubrir por medio de un proceso cíclico nuevas correlaciones, patrones y tendencias significativas, filtrando y depurando grandes volúmenes de datos, utilizando técnicas de reconocimiento de comportamiento, así como modelos matemáticos y estadísticos.

Descargue el silabo del curso:

El análisis predictivo permite mejorar el conocimiento del negocio tal como el comportamiento de los clientes, empleados, pacientes, estudiantes y ciudadanos. Los dominios de aplicación pueden estar en empresas comercializadoras, de producción, finanzas, energía, gobierno, etc.

De otro lado la minería de textos es el proceso para descubrir conocimiento almacenado en documentos (datos no estructurados). Comprende las siguientes actividades fundamentales: Clasificación de documentos para la asignación automática a clases pre-definidas; Agrupamiento de documentos para la identificación de documentos similares; Recuperación de información (similar a un buscador); Extracción de la información incluida en esos textos (hechos); y Extracción de asociaciones entre los hechos extraídos.

Un modelo predictivo se compone de un número de predictores, que son factores variables que pueden influir en el comportamiento o resultados futuros. En la comercialización, por ejemplo, el genero de un cliente, la edad, su ingreso medio y el historial de compras podrían predecir la probabilidad de una futura venta.

En modelos de predicción, se recopilan los datos para los indicadores relevantes, se formula un modelo estadístico, se hacen las predicciones  y se valida el modelo con los datos adicionales que estén disponibles. El modelo puede emplear una ecuación lineal simple, series de tiempo, arboles de decision, clustering  o una red neuronal compleja, trazada por software sofisticado.

Otras aplicaciones de los modelos de predicción incluyen adicionalmente al modelo de comercializacion anterior son:

  1. Gestión de relaciones con clientes (CRM)
  2. Planificación de capacidad
  3. Gestión del cambio
  4. Recuperación de desastres
  5. Gestión de la seguridad
  6. Aplicaciones de  ingeniería
  7. Meteorología
  8. Planificación de la ciudad.

*

Como se habia mencionado en los procesos de Prediccion es muy importante la herramienta de procesamiento que facilita la implementacion del modelo. RapidMiner es una herramienta de Minería de Datos ampliamente usada y probada a nivel internacional en aplicaciones empresariales, de gobierno y academia. Implementa más de 500 técnicas de pre-procesamiento de datos, modelación predictiva y descriptiva, métodos de prueba de modelos, visualización de datos, etc.

Rapid-i, con base en Dormunt – Alemania, nació en 2006 como Spin-Off de la Universidad de Dortmund, donde se inauguró la primera versión del software en 2001.

RapidMiner ha sido utilizada en más de cuarenta países y en compañías como Ford, Honda, E.ON, Nokia, IBM, Cisco, Hewlett Packard, Elexso, Akzo Nobel, PharmaDM, Bank of America, Merrill Lynch, entre muchas otras.

En la encuesta anual (2010) del prestigioso portal internacional de Minería de Datos KDnuggets (www.KDnuggets.com), RapidMiner obtuvo el primer lugar como la herramienta de Data Mining más utilizada (37.8%) en el mundo. El liderazgo de RapidMiner se ha mantenido en forma consistente y creciente desde el año 2007

 

De otro lado la metodologia de modelamiento CRISP-DM , de Cross Industry Standard Process for Data Mining.1 Se trata de un modelo de proceso de minería de datos que describe los enfoques comunes que utilizan los expertos en minería de datos. Encuestas realizadas en 2002, 2004 y 2007 muestran que es la principal metodología utilizada para esta tarea.

Fases principales

CRISP-DM divide el proceso de mineria de datos en seis fases principales.

  • Comprensión del negocio
  • Comprensión de Datos
  • Preparación de datos
  • Modelado
  • Evaluación
  • Despliegue

5 Comentarios

  1. Your style is unique compared to other people I’ve read stuff from.
    Thanks for posting when you have the opportunity, Guess I’ll just book
    mark this blog.

  2. Hello, nice topics I have a hot tub business and a recommendation letter for college group. we offer online editing services. we can edit any type of document for private college authors. Our company carefully read through your term paper and other documents, scouring for and removing each errors that ruin clarity of the genius of your labor. Our duty is simply helping you better your essay, and to provide you with talented editors in an simple and cost effective way. Ivy League Editors is a proof readers advantage concieved, and to give you experienced and intelligent editors at a low cost. After decades of being students, editors, and writers, we truely believe that gifted academics provide the highest quality of polishing. every of our company are graduates of elite Ivy League univeristies and are well-read in disciplines including English, philosophy, sociology, law, history and political science. All of our editors attended or attend an Ivy League or Ivy League-equivalent college and have vast experience editing papers in various disciplines and genres. look at my company site [url=https://southwestspas.com/at_home_collections/dream/]essential spa hot tub in San Tan Valley Arizona[/url]

  3. my friends from work and I have been dreaming about lately. The type of details on the repository is excellent and appreciated and will help my family and friends in our studies quite a bit. It seems like everyone gained a large amount of specifics about interesting topics and other pages and info also show it. I’m not typically on the web during the week however when I am bored im usually avidly searching for this kind of knowledge or things similarly concerning it. If someone gets a chance, take a look at my website. [url=https://elpasodisabilitylawyer.com/disclaimer/]short term disability attorney near me in san elizario, texas[/url]

  4. I’m really happy to have found the website, it’s exactly what my grage buddies are constantly looking for for. The specifics on the web page is truely enlightening and is going to assist my business partners quite a lot one of kind help. It looks like everone on the site extrapolates incredible amounts of info about subjects on the site and categories of topics and information definitely can be seen. I am not on the internet all day long and as we have some time I am most of the time collecting this kind of factual information and things closely similar. Always a good place to stop. If anyone needed a little helpful services like: [url=https://rgpalletracking.com/contact-us/]: We buy used Wire deck pallet racks or pallet racks for sale near me in East Los Angeles[/url]

Deja una respuesta

Tu dirección de correo electrónico no será publicada.