Curso practico de ciencia de datos/Fundamentos de ciencia de datos

    1. Fundamentos de la ciencia de datos.

Definición de ciencia de datos editar

Primero definamos la ciencia de datos como la recopilación de datos su análisis y la toma de decisiones.

La ciencia de datos aplica varias diciplinas como las estadística, análisis de datos y aprendizaje de maquina con el objetivo analizar datos y extraer conocimientos de los mismos.

Se trata pues de buscar patrones en los datos analizándolas y hacer con estos resultados predicciones.

Tenemos multiples aplicaciones de la ciencia de datos:

  • Mejora en la toma de decisiones
  • Predecir análisis, que sucede a continuación
  • Descubrimiento de patrones, se encuentra información escondida en los datos

A donde se necesita la ciencia de datos: editar

La ciencia de datos es usada en mucha industrias en el mundo hoy, como en la banca, consultoria, salud y manufactura.

Para planear rutas, para anticipar retrasos en el vuelo, nave, trenes, usando análisis predictivo, para crear ofertas promocionales, para encontrar el mejor momento para enviar los vienes, para anticipar la ganancia de una compañía, para analisar los beneficios de cualquier acción, para predecir quien ganara una elección la ciencia de datos se puede aplicar casi a cualquier parte donde existen datos, algunos ejemplos: Consumibles, bolsa de valores, industria, política, logística, comercio electronica

Como se hace la ciencia de datos? editar

Un científico de datos requeiere experiencia en los siguientes campos:

  • Aprendizaje de maquina
  • Estadísticas
  • Programacion Python o r
  • Matematicas
  • Bases de datos

Un científico de datos puede encontrar patrones dentro de los datos, pero antes ella o el tienen que organizar los datos en un formato standar.

Formular las preguntas correctas, para entender el problema. Exploramos y coleccionamos los datos, de la base de datos, las bitácoras de la web, la retroalimentación del cliente. Extraemos los datos, transformamos los datos a un formato estándar. Limpieza de datos, se remueven valores erróneos Buscamos y remplazamos los valores faltantes, checamos

Buscar y remplazar valores faltantes, por ejemplo un promedio Normalizar datos, ajustar los valores a un rango usable (cuidado con las escalas, metros o cm por ejemplo) Analizar datos, encontrar patrones y hacer predicciones. Representar el resultado, de forma fácilmente entendibles.

Para empezar presentaremos que son los datos y como pueden ser analisados.

Aprenderemos a usar las estadísticas y las funciones matemáticas para hacer predicciones.