Big Data

Si bien el término Big Data está de moda y es frecuentemente mencionado en conferencias y publicaciones,  la verdadera naturaleza de esta nueva tecnología está poco difundida y en muchos casos es erróneamente interpretada. En este breve artículo trataremos de aclararla.     

Por Carlos Corzo Castañeda, Dirección General de Tecnologías Educativas

biga data destacada 2

Perspectiva Tecnológica
Algunas de las tendencias que se han venido observando en los últimos tiempos en relación con el empleo de las tecnologías de la información y comunicación en los diversos campos de la actividad humana son la ubicuidad, la convergencia, la Internet de las cosas, la computación en la nube y los medios sociales.

La ubicuidad, también llamada movilidad, consiste en que el usuario, independientemente del lugar donde se encuentre y de la hora del día, está conectado al sistema a través de redes inalámbricas de banda ancha.

La convergencia se refiere a la oferta de dispositivos portátiles que integran cada vez más funciones de cómputo y de comunicaciones, como los teléfonos inteligentes, en los que las llamadas han pasado a representar una parte pequeña de su utilización.

La Internet de las cosas consiste en la interacción a través de la Internet no sólo entre personas o entre personas y máquinas, sino también entre máquinas y máquinas, como sucede por ejemplo con las interacciones que se desencadenan cuando nos registramos para un vuelo a través de la página web de una línea aérea.

La computación en la nube es un nuevo paradigma de cómputo cuya principal característica es que los recursos informáticos como almacenamiento, capacidad de cómputo o uso de software se ofrecen ya no como productos que se instalan en las oficinas del usuario, sino como servicios que se distribuyen a través de la red.

Las redes sociales y otras modalidades de comunicación propias de la web 2.0, como las wikis o los blogs, han dado lugar a una nueva dinámica en las comunicaciones humanas. A través de estos medios cada persona tiene la oportunidad de crear, distribuir y recibir información y de desarrollar trabajo colaborativo en forma ilimitada.

Recientemente ha aparecido una nueva tendencia a la que se ha denominado Big Data, analítica de negocios o inteligencia competitiva.

¿Qué es Big Data?

big data destacada 1Big Data ha sido posible gracias a las tendencias antes mencionadas, y consiste en el aprovechamiento en una organización empresarial, académica o gubernamental de la ingente cantidad de información ahora disponible tanto internamente como en la web. El uso inteligente de este activo intangible presenta un enorme potencial para incrementar la competitividad, si se trata de una empresa, o para mejorar sustancialmente la calidad del servicio para el cual fue creada, en el caso de una organización gubernamental. El término Big Data, proveniente del idioma inglés, significa literalmente “grandes datos”.

Efectivamente, en Big Data se opera sobre grandes cantidades de datos. Sin embargo, Big Data presenta diferencias sustanciales con respecto a las técnicas de análisis de datos que ahora podríamos llamar tradicionales, conocidas como inteligencia de negocios. En Big Data la cantidad de información que se maneja es mucho mayor, es tanto interna como externa y no se limita a grandes bases de datos o a datawarehouses, ambas estructuradas y estáticas, sino que incluye una enorme y dinámica masa de información no estructurada extraída de las redes sociales y de información estructurada proveniente de otras fuentes, como sensores de la Internet de las cosas o sistemas de posicionamiento global GPS. Pero la mayor diferencia radica en los métodos que se emplean para el análisis: en la inteligencia de negocios tradicional se usan principalmente algoritmos deductivos, mientras que en Big Data se utilizan formas avanzadas de inteligencia artificial que, aplicando un enfoque inductivo, descubren y extraen valor intrínseco contenido en los datos.

Características de los proyectos de Big Data
En los proyectos tecnológicos tradicionales se persigue la obtención de un resultado predefinido en un plazo determinado y dentro del presupuesto asignado. Los responsables de ejecutarlos son generalmente especialistas en ciencias de la computación, expertos en rediseño de procesos o ingenieros de sistemas. Predominan los criterios técnicos.

En un proyecto de Big Data, en cambio, la tecnología sigue siendo necesaria pero pasa a segundo plano. El foco es ahora en la información, lo cual nos traslada a los dominios de la ciencia cognitiva y de la ciencia de los datos. El proyecto debe ser manejado como un experimento, planteándose preguntas que puedan ser respondidas mediante el análisis de los datos, formulándose hipótesis y construyéndose conocimiento mediante iteraciones. Como resultado se obtienen nuevas perspectivas del negocio y se provee a la gerencia valiosa información para la formulación de estrategias. Esto representa una revolución en el campo de la gestión, ya que ahora la evidencia aportada por la información desplaza parcialmente a la intuición como base para la toma de decisiones.

La ciencia cognitiva es el estudio científico de la mente y su funcionamiento, en el que se investiga sobre la conducta, la inteligencia y el proceso de cognición, poniéndose énfasis en cómo la información es representada, procesada y transformada por la mente humana, los animales o las máquinas. Es un campo interdisciplinario que se consolidó a comienzos del presente siglo a partir de aportes provenientes de la filosofía, la psicología, la lingüística, la inteligencia artificial, la neurociencia y la antropología.

La ciencia de los datos también se consolidó como disciplina independiente a inicios del siglo XXI, y consiste en la práctica de derivar perspectivas valiosas a partir de datos, es decir extraer significado de los datos y crear productos de datos, y se nutre de conceptos y técnicas provenientes de campos tan diversos como las matemáticas, la estadística, la ingeniería de datos, la inteligencia artificial, el modelamiento de la incertidumbre y la computación de alto rendimiento.

Estado del Arte y proyección futura
Debido a la complejidad de Big Data y a la cuantiosa inversión que se requiere para su implementación, por ahora su empleo está limitado a grandes organizaciones altamente tecnificadas. Por ejemplo, la empresa estadounidense UPS (United Parcel Service), que distribuye 14 millones de paquetes diarios en los más de 200 países en que opera, utiliza Big Data para la gestión en tiempo real de las rutas de sus vehículos.

Algunas grandes cadenas de supermercados han desarrollado aplicaciones de Big Data para monitorear en las redes sociales la conducta y preferencias de los consumidores y su percepción de los productos ofrecidos, con el fin de diseñar estrategias más eficaces de mercadotecnia.

En el sector industrial, Big Data se viene utilizando para detectar a tiempo problemas en el uso de productos recientemente lanzados y solucionarlos antes de que originen una ola de quejas y devoluciones.

Las instituciones financieras, por su parte, están aplicando Big Data para analizar las interacciones con sus clientes y clasificarlos en segmentos cada vez más pequeños y de esa manera darles un trato cada vez más personalizado.

Hasta aquí podemos apreciar que Big Data se está utilizando para potenciar con grandes ventajas aplicaciones que se venían realizando mediante el uso de la inteligencia de negocios tradicional (datawarehouse, data mining, procesamiento analítico en línea OLAP), aprovechándose, entre otros factores de reciente aparición, la disponibilidad de información en las redes sociales y en la Internet de las cosas, el acceso ubicuo a dicha información y los avances de la inteligencia artificial en temas como reconocimiento de patrones.

La creatividad humana, sin embargo, no tiene límites, y ya han empezado a surgir nuevas aplicaciones apoyadas en las posibilidades que Big Data ofrece. Por ejemplo, en el campo de la Medicina, hospitales de avanzada han desarrollado sistemas basados en Big Data que, explorando información proveniente de las historias clínicas y de otras fuentes, predicen qué pacientes dados de alta presentan proclividad a internarse nuevamente en los próximos meses. En esos casos el hospital efectúa acciones preventivas, evitándose incurrir en mayores gastos de hospitalización.

Es de esperarse que en los próximos años Big Data se aplique también al planeamiento y gestión de la educación y contribuya al logro de aprendizajes cada vez mejores y más pertinentes.

One thought on “Big Data

Agregue un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *

Usted puede utilizar las etiquetas HTML y atributos: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>